Techniques d'échantillonnages
Les plans d’expériences sont généralement mis en oeuvre pour collecter de nouvelles données provenant d’un processus. Dans de nombreux cas, des données en quantités suffisantes ont déjà été recueillies sur de longues périodes de temps mais il y a tellement de données que l’analyse est tout simplement non réalisable. Par exemple, la surveillance de l’état des capteurs sur des composants en service peut capturer des données en continu pendant toute la durée de vie du composant. Les outils d’échantillonnage de données de SmartUQ peuvent sélectionner les données pour élaborer un plan d’expériences remplissant l’espace (space filling design) constitué de sous-ensembles de l’ensemble complet des données. Contrairement aux plans d’expériences qui sont définis avant la collecte de données, l’échantillonnage de données comme le sous-échantillonnage et l’échantillonnage par tranches prennent des paires de données d’entrées-sorties existantes et sélectionnent les points qui représenteront bien l’espace de conception.
Algorithmes de sous-échantillonnage
Les algorithmes de sous-échantillonnage échantillonnent un nombre de points spécifié par l’utilisateur dans un grand ensemble de données existant pour représenter de manière adéquate l’ensemble de données d’origine. Contrairement à la division arbitraire d’un ensemble de données, l’outil de sous-échantillonnage sélectionne les points qui définissent un plan d’expériences remplissant l’espace (space filling design), et réduit ainsi le biais potentiel dans l’ensemble de données sous-échantillonné. En n’utilisant qu’un sous-ensemble des données initiales, la charge de calcul est considérablement réduite, tandis que la possibilité d’effectuer avec précision des analyses avancées est maintenue grâce au processus de sélection intelligent. Le sous-ensemble des données non sélectionnées peut être utilisé pour effectuer la validation du modèle, économisant ainsi les ressources de simulation et de test tout en restant confiant dans la précision des prévisions.
Algorithmes d’échantillonnage par tranches
Les algorithmes d’échantillonnage par tranches découpent l’ensemble de données en groupes. L’ensemble initial des données n’est pas supposé être un plan remplissant l’espace (space filling design). Chaque tranche utilisée pour l’apprentissage a son propre émulateur, puis tous les émulateurs sont combinés en un seul émulateur pour obtenir les résultats finaux. Cela permet un calcul parallèle et réduit les besoins en mémoire nécessaires pour effectuer des analyses avancées de grands ensembles de données.
