Maîtriser les fonctionnalités du logiciel SIMCA pour la gestion, la manipulation et la pratique des méthodes statistiques multivariées dont l’analyse en composantes principales (ACP), la méthode NIPALS, les régressions PLS1, PLS2, OPLS, O2PLS, l’analyse discriminante PLS et la méthode SIMCA. L’objectif de cette formation est de montrer comment convertir de larges volumes de données en modèles robustes et fiables pouvant être aisément interprétés.
Formation au logiciel SIMCA
- Référence : FOR-SIMCA
- Durée : 3 jours, soit 21 heures en présentiel
- Tarif : 1800 € ht par inscrit
- Lieu : sur notre site (inter-entreprises) ou sur votre site (intra-entreprise)
- Prochaines dates : nous contacter
- Public concerné : toute personne désirant comprendre, analyser et modéliser de larges volumes de données
- Population visée : techniciens, ingénieurs, chercheurs
- Pré-requis : connaissances des statistiques de base
- Méthodes et moyens : explications théoriques suivies d’applications pratiques
- Méthodes d’évaluation des acquis : exercices réguliers en cours de formation
- Profil formateur : spécialiste des méthodes d’analyse de données multivariées en charge du support technique du logiciel SIMCA
- Support stagiaire : support de cours papier et fichiers des exercices
Présentation du logiciel SIMCA
Description des rubans disponibles selon l’avancement du projet :
File, Home, Data, Analyze, Predict, View, Tools
Les étapes du déroulement d’une étude avec SIMCA
Choix du type de projet : Regular, Batch, Spectroscopy, Omics
Démarrage du projet
Importation des données et création du ‘Dataset’
Mise en forme des données
Gestion des valeurs manquantes
Visualisation, étude préliminaire des données
Détection des valeurs aberrantes
Choix des données à utiliser dans l’analyse
Définition du ‘Workset’
Transformations des données
Filtres disponibles dans SIMCA
Construction de graphiques dans SIMCA
Ajustement d’un modèle
Analyse des données et interprétation des résultats : les indicateurs de la qualité du modèle disponibles dans SIMCA
Visualisation des scores et loadings
Utilisation des modèles établis pour de la prévision
NIPALS (Non Linear Iterative Partial Least Squares)
Analyse en composantes principales (ACP) basée sur un mode de calcul qui permet d’utiliser toutes les données disponibles dans un tableau observations x variables présentant des valeurs manquantes et non pas seulement les cas complets comme les méthodes classiques. Le nombre de composantes significatives à retenir est déterminé par validation croisée. Les observations atypiques sont repérées grâce à des tests et une carte de contrôle.
Régression PLS1
Méthode robuste de modélisation d’un tableau comportant une variable à prédire Y en fonction d’un tableau de variables prédictives X basée sur un algorithme dérivé de NIPALS qui consiste à :
Rechercher des composantes orthogonales (structures latentes) de X, à la fois les plus descriptives possible de X et les plus explicatives possible de Y
Effectuer la régression de Y sur ces composantes
Exprimer les coefficients de la régression en fonction des variables prédictives elles-mêmes
Choisir le nombre de composantes significatives par validation croisée
Gérer les valeurs manquantes
Méthodes de filtrage des données
OSC (Orthogonal Signal Correction)
OPLS, O2PLS (Orthogonal PLS)
Régression PLS2
Méthode robuste de modélisation d’un tableau comportant plusieurs variables à prédire Y en fonction d’un tableau de variables prédictives X basée sur un algorithme dérivé de
NIPALS
Analyse discriminante PLS
Extension de la régression PLS au cas où le tableau des variables à prédire Y est constitué des indicatrices binaires des modalités d’une variable qualitative
Méthode SIMCA (Soft Independent Modelling of Class Analogy)
Cette alternative originale à l’analyse discriminante permet, après avoir caractérisé des classes prédéfinies d’observations en fonction d’un ensemble de variables descriptives, de prévoir la probabilité d’appartenance à chaque classe de nouvelles observations décrites par le même ensemble de variables. La phase de caractérisation consiste à réaliser une ACP de chaque classe en utilisant l’algorithme NIPALS. La phase prédictive consiste à calculer la distance entre chaque observation nouvelle et le modèle d’ACP de chaque classe, et d’estimer la probabilité correspondante. Cette méthode permet de repérer des observations qui n’appartiennent à aucune des classes prédéfinies.