Formation SIMCA - FRANCESTAT

Formation au logiciel SIMCA

Maîtriser les fonctionnalités du logiciel SIMCA pour la gestion, la manipulation et la pratique des méthodes statistiques multivariées dont l’analyse en composantes principales (ACP), la méthode NIPALS, les régressions PLS1, PLS2, OPLS, O2PLS, l’analyse discriminante PLS et la méthode SIMCA. L’objectif de cette formation est de montrer comment convertir de larges volumes de données en modèles robustes et fiables pouvant être aisément interprétés.

Référence : FOR-SIMCA
Durée : 3 jours, soit 21 heures en présentiel
Tarif : 1950 € ht par inscrit (repas inclus)
Lieu : sur notre site (inter-entreprises) ou sur votre site (intra-entreprise)
Prochaines dates : nous contacter
Public concerné : toute personne désirant comprendre, analyser et modéliser de larges volumes de données
Population visée : techniciens, ingénieurs, chercheurs
Pré-requis : connaissances des statistiques de base
Méthodes et moyens : explications théoriques suivies d’applications pratiques
Méthodes d’évaluation des acquis : exercices réguliers en cours de formation
Profil formateur : spécialiste des méthodes d’analyse de données multivariées en charge du support technique du logiciel SIMCA
Support stagiaire : support de cours papier et fichiers des exercices

Présentation du logiciel SIMCA

Description des rubans disponibles selon l’avancement du projet :

File, Home, Data, Analyze, Predict, View, Tools

Les étapes du déroulement d’une étude avec SIMCA

Choix du type de projet : Regular, Batch, Spectroscopy, Omics

Démarrage du projet

Importation des données et création du ‘Dataset’

Mise en forme des données

Gestion des valeurs manquantes

Visualisation, étude préliminaire des données

Détection des valeurs aberrantes

Choix des données à utiliser dans l’analyse

Définition du ‘Workset’

Transformations des données

Filtres disponibles dans SIMCA

Construction de graphiques dans SIMCA

Ajustement d’un modèle

Analyse des données et interprétation des résultats : les indicateurs de la qualité du modèle disponibles dans SIMCA

Visualisation des scores et loadings

Utilisation des modèles établis pour de la prévision

NIPALS (Non Linear Iterative Partial Least Squares)

Analyse en composantes principales (ACP) basée sur un mode de calcul qui permet d’utiliser toutes les données disponibles dans un tableau observations x variables présentant des valeurs manquantes et non pas seulement les cas complets comme les méthodes classiques. Le nombre de composantes significatives à retenir est déterminé par validation croisée. Les observations atypiques sont repérées grâce à des tests et une carte de contrôle.

Régression PLS1

Méthode robuste de modélisation d’un tableau comportant une variable à prédire Y en fonction d’un tableau de variables prédictives X basée sur un algorithme dérivé de NIPALS qui consiste à :

Rechercher des composantes orthogonales (structures latentes) de X, à la fois les plus descriptives possible de X et les plus explicatives possible de Y

Effectuer la régression de Y sur ces composantes

Exprimer les coefficients de la régression en fonction des variables prédictives elles-mêmes

Choisir le nombre de composantes significatives par validation croisée

Gérer les valeurs manquantes

Méthodes de filtrage des données

OSC (Orthogonal Signal Correction)

OPLS, O2PLS (Orthogonal PLS)

Régression PLS2

Méthode robuste de modélisation d’un tableau comportant plusieurs variables à prédire Y en fonction d’un tableau de variables prédictives X basée sur un algorithme dérivé de
NIPALS

Analyse discriminante PLS

Extension de la régression PLS au cas où le tableau des variables à prédire Y est constitué des indicatrices binaires des modalités d’une variable qualitative

Méthode SIMCA (Soft Independent Modelling of Class Analogy)

Cette alternative originale à l’analyse discriminante permet, après avoir caractérisé des classes prédéfinies d’observations en fonction d’un ensemble de variables descriptives, de prévoir la probabilité d’appartenance à chaque classe de nouvelles observations décrites par le même ensemble de variables. La phase de caractérisation consiste à réaliser une ACP de chaque classe en utilisant l’algorithme NIPALS. La phase prédictive consiste à calculer la distance entre chaque observation nouvelle et le modèle d’ACP de chaque classe, et d’estimer la probabilité correspondante. Cette méthode permet de repérer des observations qui n’appartiennent à aucune des classes prédéfinies.