Formation au logiciel SIMCA

Maîtriser les possibilités du logiciel Simca dans la gestion, la manipulation et la pratique des méthodes statistiques multivariées dont l’analyse en composantes principales (ACP), les régressions PLS et OPLS et l’analyse discriminante PLS. L’objectif de cette formation est de montrer comment convertir de larges volumes de données en modèles robustes et fiables pouvant être aisément interprétés.

  • Référence : FOR-SIMCA
  • Durée : 3 jours, soit 21 heures en présentiel
  • Tarif : 1950 € ht pour 1 inscrit, -10% par inscrit si 2 inscrits d’une même société, -15% par inscrit si 3 inscrits ou plus d’une même société
  • Lieu : sur notre site (inter-entreprises) ou sur votre site (intra-entreprise)
  • Prochaines dates : 11, 12, 13 septembre 2019 – 27, 28, 29 novembre 2019
  • Public concerné : toute personne désirant comprendre, analyser et modéliser de larges volumes de données
  • Population visée : techniciens, ingénieurs, chercheurs
  • Pré-requis : connaissances des statistiques de base
  • Méthodes et moyens : explications théoriques suivies d’applications pratiques
  • Méthodes d’évaluation des acquis : exercices réguliers en cours de formation
  • Profil formateur : spécialiste des méthodes d’analyse de données multivariées en charge du support technique du logiciel SIMCA
  • Support stagiaire : support de cours papier et fichiers des exercices

Présentation du logiciel Simca

Les rubans disponibles selon l’étape d’avancement du projet :

SIMCA Import

Project Window

Model Window

Les étapes du déroulement d’une étude avec Simca

Démarrage du projet

Importation des données

Mise en forme des données

Gestion des valeurs manquantes

Visualisation, étude préliminaire des données

Détection des valeurs aberrantes

Choix des données à utiliser dans l’analyse

Définition d’un ‘Workset’, transformations des données

Filtres disponibles dans Simca

Construction de graphiques dans Simca

Ajustement d’un modèle

Analyse des données et interprétation des résultats : les indicateurs de la qualité
du modèle disponibles dans Simca

Visualisation des scores et loadings

Utilisation des modèles établis pour de la prévision

NIPALS (Non Linear Iterative Partial Least Squares)

Analyse en composantes principales (ACP) basée sur un mode de calcul qui permet d’utiliser toutes les données disponibles dans un tableau observations x variables présentant des valeurs manquantes et non pas seulement les cas complets comme les méthodes classiques. Le nombre de composantes significatives à retenir est déterminé par validation croisée. Les observations atypiques sont repérées grâce à des tests et une carte de contrôle.

Régression PLS1

Méthode robuste de modélisation d’un tableau comportant une variable à prédire Y en fonction d’un tableau de variables prédictives X basée sur un algorithme dérivé de NIPALS qui consiste à :

Rechercher des composantes orthogonales (structures latentes) de X, à la fois les plus descriptives possible de X et les plus explicatives possible de Y

Effectuer la régression de Y sur ces composantes

Exprimer les coefficients de la régression en fonction des variables prédictives elles-mêmes

Choisir le nombre de composantes significatives par validation croisée

Gérer les valeurs manquantes

Méthodes de filtrage des données

OSC (Orthogonal Signal Correction)

OPLS, O2PLS (Orthogonal PLS)

Régression PLS2

Méthode robuste de modélisation d’un tableau comportant plusieurs variables à prédire Y en fonction d’un tableau de variables prédictives X basée sur un algorithme dérivé de
NIPALS

Analyse discriminante PLS

Extension de la régression PLS au cas où le tableau des variables à prédire Y est constitué des indicatrices binaires des modalités d’une variable qualitative

Méthode SIMCA (Soft Independent Modelling of Class Analogy)

Cette alternative originale à l’analyse discriminante permet, après avoir caractérisé des
classes prédéfinies d’observations en fonction d’un ensemble de variables descriptives,
de prévoir la probabilité d’appartenance à chaque classe de nouvelles observations décrites par le même ensemble de variables. La phase de caractérisation consiste à réaliser une ACP de chaque classe en utilisant l’algorithme NIPALS. La phase  prédictive consiste à calculer la distance entre chaque observation nouvelle et
le modèle d’ACP de chaque classe, et d’estimer la probabilité correspondante. Cette
méthode permet de repérer des observations qui n’appartiennent à aucune des classes
prédéfinies.

Print Friendly, PDF & Email