UNIWIN - Analyse Discriminante Bayésienne

L’Analyse Discriminante Bayésienne (ADB) permet de construire à partir d’un ensemble de variables quantitatives et d’une variable qualitative découpant la population en plusieurs classes (2 ou plus), des fonctions discriminantes qui définissent une règle de décision optimale à partir de laquelle on peut affecter des individus de validation et de prévision aux différentes classes.

Cette technique suppose que l’on connaisse a priori les probabilités d’appartenance aux différentes classes et que les données suivent une loi multi-normale.

La méthode proposée permet de traiter les cas linéaire (égalité des matrices de variances) et quadratique (non-égalité des matrices de variances).

L’entrée des probabilités a priori est proposée. Par défaut, le système utilise les probabilités issues des fréquences des classes dans les données entrées.

En fonction des données et des paramètres définis par l’utilisateur, l’analyse ADB réalise automatiquement les études de la population d’apprentissage et des éventuelles populations de validation et de prévision.

De façon plus précise, la méthode peut se décomposer en trois étapes. Supposons une population de n individus. Découpons cette population en trois sous-populations de tailles n1, n2 et n3 avec n1 + n2 + n3 = n. Les trois étapes sont  une étude initiale sur la population d’apprentissage de taille n1 puis  une étude de validation sur la population de validation de taille n2 et enfin  une étude prospective sur une population de prévision de taille n3.

Des tableaux résumés et détaillés des classements sont calculés.

Le tracé de plans factoriels et un rapport général de synthèse sont proposés.

Tableaux

Probabilités initiales

Centroïdes des classes et global

Matrice des covariances globales

Matrice des corrélations globales

Covariances par classe

Corrélations par classe

Covariances intra-classes

Corrélations intra-classes

Distances de Mahalanobis, valeurs des Fishers et tests de signification

Tableau des inerties

Test de Pillai

Test de Box

Fonctions discriminantes standardisées

Fonctions discriminantes non standardisées

Résultats pour les variables

Résultats pour les individus

Coordonnées des centres des classes

Coefficients de la fonction de classement linéaire (apprentissage)

Coefficients de la fonction de classement quadratique (apprentissage)

Détails du classement (apprentissage)

Matrice de confusion (apprentissage)

Sensibilités, spécificités (apprentissage)

Statistiques des classes observées (apprentissage)

Statistiques des classes prévues (apprentissage)

Détails du classement (validation)

Matrice de confusion (validation)

Sensibilités, spécificités (validation)

Classement prévision

Graphiques

Diagramme des inerties

Cercle factoriel des corrélations des variables (points)

Cercle factoriel des corrélations des variables (points + lignes)

Plan factoriel du jeu d’apprentissage

Plan factoriel du jeu de validation

Plan factoriel du jeu de prévision

Plan factoriel des jeux d’apprentissage et de validation

Plan factoriel des jeux d’apprentissage et de prévision

Nuage de points pour le jeu d’apprentissage

Nuage de points pour le jeu de validation

Nuage de points pour le jeu de prévision

Graphique des frontières pour le jeu d’apprentissage

Graphique des frontières pour le jeu de validation

Graphique de la matrice de confusion pour le jeu d’apprentissage

Graphique de la matrice de confusion pour le jeu de validation

Courbe ROC pour le jeu d’apprentissage

Courbe ROC pour le jeu de validation