UNIWIN - Analyse Discriminante Bayésienne

L’Analyse Discriminante Bayésienne (ADB) permet de construire à partir d’un ensemble de variables quantitatives et d’une variable qualitative découpant la population en plusieurs groupes (2 ou plus), des fonctions discriminantes qui définissent une règle de décision optimale à partir de laquelle on peut affecter des individus de validation et de prévision aux différents groupes.

Cette technique suppose que l’on connaisse a priori les probabilités d’appartenance aux différents groupes et que les données suivent une loi multi-normale.

La méthode proposée permet de traiter les cas linéaire (égalité des matrices de variances) et quadratique (non-égalité des matrices de variances).

L’entrée des probabilités a priori est proposée. Par défaut, le système utilise les probabilités issues des fréquences des groupes dans les données entrées.

En fonction des données et des paramètres définis par l’utilisateur, l’analyse ADB réalise automatiquement les études de la population d’apprentissage et des éventuelles populations de validation et de prévision.

De façon plus précise, la méthode peut se décomposer en trois étapes. Supposons une population de n individus. Découpons cette population en trois sous-populations de tailles n1, n2 et n3 avec n1 + n2 + n3 = n. Les trois étapes sont  une étude initiale sur la population d’apprentissage de taille n1 puis  une étude de validation sur la population de validation de taille n2 et enfin  une étude prospective sur une population de prévision de taille n3.

Des tableaux résumés et détaillés des classements sont calculés.

Le tracé de plans factoriels et un rapport général de synthèse sont proposés.

Tableaux

Probabilités initiales

Centroïdes des groupes et global

Matrice des covariances globales

Matrice des corrélations globales

Covariances par groupe

Corrélations par groupe

Covariances intra-groupes

Corrélations intra-groupes

Distances de Mahalanobis, valeurs des Fishers et tests de signification

Tableau des inerties

Critères statistiques (Hotelling, Pillay, Roy)

Test de Box

Fonctions discriminantes standardisées

Fonctions discriminantes non standardisées

Résultats variables

Résultats individus

Coordonnées des centres des groupes

Coefficients des fonctions de classement (linéaires ou quadratiques)

Classement apprentissage

Détails du classement apprentissage

VP, FN, FP, VN, sensibilité, spécificité apprentissage

Statistiques des groupes observés apprentissage

Statistiques des groupes prévus apprentissage

Classement validation

Détails du classement validation

VP, FN, FP, VN, sensibilité, spécificité validation

Classement prévision

Graphiques

Diagramme des inerties

Cercle factoriel des corrélations des variables (points)

Cercle factoriel des corrélations des variables (points + lignes)

Plan factoriel du jeu d’apprentissage

Plan factoriel du jeu de validation

Plan factoriel du jeu de prévision

Plan factoriel des jeux d’apprentissage et de validation

Plan factoriel des jeux d’apprentissage et de prévision

Courbe ROC pour le jeu d’apprentissage

Courbe ROC pour le jeu de validation