UNIWIN - Classement par la méthode bayésienne naïve

La méthode de classement bayésienne naïve est basée sur le théorème de Bayes avec l’hypothèse, dite naïve, d’indépendance conditionnelle entre toutes les paires de descripteurs par rapport aux valeurs de la variable à prédire.

Elle met en œuvre un classifieur bayésien naïf appartenant à la famille des classifieurs linéaires. Un terme plus approprié pour le modèle probabiliste sous-jacent pourrait être modèle à caractéristiques statistiquement indépendantes.

En termes simples, un classifieur bayésien naïf suppose que l’existence d’une caractéristique pour une classe est indépendante de l’existence d’autres caractéristiques. Un fruit peut être considéré comme une pomme s’il est rouge, arrondi, et fait une dizaine de centimètres. Même si ces caractéristiques sont liées dans la réalité, un classifieur bayésien naïf déterminera que le fruit est une pomme en considérant indépendamment ses caractéristiques de couleur, de forme et de taille.

Malgré le modèle de conception naïf et les hypothèses de base extrêmement simplistes, les classifieurs bayésiens naïfs ont fait preuve d’une efficacité plus que suffisante dans beaucoup de situations réelles complexes. L’avantage du classifieur bayésien naïf est qu’il requiert relativement peu de données d’entraînement pour estimer les paramètres nécessaires au classement.

Cette procédure est basée sur le package R ‘naivebayes’.

Tableaux

Probabilités a priori des classes

Paramètres des variables

Facteur de classement

Classement apprentissage

Matrice de confusion (apprentissage)

Sensibilités, spécificités (apprentissage)

Classement validation

Matrice de confusion (validation)

Sensibilités, spécificités (validation)

Classement prévision

Graphiques

Graphiques des lois marginales

Graphiques des lois conditionnelles

Graphiques des données d’apprentissage

Graphiques des données de validation

Graphiques des données de prévision

Graphique de la matrice de confusion (apprentissage)

Graphique de la matrice de confusion (validation)

Courbe ROC pour les données d’apprentissage

Courbe ROC pour les données de validation