La méthode de classement bayésienne naïve est basée sur le théorème de Bayes avec l’hypothèse, dite naïve, d’indépendance conditionnelle entre toutes les paires de descripteurs par rapport aux valeurs de la variable à prédire.
Elle met en œuvre un classifieur bayésien naïf appartenant à la famille des classifieurs linéaires. Un terme plus approprié pour le modèle probabiliste sous-jacent pourrait être modèle à caractéristiques statistiquement indépendantes.
En termes simples, un classifieur bayésien naïf suppose que l’existence d’une caractéristique pour une classe est indépendante de l’existence d’autres caractéristiques. Un fruit peut être considéré comme une pomme s’il est rouge, arrondi, et fait une dizaine de centimètres. Même si ces caractéristiques sont liées dans la réalité, un classifieur bayésien naïf déterminera que le fruit est une pomme en considérant indépendamment ses caractéristiques de couleur, de forme et de taille.
Malgré le modèle de conception naïf et les hypothèses de base extrêmement simplistes, les classifieurs bayésiens naïfs ont fait preuve d’une efficacité plus que suffisante dans beaucoup de situations réelles complexes. L’avantage du classifieur bayésien naïf est qu’il requiert relativement peu de données d’entraînement pour estimer les paramètres nécessaires au classement.
Cette procédure est basée sur le package R ‘naivebayes’.