UNIWIN - Classification par la méthode DBSCAN

DBSCAN (Density-Based Spatial Clustering of Applications with Noise) est un algorithme de partitionnement de données proposé en 1996 par Martin Ester, Hans-Peter Kriegel, Jörg Sander et Xiaowei Xu.

Les classes formées correspondent à des régions denses dans l’espace des données séparées par des régions de plus faibles densités de points. L’algorithme DBSCAN repose sur cette notion intuitive de classes et de bruit. Il possède plusieurs avantages par rapport aux autres techniques de partitionnement, notamment sa capacité à créer un nombre de classes non défini a priori, à reconnaître des classes non convexes et à isoler les points suspects.

La procédure affiche un rapport indiquant pour chaque observation sa classe, sa distance au point central, son coefficient de silhouette ainsi qu’une synthèse de la classification. Les graphiques des distances K-NN, des distances d’accessibilité par densité, des coefficients de silhouette et des nuages des points des classes avec ou sans enveloppes sont proposés.

Cette procédure est basée sur le package R ‘dbscan’.

Tableaux

Classification des observations

Synthèse de la classification

Graphiques

Graphique des distances K-NN

Graphique des distances d’accessibilité par densité

Graphique des coefficients de silhouette

Nuages de points des classes

Nuages de points des classes avec enveloppes