UNIWIN - Arbres de décision et de régression

Les arbres de décision et de régression sont des méthodes permettant d’obtenir des modèles explicatifs et prédictifs. Ils sont faciles à comprendre du fait de l’affichage des résultats sous la forme d’arbres et de la génération d’un ensemble de règles en langage naturel. Les arbres de décision (classement) permettent d’expliquer et de prévoir l’appartenance d’observations à une classe d’une variable qualitative en se basant sur un ensemble de variables explicatives quantitatives et qualitatives. Les arbres de régression permettent d’expliquer et de prévoir la valeur prise par une variable quantitative à expliquer en fonction de variables explicatives quantitatives et qualitatives.

La procédure propose l’étude des jeux d’apprentissage, de validation et de prévision. Un rapport général de synthèse est proposé ainsi que les graphiques des coefficients de complexité, de l’importance des variables, des arbres complet et élagué, de la courbe ROC (décision), des valeurs estimées par rapport aux valeurs observées (régression) et des résidus par rapport aux valeurs estimées (régression).

Cette procédure est basée sur les packages R ‘rpart’ et ‘rpart.plot’.

Tableaux

Coefficients de complexité
Résultats pour l’arbre complet
Règles pour l’arbre complet
Importances des variables
Résultats pour l’arbre élagué
Règles pour l’arbre élagué
Détails du classement pour les jeux d’apprentissage et de validation (décision)
Matrices de confusion pour les jeux d’apprentissage et de validation (décision)
Sensibilités, spécificités pour les jeux d’apprentissage et de validation (décision)
Détails du classement pour le jeu de prévision (décision)
Valeurs observées, estimées et résidus pour les jeux d’apprentissage et de validation (régression)
Valeurs estimées pour le jeu de prévision (régression)

Graphiques

Graphique des coefficients de complexité
Graphique de l’importance des variables
Graphique de l’arbre complet de décision ou de régression
Graphique de l’arbre élagué de décision ou de régression
Graphiques des matrices de confusion pour les jeux d’apprentissage et de validation (décision)
Courbes ROC pour les jeux d’apprentissage et de validation (décision)
Graphique des valeurs estimées et observées pour l’apprentissage et la validation (régression)
Graphique des résidus pour l’apprentissage et la validation (régression)