UNIWIN - Séparateurs à vastes marges

La procédure Séparateurs à vastes marges implémente une procédure d’apprentissage machine pour prévoir des observations à partir de données. Elle crée des modèles de deux formes : modèles de classement qui découpent des observations en groupes en se basant sur les caractéristiques observées, modèles de régression qui prévoient la valeur d’une variable cible.

Dans le cas d’un modèle de classement, l’algorithme découpent les observations en groupes en générant des marges autour des groupes aussi vastes que possible.

Dans le cas d’un modèle de régression, l’algorithme minimise les coefficients d’un modèle dans lequel la distance des observations à une région autour du modèle ajusté définie par un montant d’erreur acceptable est aussi petite que possible.

Les observations sont classiquement divisées en trois jeux :

  • Un jeu d’apprentissage utilisé pour construire le modèle.
  • Un jeu de validation, pour lequel le groupe ou la valeur est connu, utilisé pour valider le modèle.
  • Un jeu de prévision, pour lequel le groupe ou la valeur n’est pas connu, utilisé pour faire les prévisions désirées.

La variable à expliquer est qualitative (classement) ou quantitative (régression).

Cette procédure est basée sur le package R ‘e1071’.

Tableaux

Paramètres optimaux des noyaux
Exactitude (classement)
Erreur quadratique (régression)
Importance des variables
Vecteurs supports
Vecteurs supports par classe (classement)
Valeurs de décision (classement)
Prévisions (classement)
Matrice de confusion (classement)
Sensibilité, spécificité (classement)
Valeurs observées, estimées, résidus (régression)

Graphiques

Importance des variables
Matrice de confusion (classement)
Courbe ROC (classement)
Nuages de points
Graphique des frontières
Prévus vs observés (régression)
Résidus vs observés (régression)