UNIWIN - Analyse en Composantes Principales Symbolique

Les méthodes classiques d’analyse factorielle ne sont applicables qu’à des objets caractérisés par des variables monovaluées (la valeur prise par une variable pour un objet est une valeur unique).

L’ACPS est une extension de l’ACP à des objets caractérisés par des variables multivaluées décrivant de la variation ou de l’imprécision (la valeur prise par une variable pour un objet est un intervalle de valeurs).

Prenons trois exemples :

En botanique si les objets à étudier sont des plantes, la taille de la tige d’une plante est une valeur unique. Par contre, si les objets auxquels on s’intéresse sont des espèces de plantes (concepts), la taille de la tige d’une espèce définit un intervalle de valeurs. Cet intervalle représente le domaine de variation de la taille de la tige sur tous les spécimens appartenant à l’espèce en question.

En météorologie, les températures quotidiennes enregistrées en valeurs minimales et maximales offrent une vision plus réaliste des variations des conditions météorologiques par rapport aux valeurs moyennes simples.

En finance, les prix de transaction minimum et maximum, relevés quotidiennement pour un ensemble d’actions, représentent une information plus pertinente pour les experts afin d’évaluer la tendance et la volatilité des actions dans la même journée.

La procédure ACPS proposée (méthode des centres) accepte deux structures de données en entrée :

  1. Un tableau de données individus x variables qui sera transformé en un tableau de données (concepts) contenant les intervalles des objets symboliques par utilisation de variables qualitatives.
  2. Un tableau de données (concepts) contenant les intervalles des objets symboliques.

Les données sont automatiquement centrées et réduites.

Le rapport affiche les composantes principales (approches classique et symbolique), les coordonnées des variables (approches classique et symbolique), les cosinus carrés et les contributions des concepts et des variables ainsi que les distances carrées des concepts à l’origine et les contributions des concepts à l’inertie totale.

Les graphiques proposés sont : diagramme des inerties (approche classique), cercle des corrélations des variables (approche classique), plan factoriel des variables (approche symbolique), plan factoriel des concepts (approches classique et symbolique).

Tableaux

Tableau des intervalles des concepts

Tableau des centres des concepts

Tableau des inerties du nuage des centres des concepts

Composantes principales (centres)

Composantes principales (approche symbolique)

Coordonnées des variables (centres)

Coordonnées des variables (approche symbolique)

Cosinus carrés et cosinus carrés cumulés des variables (centres)

Contribution des variables à l’inertie (centres)

Distances carrées des concepts à l’origine (centres)

Cosinus carrés et cosinus carrés cumulés des concepts (centres)

Contributions des concepts à l’inertie (centres)

Contributions des concepts à l’inertie totale (centres)

Graphiques

Diagramme des inerties

Cercle des corrélations (approche classique)

Plan factoriel des variables (approche symbolique)

Plan factoriel des concepts (approche classique)

Plan factoriel des concepts (approche symbolique)