UNIWIN propose diverses méthodes pour gérer et modifier les données collectées :
Imputations des données manquantes
Si la variable est numérique, l’imputation peut se faire par la moyenne, la médiane, le mode ou une valeur donnée saisie.
Si la variable est caractère, l’imputation peut se faire par le code ‘Manquant’, la valeur la plus fréquente ou une valeur donnée saisie.
Un graphique des données manquantes dans le fichier de données peut être affiché.
Le fichier des données après imputations peut être enregistré dans un nouveau fichier.
Recodifications de données
L’option Recodifications permet de recoder des variables alphabétiques en variables numériques qualitatives.
Elle ajoute dans le fichier des résultats trois nouvelles variables pour chacune des variables recodées :
1. Une variable indiquant les numéros des observations
2. Une variable contenant les codages numériques des données alphabétiques
3. Une variable contenant les libellés uniques de la variable alphabétique recodée
Codage disjonctif
Un tableau disjonctif complet est un type de représentation de données qualitatives fréquemment utilisé en analyse des données.
Dans ce tableau, une variable qualitative à k modalités est remplacée par k variables binaires, chacune correspondant à une des modalités.
Cette procédure génère donc pour chaque variable qualitative, les variables suivantes :
1. une variable alphabétique contenant des libellés des modalités
2. k variables binaires dans lesquelles 1 indique que l’observation possède la modalité k et 0 qu’elle ne la possède pas
Tableaux de distances
Cette option permet de créer un tableau de distances (matrice triangulaire inférieure) entre des observations (individus) observées sur un ensemble de variables.
Trois calculs de distances sont proposés :
1. La distance euclidienne
2. La distance euclidienne au carré
3. La distance en valeur absolue
La standardisation (centrage et réduction) préalable des données est proposée.
Le tableau résultant de cette procédure est directement utilisable dans l’Analyse sur Tableau de Distances ou de Dissimilarités (ATD).