La méthode Régression PLS (partial least squares ou moindres carrés partiels) est conçue pour ajuster un modèle statistique reliant un ensemble de variables explicatives X à une variable à expliquer Y (PLS1) ou à plusieurs variables à expliquer Y (PLS2).
La procédure est utile lorsqu’il y a de nombreux X et que le but principal est de prévoir simultanément les variables Y.
Elle est recommandée dans le cas où un grand nombre de variables X est utilisé, lorsqu’il y a de fortes colinéarités entre ces variables X, lorsque le nombre de variables X est supérieur au nombre d’observations et lorsqu’il y a des données manquantes.
La méthode PLS est notamment largement utilisée par les chimistes et les chimiométriciens pour l’étalonnage en spectrométrie.
Un rapport général de synthèse est proposé contenant notamment les PRESS, R2, Q2, R2X, R2Y, les poids w et w*, les scores t et u, les poids des variables X et Y, les corrélations des variables avec les composantes, les valeurs observées, ajustées et résidus du modèle, les distances au modèle en X et Y, les T2 de Hotelling et les VIP. Les graphiques des R2X, R2Y, Q2, des coefficients standardisés, des cercles des corrélations, des plans factoriels, des poids des variables, des T2, des distances au modèle en X et Y, des VIP, des valeurs observées vs estimées et des résidus sont également disponibles.
La procédure implémentée est basée sur le package R ‘plsdepot’.