> Statistiques > Analyse de données > Analyse en Composantes Principales
Analyse en Composantes Principales
On peut utiliser le package FactoMineR :
- faire library(FactoMineR)
- pour faire l'ACP et afficher le graphe des points variables projetés sur les 2 premières dimensions ainsi que le graphe des corrélations : res <- PCA(fr)
- par défaut, les 5 premières dimensions sont conservées, mais on peut faire varier ce nombre : res <- PCA(fr, ncp = 3)
- res <- PCA(fr, graph = FALSE) : évite l'affichage des graphes (qui peuvent être alors affichés après).
- res <- PCA(fr, quanti.sup = c(1, 2), quali.sup = (3, 4)) : donne les index des colonnes ayant des variables supplémentaires, qui ne sont pas prises en compte pour le calcul de la PCA (le premier pour les variables quantitatives, le second pour les variables qualitatives).
- résultat renvoyé :
- res$eig : retourne un data frame avec comme colonnes : les valeurs propres pour chaque dimension, la variance expliquée par chaque dimension et la variance cumulée.
- res$ind : liste qui donne les coordonnées de chaque individus sur les axes (res$ind$coord), le cosinus carré qui donne la qualité de représentation du point sur l'axe (res$ind$cos2) dont la somme sur tous les axes vaut 1, la contribution de chaque individu à la construction de l'axe (dont la somme sur tous les individus vaut 1).
- res$var : liste qui donne les coordonées de chaque variable sur chaque axe (res$var$coord), les corrélations de chaque variable sur chaque axe (res$var$cor), les cosinus carrés de chaque variable sur chaque axe (res$var$cos2) et les contributions de chaque variable sur chaque axe (res$var$contrib).
- summary(res) : donne les variances, pour chaque individu sa coordonnée sur l'axe, sa constribution à la construction de l'axe et le cosinus carré qui indique sa qualité de représentation sur l'axe.
Représentation d'une PCA faite avec FactoMineR :
- plot(res) ou plot(res, choix = "ind") : donne le graphe des individus sur les 2 premiers axes.
- plot(res, choix = "var") : donne le graphe des variables, c'est à dire le cercle des corrélations.
- plot(res, axes = c(1, 3), choix = "ind") : représentation des axes 1 et 3 plutôt que 1 et 2 par défaut.
Copyright Aymeric Duclert
programmer en R, tutoriel R, graphes en R