Mis a jour le 2016-05-22, 16:22

ANOVA

ANOVA standard

L'objectif est de savoir si une variable numérique a des valeurs significativement différentes selon plusieurs catégories (i.e., selon les valeurs d'un facteur). Plus précisémment, on teste l'hypothèse nulle : il y a au moins deux catégories pour lesquelles les moyennes de la variable sont différentes. C'est une généralisation du t-test dans le cas où il y a plus de deux catégories.
ANOVA à un facteur :
Pour faire une ANOVA, on peut aussi utiliser : test <- anova(lm(var ~ categ, fr))
Test de Bartlett : permet de tester l'hypothèse nulle de variances égales entre les groupes :
ANOVA à un facteur sans supposer que les variances sont égales :
Si l'hypothèse de normalité n'est pas vérifiée, on peut faire un test non paramétrique de Krukal-Wallis :
Une fois que l'ANOVA a montré une différence significative, on peut faire un test de Tukey Honestly Significant Difference pour savoir entre quels facteurs il y a une différence (à condition qu'il y ait à peu près le même nombre d'observations dans chaque catégorie) :
ANOVA à deux facteurs :
fr <- data.frame(var = c(10, 4, 5, 3, 3, 7, 2, 6, 2, 8, 5),
                 categ = factor(c("c", "a", "b", "a", "b", "b", "a", "b", "a", "c", "c")),
                 categ2 = factor(c("A", "B", "B", "B", "B", "A", "B", "A", "B", "A", "A")))
fit <- aov(var ~ categ * categ2, fr)
summary(fit)
donne :
            Df Sum Sq Mean Sq F value  Pr(>F)
categ        2 41.833  20.917  8.1721 0.01476 *
categ2       1  6.250   6.250  2.4419 0.16211
Residuals    7 17.917   2.560
On peut aussi faire : anova(lm(var ~ categ * categ2, fr)).

ANOVA avec mesures répétées

C'est la généralisation du paired t-test à plus de 2 facteurs, avec souvent un design traitement x sujet et on veut juger si le traitement est efficace, mais ce sont les mêmes sujets qui sont toujours testés.
On veut voir si 3 traitements sont significativement différents quand testés contre les même individus (donc mesures non indépendantes)
On peut alors faire un pairwise t-test de type paired pour savoir quelles sont les paires de facteurs qui sont statistiquement significatives :
Test non paramétrique pour des mesures répétées :
Comparaison entre une ANOVA avec mesures répétées et un paired t-test dans le cas où seulement 2 valeurs du facteur :

Copyright Aymeric Duclert
programmer en R, tutoriel R, graphes en R