Analyse de la variance à deux
facteurs
ANOVA (2)
ANOVA(1) c’est quand?
• On utilise cette modélisation lorsque l’on
souhaite expliquer une variable quantitative à
l’aide d’une variable qualitative ayant k
modalités
ANOVA(2) c’est quoi?
• Étude simultanée d’un facteur A à p modalités
et d’un facteur B à q modalités.
• Pour chaque couple de modalités (A, B) :
On a un échantillon ( et ).
Tous les sont de mêmes tailles n .
Conditions d'applications de
l'ANOVA
• les populations étudiées suivent une distribution
normale
• les variances des populations sont toutes égales
(HOMOSCEDASTICITE)
• les échantillons de tailles sont prélevés
aléatoirement et indépendamment dans les
populations.
Procédure de calcul d'une ANOVA
• Déterminer si les échantillons varient de la
même manière.
• Si nous démontrons l'homogénéité des
variances, alors nous pouvons comparer les
moyennes de ces échantillons.
Problèmes liés à l'égalité des variances
Test de l'homogénéité des variances
• : les variances sont homogènes
• : Au moins une des variances est différente des autres
→ utilisation d'un test de comparaison de plusieurs variances
Conclusion
• Si est rejetée : il est théoriquement impossible de comparer
des échantillons qui ne varient pas de la même manière.
• Si n’est pas rejetée : par conséquent, il est possible de
comparer les moyennes de tels échantillons
Tests possibles
• Influence du facteur A seul
• Influence du facteur B seul
• Interaction des deux facteurs
Si influence d'un facteur sur la moyenne des
populations est différente en l'absence ou en la
présence de l'autre facteur
Hypothèses
• : le facteur A n’a pas d’influence sur la
moyenne des populations.
• : le facteur B n’a pas d’influence sur la
moyenne des populations.
• : il n’y a pas d’interaction entre les facteurs A
et B.
• : au moins une des moyennes est
différente des autres
Variances totale, factorielle, résiduelle
Pour chaque échantillon de taille , on calcule :
• Moyenne
=
• variance expérimentale
=
Pour l'ensemble de l'expérience :
• Taille totale
• Moyenne générale
• Variance totale
Décomposition de la variance Factorielle
Théorème d'analyse de la variance
Avec
Sous l’hypothèse :
• suit une loi de Snédécorà et 1ddl
• suit une loi de Snédécorà et 1ddl
• suit une loi de Snédécorà )(q-1) et 1ddl
• (test unilatéral : le rapport n’est pas
obligatoirement supérieur à 1)
• Choix du risque: risque de première
espèce α (erreur commise lorsqu’on rejette à
tort).
Décision
Décision
• Si => rejet de au risque :
– La variance factorielle est significativement supérieure à la variance résiduelle : les moyennes diffèrent
significativement entre-elles. Donc on attribue une influence significative au facteur A étudié.
• Si => rejet de au risque :
– La variance factorielle est significativement supérieure à la variance résiduelle : les moyennes diffèrent
significativement entre-elles. Donc on attribue une influence significative au facteur B étudié.
• Si => rejet de au risque :
– La variance factorielle est significativement supérieure à la variance résiduelle : les moyennes diffèrent
significativement entre-elles. Donc on attribue une influence significative au facteur A étudié.
– il existe une interaction significative d'un facteur sur l'autre.
• Recherche du degré de signification p pour chaque test (recherche du risque le plus petit possible pour
conclure au rejet de )
• Sinon rien ne permet de dire que les moyennes des populations ne sont pas égales => n’est pas rejetée.
Cas particulier où n=1
Avec
Sous l’hypothèse :
• suit une loi de Snédécorà et 1ddl
• suit une loi de Snédécorà et 1ddl
• Le test pour n'est pas réalisable
• Recherche du degré de signification p pour chaque
test (recherche du risque le plus petit possible
pour conclure au rejet de )
• Sinon rien ne permet de dire que les moyennes des
populations ne sont pas égales => n’est pas
rejetée.