Analyse de la variance
1 et 2 facteurs
Dr. Hamdad Leila
Analyse de la variance à 1
facteur
ANOVA1
• Analyse de la variance: ANOVA
Il s'agit d'étudier la relation qui existe entre une variable quantitative
dépendante Y et une variable qualitative X appelé facteur à K modalités
(niveaux). X partitionne la population en K groupes, chacun relatif à
une modalité. Le but de l'ANOVA est d'étudier l'effet de X sur Y est cela
en comparant les moyennes des différents groupes.
• Exemples:
- Effet d'un médicament sur l'âge
- Effet du vaccin sur le Covid 19
ANOVA à un facteur
• Notations:
• X: Variable qualitatives à K modalités
• nk: Taille du groupe k,
• 𝑛 = 𝑛𝑘
• A l'intérieur de chaque groupe k, les observations sont indépendantes
de moyennes 𝑢𝑘 et de variance 𝜎 2 sont des paramètres inconnus
estimés empiriquement par
nk K nk
1
Yk. n
k
y ki , S2 1
nk
y ik y k. 2
i1 k1 i1
• Le modèle s'écrit
𝑦𝑖𝑘 = 𝑢𝑘 + 𝑒𝑖𝑘 , 𝑖 = 1, … , 𝑛𝑘
tels que
• 𝐸(𝑒𝑖𝑘 ) = 0, 𝑉𝑎𝑟(𝑒𝑖𝑘 ) = 𝜎 2
Test ANOVA1
On a,
SST SSW SSB
• SST= Somme des écarts quadratiques Total
• SSW= Somme des écarts quadratiques résiduels
• SSB = Somme des écarts quadratiques inter groupes
𝐽 𝑛𝑗 𝐽 𝑛𝑗 𝐽
𝑦𝑖𝑗 − 𝑦.. ² = 𝑦𝑖𝑗 − 𝑦.𝑗 ² + 𝑛𝑗 𝑦.𝑗 − 𝑦.. ²
𝑗=1 𝑖 𝑗=1 𝑖 𝑗=1
• Pour comparer l'effet du facteur X sur Y, on considère au seuil α= 1% ou
5%, l'hypothèse
𝐻0 : 𝑢1 = ⋯ = 𝑢𝑘 𝑐𝑜𝑛𝑡𝑟𝑒 𝐻1 : ∃ (𝑗, 𝑘) /𝑢𝑗 ≠ 𝑢𝑘
• Pour cela, on dresse le tableau de l'ANOVA1 suivant:
Ddl Somme des écarts Ecart quadratiques moyens
Modèle inter k-1 SSB MSB=SSB/k-1
Modèle intra n-k SSW MSW=SSW/n-k
Total n-1 SST
• Calculer la statistique F= MSB/MSW qui suit une loi de Fisher à (k-
1,n-k) degré de liberté.
• Comparer cette dernière à la valeur tabulée de Fisher au seuil α.
• Si sous H0,
F>f, alors nous rejetons H0 qui avait α chance de se réaliser.
• Sinon H0 est acceptée est donc X n'a pas d'effet sur Y.
Comparaison des moyennes deux à deux
• Lorsque H0 est rejetée, un second test est effectué,
• On teste l’hypothèse
𝑯𝟎: 𝒖𝒋 = 𝒖𝒌 𝒄𝒐𝒏𝒕𝒓𝒆 𝑯𝟏: 𝒖𝒋 ≠ 𝒖𝒌 ,
La statistique de test suivante est utilisée :
• T suit une loi de Student à (n − k) ddl. Et, on utilise donc le t-test.
• Si sous H0, 𝑻 > 𝒕𝜶/𝟐 alors on rejette H0 et on accepte H1.
Analyse de la variance à 2
facteur
ANOVA2
ANOVA à deux facteurs
• Nous étudions l'effet de deux facteurs : A à J modalités et B à K modalités
sur la variable dépendante Y.
• Le modèle avec intéraction s'écrit :
y ijk u ... j k jk e ik ,i 1,...,n jk c,j 1,...,J,k 1,...,K.
• Pour garantir l'unicité de la solution, des contraintes d'identifiabilité
suivantes sont posées:
∀𝑗, 𝛼𝑗 = 𝛾𝑗𝑘 = 0, 𝛽𝑘 = 𝛾𝑗𝑘 = 0, ∀𝑘.
𝑗 𝑘 𝑘 𝑗
• Les paramètres inconnus 𝛼𝑗 , 𝛽𝑘 , 𝛾𝑗𝑘 représentent l'effet du facteur A, du
facteur B et de l'intéraction respectivement. Ils sont estimés par:
• 𝛼𝑗 𝑒𝑠𝑡 𝑒𝑠𝑡𝑖𝑚é 𝑝𝑎𝑟𝑌.𝐽 − 𝑌
• 𝛽𝑘 𝑒𝑠𝑡 𝑒𝑠𝑡𝑖𝑚é 𝑝𝑎𝑟𝑌.𝑘 − 𝑌
• 𝛾𝑗𝑘 𝑒𝑠𝑡 𝑒𝑠𝑡𝑖𝑚é 𝑝𝑎𝑟𝑌.𝐽𝑘 − 𝑌.𝐽 −𝑌.𝑘 +𝑌
Telles que
𝑦𝑖𝑗𝑘 𝑖𝑘 𝑦𝑖𝑗𝑘 𝑖𝑗 𝑦𝑖𝑗𝑘 𝑖 𝑦𝑖𝑗𝑘
𝑌= , 𝑌.𝐽. = , 𝑌..𝐾 = , 𝑌.𝐽𝑘 = .
𝐽𝐾𝐶 𝐾𝐶 𝐽𝐶 𝐶
• L'écart quadratique (Sum of Square) totale se décompose en:
SST=SS1+SS2+SSI+SSE
• Tels que
𝑆𝑆𝑇 = (𝑦𝑖𝑗𝑘 −𝑦)²
𝑆𝑆1 = 𝐶𝐾 𝑗(𝑌.𝐽. − 𝑦)²
𝑆𝑆2 = 𝐶𝐽 𝑘(𝑌..𝑘 − 𝑦)²
𝑆𝑆𝐼 = 𝐶 𝑗𝑘(𝑌.𝐽𝑘 − 𝑌.𝐽. − 𝑌..𝑘. + 𝑦)²
SSE = (𝑦𝑖𝑗𝑘 −𝑌.𝐽𝑘 )²
Tableau ANOVA2
ddl SS MS F
Facteur1 J-1 SS1 MS1=SS1/J-1 F1=MS1/MSE
Facteur2 K-1 SS2 MS2=SS2/K-1 F2=MS2/MSE
Interaction (J-1)(K-1) SSI MSI=SSI/(J-1)(K-1) F3=MSI/MSE
Erreur JK(C-1) SSE MSE=SSE/JK(C-1)
Total JKC-1 SST
Pour tester les effets du facteur1, facteur2 et de l'intéraction, on pose
les hypothèses suivantes:
• Effet du facteur1:
H01: 𝛼𝑗 = 0, ∀𝑗 = 1, … , 𝐽 contre H11 : ∃j, tel que 𝛼𝑗 ≠ 0.
• Effet du facteur2:
H02: 𝛽𝑘 = 0, ∀𝑘 = 1, … , 𝐾 contre H12: ∃k, tel que 𝛽𝑘 ≠ 0.
• Effet de l'intéraction:
H03: 𝛾𝑗𝑘 = 0, ∀𝑗 = 1, … , 𝐽, ∀𝑘 = 1, … , 𝐾. contre H13:∃j,k tel que, 𝛾𝑗𝑘 ≠
0.
Test:
- Si sous H01, 𝐹₁ > 𝑓₁, tels que f₁ est la valeur tabulée de Fisher à (𝐽 −
1, 𝐽𝐾(𝐶 − 1) degré de liberté au seuil α, alors le premier facteur a un
effet sur Y.
- Si sous H02, 𝐹₂ > 𝑓₂, tels que f₂ est la valeur tabulée de Fisher à (𝐾 −
1, 𝐽𝐾(𝐶 − 1) degré de liberté au seuil α, alors le deuxième facteur a
un effet sur Y.
- Si sous H03, 𝐹₃ > 𝑓₃, tels que f₃ est la valeur tabulée de Fisher à (𝐽 −
1)(𝐾 − 1), 𝐽𝐾(𝐶 − 1) degré de liberté au seuil α, alors il existe un
effet d'intéraction des deux facteurs sur Y.
Remarque
• S'il y a absence de l'effet d'intéraction, on suppose le modèle additif,
𝑦𝑖𝑗𝑘 = 𝑢 + 𝛼𝑗 + 𝛽𝑘 + 𝑒𝑖𝑗𝑘 .
• Le tableau d'ANOVA à deux facteurs est obtenu en substituant la
ligne erreur du tableau ci-dessus à la ligne intéraction. Et donc la
ligne erreur sera supprimée et on obtient le tableau suivant:
Tableau sans intéraction
ddl SS MS F
Facteur1 J-1 SS1 MS1=SS1/J-1 F1=MS1/MSE
Facteur2 K-1 SS2 MS2=SS2/K-1 F2=MS2/MSE
Erreur (J-1)(K-1) SSE MSE=SSE/(J-1)(K-1)
Total JKC-1 SST
Exemple
• Il s'agit d’étudier les différentes sources de variabilité possibles de la
résistance d’un ciment fabriqué à Portland. Plusieurs petits
prélèvements d’un même type de ciment ont été mélangés à de l’eau
et travaillés par trois Mélangeurs. Douze cubes ont été formés. Ces
36 cubes ont été affectés à trois personnes chargées d’évaluer leur
résistance, les « casseurs ».
• Tous les tests de résistance ont été faits sur la même machine. Les
données sont exposées dans le tableau suivant:
Casseur1 Casseur2 Casseur3
Mélangeur1 5280 5520 4340 4400 4160 5180
4760 5800 5020 6200 5320 4600
Mélangeur2 4420 5280 5340 4880 4180 4800
5580 4900 4960 6200 4600 4480
Mélangeur3 5360 6160 5720 4760 4460 4930
5680 5500 5620 5560 4680 5600
Tableau des moyennes
C1 C2 C3 𝑌𝑗
M1 5340 4990 4815 5048.33
M2 5045 5345 4515 4968.33
M3 5675 5415 4917.5 5335.83
𝑌𝑘 5353.33 5250 4749.16 𝑌 =5117,49
Ddl SS MSS F
Mélangeur 2 896449.987 448224.99 448224.99/2749
52.222=1.632
Casseur 2 2506156.735 1253078.367 4.557
Interaction (J-1)(K-1)=4 663876.544 165969.136 0.6036
Erreur 3*3*(4-1)=27 7423710 274952.222
Total 35 11491423.432 328326.383
Tests au seuil α=5%.
2- Les Mélangeurs ont t’ils un effet sur la variable dépendante ?
Pour cela, on pose les hypothèses suivantes :
• H0: :" 𝑎𝑗 = 0, ∀𝑗 = 1,2,3 contre H1:" ∃𝑗 = 1,2,3 \𝑎𝑗 ≠ 0.
Sous H0, on a F1=1.632<f2,27=3.35
On accepte H0, et il n y a pas d'effet des mélangeurs sur Y.
• 3- Les résultats sont-ils indépendants des casseurs? Tester l'effet interaction.
On teste l'effet des casseurs sur la résistance et on pose les hypothèses suivantes:
• H0: " 𝑏𝑘 = 0, ∀𝑘 = 1,2,3 contre H1:" ∃𝑘 = 1,2,3 \𝑎𝑗 ≠ 0. "
Sous H0, on a F2=4.557>f2,27=3.35,
On rejette H0 et donc les casseurs ont un effet sur Y.
• Effet d'intéraction:
• H0:" 𝛾𝑗𝑘 = 0, ∀𝑗, 𝑘 = 1,2,3 contre H1::" ∃𝑗, 𝑘 = 1,2,3 \𝛾𝑗𝑘 ≠ 0. "
Sous H0, on a F2=0.6036 < f4,27=2.73.
Ainsi il n y a pas d'effet d'intéraction.