Cours d'analyse de la variance
Romaric COULIBALY
Enseignant-Chercheur
[email protected]
Bureau 801
ENSEA
13 mars 2024
Chapitre 4
Analyse de la variance à trois
facteurs
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 2 / 24
Qu'allons-nous faire aujourd'hui ?
1 Introduction
2 Données et problème
3 Formulation du modèle
4 Estimation des paramètres
5 Tests de comparaison
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 3 / 24
Bibliograhie
C. DUBY & E. JOLIVET,Analyse de la variance et plans
d'expériences,1977,ENSAE (INSEE), 3, Avenue Pierre Larousse -
92240 MALAKOFF
Université de Bordeaux, Analyse de la variance, Notes de cours en
modélisation statistique
Ricco Rakotomalala, ANOVA à 1 et 2 facteurs : Analyse de la
variance, Université Lumière Lyon 2
WikiStat, Analyse de variance et covariance
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 4 / 24
Sommaire
1 Introduction
2 Données et problème
3 Formulation du modèle
4 Estimation des paramètres
5 Tests de comparaison
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 5 / 24
Introduction
On s'inscrit dans la continuité dans la continuité des modèles
suivants :
V ar.quant. = V ar.quali1 + V ar.quali2 + ... + V ar.qualin
| {z } | {z }
V ar.dpendante V ar.explicatives
On augmente le nombre de facteurs explicatifs de la variable
dépendante 3 facteurs
Objectif : Tester l'existence d'eets d'interaction des 3 facteurs sur
la variable de réponse
Exemple 1
On désire mesurer l'eet de plusieurs traitements de la migraine sur un échantillon
constitué d'hommes et de femmes. A cet eet, on mesure le risque de migraine de
chacun des individus avant application des traitements. On aimerait savoir si le type
de traitement, le risque de migraine et le sexe interagissent pour prédire le score de
douleur.
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 6 / 24
Sommaire
1 Introduction
2 Données et problème
3 Formulation du modèle
4 Estimation des paramètres
5 Tests de comparaison
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 7 / 24
Données et problème
On considère l'expérience consistant à tester l'eet de trois facteurs
A, B et C sur une variable quantitative Y
▶ Facteur A : I modalités notée Ai
▶ Facteur B : J modalités notée Bj
▶ Facteur C : L modalités notée Cl
▶ Pour chacun des triplets (Ai , Bj , Cl ), on a K mesures de Y
On a : n = I ∗ J ∗ L ∗ K observations dans l'échantillon
Les données sont présentées comme suit :
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 8 / 24
Données et problème
Facteur A Facteur B Facteur C Essai Y
A1 B1 C1 1 Y1111
.. .. .. .. ..
. . . . .
A1 B1 C1 K Y111K
.. .. .. .. ..
. . . . .
AI B1 C1 1 YI111
.. .. .. .. ..
. . . . .
AI B1 C1 K YI11K
A1 B2 C1 1 Y1211
.. .. .. .. ..
. . . . .
AI BJ C1 K YIJ1K
.. .. .. .. ..
. . . . .
A1 B1 C2 1 Y1121
.. .. .. .. ..
. . . . .
AI BJ CL K YIJKL
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 9 / 24
Données et problème
Dans le cas d'une équirépétition, on dénit les moyennes
suivantes :
1 ¯ = 1 PK Yijlk
Yijl. K k=1
2 ¯ = 1 PL PK Yijlk
Yij.. LK P l=1 Pk=1
J K
3 Y¯i.l. = JK
1
j=1 k=1 Yijlk
¯ 1
P I P K
4 Y.jl. = IK i=1 k=1 Yijlk
PJ PL PK
5 Y¯i... = JLK
1
j=1 k=1 Yijlk
¯ = 1 P I PLl=1 PK
6 Y.j.. ILK P i=1 P l=1 Pk=1 Yijlk
¯ 1 I J K
7 Y..l. = IJK i=1 j=1 k=1 Yijlk
¯ 1
P I P J P L PK
8 Y.... = IJLK i=1 j=1 l=1 k=1 Yijlk
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 10 / 24
Sommaire
1 Introduction
2 Données et problème
3 Formulation du modèle
4 Estimation des paramètres
5 Tests de comparaison
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 11 / 24
Formulation du modèle
On écrit le modèle de variance suivant :
Yijlk = µ + αi + βj + γl + (αβ)ij + (αγ)il + (βγ)jl + (αβγ)ijl + ϵijlk
avec i = 1, . . . , I, j = 1, . . . , J, l = 1, . . . , L, k = 1, . . . , K
On pose les contraintes suivantes :
PI PJ PL
▶
i=1 αi = 0, j=1 βj = 0, l=1 γl = 0
et
PI PJ
▶ ∀j = 1, . . . , J, i=1 (αβ)ij = 0 ∀i = 1, . . . , I, j=1 (αβ)ij = 0
et
PI PL
▶ ∀l = 1, . . . , L, i=1 (αγ)il = 0 ∀i = 1, . . . , I, l=1 (αγ)il = 0
et
PJ PL
▶ ∀l = 1, . . . , L, j=1 (βγ)jl = 0 ∀j = 1, . . . , J, l=1 (βγ)jl = 0
PI
▶ ∀(j, l) ∈ 1, . . . , J × 1, . . . , L, i=1 (αβγ)ijl = 0
PJ
▶ ∀(i, l) ∈ 1, . . . , I × 1, . . . , L, j=1 (αβγ)ijl = 0
PL
▶ ∀(i, j) ∈ 1, . . . , I × 1, . . . , J, l=1 (αβγ)ijl = 0
On suppose que :
▶ ∀i, j, l, k, ϵijlk ∼ N (0, σ 2 )
▶ ϵijlk ⨿ ϵmnop , ∀(i, j, l, k) ̸= (m, n, o, p)
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 12 / 24
Sommaire
1 Introduction
2 Données et problème
3 Formulation du modèle
4 Estimation des paramètres
5 Tests de comparaison
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 13 / 24
Estimation des paramètres
L'estimation des paramètres se ramène à l'étude d'un modèle de
régression de variables indicatrices
On dispose alors de :
▶ Indicatrices du facteur A
▶ Indicatrices du facteur B
▶ Indicatrices du facteur C
▶ Indicatrices des interactions doubles (A × B , A × C et B × C )
▶ Indicatrices de l'interaction triple (A × B × C )
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 14 / 24
Estimation des paramètres
On dénit les variations suivantes :
Facteur A : SCA = JLK Ii=1 (Y¯i... − Y¯.... )2
P
1
Facteur B : SCB = ILK Jj=1 (Y.j..
¯ − Y¯.... )2
P
2
Facteur C : SCC = IJK l=1 (Y¯..l. − Y¯.... )2
PL
3
4 Facteurs A et B
P: P
I J ¯ − Y¯i... − Y.j..
¯ + Y¯.... )2
SCA×B = LK i=1 j=1 (Yij..
5 Facteurs A et C
P:I PL
SCA×C = JK i=1 l=1 (Y¯i.l. − Y¯i... − Y¯..l. + Y¯.... )2
6 Facteurs B et P
C : P
J L ¯ − Y.j..
¯ − Y¯..l. + Y¯.... )2
SCB×C = IK j=1 l=1 (Y.jl.
7 Facteurs A,B et C : SCA×B×C =
PI PJ PL
K i=1 j=1 l=1 (Yijl. ¯ − Yij..
¯ − Y¯i.l. − Y.jl.
¯ + Y¯i... + Y.j..
¯ + Y¯..l. − Y¯.... )2
Résidus : SCR = i=1 j=1 l=1 k=1 (Yijlk − Yijl.
PI PJ PL PK ¯ )2
8
Totale : SCT =
PI PJ PL PK
9
i=1 j=1 l=1 (Yijlk − Y¯.... )2
k=1
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 15 / 24
Estimation des paramètres
Tableau d'analyse de la variance
On écrit l'équation d'analyse de la variance comme suit :
SCT = SCA + SCB + SCC + SCA×B + SCA×C + SCB×C + SCA×B×C + SCR
On a les degrés de liberté suivants :
Source Degré de liberté
Facteur A nA = I − 1
Facteur B nB = J − 1
Facteur C nC = L − 1
Interaction AxB nAB = (I − 1)(J − 1)
Interaction AxC nAC = (I − 1)(L − 1)
Interaction BxC nBC = (J − 1)(L − 1)
Interaction AxBxC nABC = (I − 1)(J − 1)(L − 1)
Résiduelle nR = IJL(K − 1)
Totale nT = IJLK − 1
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 16 / 24
Estimation des paramètres
Tableau d'analyse de la variance
Source DDL Carré moyen F 2
Facteur A nA 2
σA = SCA
nA FA =
σA
2
σR
2
Facteur B nB 2
σB = SC
nB
B σB
FB = σ 2
R
σ2
Facteur C nC 2
σC = SC
nC
C
FC = σC2
R
σ2
Interaction A x B nAB 2
σAB = SC
nAB
AB
FAB = σAB 2
R
2
Interaction A x C nAC 2
σAC = SC
nAC
AC σAC
FAC = σ2
R
σ2
Interaction B x C nBC 2
σBC = SC
nBC
BC
FBC = σBC 2
R
2
Interaction A x B x C nABC 2
σABC = SC ABC
nABC FABC = σ2
σABC
R
Résiduelle nR 2
σR = SC
nR
R
Totale nT
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 17 / 24
Estimation des paramètres
Estimateurs des paramètres
1 µ̂ = Y¯....
2 α̂i = Y¯i... − µ̂
3 βˆj = Y¯.j.. − µ̂
4 γ̂l = Y¯..l. − µ̂
5 (αβ)ˆ ij = Y¯ij.. − Y¯i... − Y¯.j.. + µ̂
6 ˆ il = Y¯i.l. − Y¯i... − Y¯..l. + µ̂
(αγ)
7 ˆ jl = Y¯.jl. − Y¯.j.. − Y¯..l. + µ̂
(βγ)
8 ˆ il = Yijl.
(αβγ) ¯ − Y¯ij.. − Y¯i.l. − Y¯.jl. + Y¯i... + Y¯.j.. + Y¯..l. − µ̂
SCR
9 σ2 = IJL(K−1)
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 18 / 24
Sommaire
1 Introduction
2 Données et problème
3 Formulation du modèle
4 Estimation des paramètres
5 Tests de comparaison
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 19 / 24
Tests de comparaison
Plusieurs tests de Fisher peuvent être réalisés :
▶ Eet du facteur A
(H0 ) : α1 = · · · = αI = 0 vs (H1 ) : ∃i/αi ̸= 0
avec FA ∼ F (I − 1, IJL(K − 1))
▶ Eet du facteur B
(H0 ) : β1 = · · · = βJ = 0 vs (H1 ) : ∃j/βj ̸= 0
avec FB ∼ F (J − 1, IJL(K − 1))
▶ Eet du facteur C
(H0 ) : γ1 = · · · = γL = 0 vs (H1 ) : ∃l/γl ̸= 0
avec FC ∼ F (L − 1, IJL(K − 1))
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 20 / 24
Tests de comparaison
Eet de l'interaction entre A et B
(H0 ) : (αβ)11 = · · · = (αβ)1J = (αβ)21 · · · = (αβ)IJ = 0
vs
(H1 ) : ∃(i, j)/(αβ)ij ̸= 0
avec FAB ∼ F ((I − 1)(J − 1), IJL(K − 1))
Eet de l'interaction entre A et C
(H0 ) : (αγ)11 = · · · = (αγ)1L = (αγ)21 · · · = (αγ)IL = 0
vs
(H1 ) : ∃(i, l)/(αγ)il ̸= 0
avec FAC ∼ F ((I − 1)(L − 1), IJL(K − 1))
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 21 / 24
Tests de comparaison
Eet de l'interaction entre B et C
(H0 ) : (βγ)11 = · · · = (βγ)1L = (βγ)21 · · · = (βγ)JL = 0
vs
(H1 ) : ∃(j, l)/(βγ)jl ̸= 0
avec FBC ∼ F ((J − 1)(L − 1), IJL(K − 1))
Eet de l'interaction entre A, B et C
(H0 ) : (αβγ)111 = · · · = (αβγ)11L = (αβγ)211 · · · = (αβγ)IJL = 0
vs
(H1 ) : ∃(i, j, l)/(αβγ)ijl ̸= 0
avec FABC ∼ F ((I − 1)(J − 1)(L − 1), IJL(K − 1))
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 22 / 24
Tests de comparaison
Procédure de test
1 Tester la nullité des interactions d'ordre 3.
▶ Rejet de H ⇒ Garder le modèle complet et n des tests
0
2 Non-rejet de H0 ⇒
1 Considérer le modèle sans le terme d'interaction d'ordre 3
2 Tester la nullité des termes d'interaction d'ordre 2
3 Rejet des trois hypothèses ⇒ Garder les modèles avec les termes
d'interaction d'ordre 2
3 Rejet de deux hypothèses ⇒ Enlever les eets d'interaction nuls et n
des tests
4 Rejet d'une hypothèse ⇒ Enlever les eets d'interaction nuls et tester la
nullité des eets du facteur n'intervenant pas dans l'interaction
▶ Si rejet de cette hypothèse, ⇒ Fin des tests
▶ Sinon, Enlever le facteur correspondant et modèle à deux facteurs et
n des tests
5 Si aucune hypothèse n'est rejetée ⇒ Choix d'un modèle additif et test de
nullité des eets de chaque facteur
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 23 / 24
Merci de votre aimable attention
R. Coulibaly (ENSEA) Cours d'analyse de la variance 13 mars 2024 24 / 24