Analyse de variance
avec interaction
F. Husson
[email protected]
1
Données - notations
Séance Questions
Produit
Cacao
Sucre
Acide
Amer
Juge
Lait
Y a-t-il des différences
d’amertume entre chocolats ?
S1 J1 P6 4 3 2 5.5 7.5
S1 J1 P4 1.2 4.4 6 7.6 5.5 Les juges utilisent-ils l’échelle
de note de la même façon ?
S1 J1 P2 1.8 3 2.6 5 2.4
S1 J1 P5 1.5 3.5 7.1 7.5 7.3 L’amertume des chocolats est-
elle évaluée de la même façon
S1 J1 P1 1 5.5 9.3 8.6 8.1
d’une séance à l’autre ?
S1 J1 P3 9 1 0 0.5 3.7
Les juges évaluent-ils les
…
chocolats de la même façon ?
S1 J2 P5 3.9 2 2.4 5.6 4.8
S1 J2 P6 2.4 4 4.9 5.3 5.8
2
Données - exemple
Exemple : 2 produits ; 3 juges; 2 répétitions
Prod. Juge Note
Juge 1 Juge 2 Juge 3 Moy
P1 J1 1
1 1 2 P1 J1 3
Produit 1 2
3 1 4 P1 J2 1
2 4 4 P1 J2 1
Produit 2 4
2 6 6 P1 J3 2
P1 J3 4
Moy 2 3 4 3
… … …
P2 J3 6
3
Données - notations
• Y variable quantitative
• F1, F2, … variables qualitatives à I, J, … modalités
• nij répétitions pour le couple (i,j)
4
Questions
• Y a-t-il un effet « produit » sur la note ?
• Y a-t-il un effet « juge » sur la note ?
• Y a-t-il une interaction entre les deux facteurs ?
Tests
• Décision dans l’incertain : notion de test
5
Définition de l’interaction
Produit 2
Produit 1 Produit 1
même écart
Produit 2
Juge 1 Juge 2 Juge 3 Juge 1 Juge 2 Juge 3
Les effets produit et juge Les effets produit et juge ne
s’additionnent s’additionnent pas : interaction entre
ces 2 facteurs
Interaction :
l’effet d’un facteur sur Y diffère selon les modalités de l’autre
6
Exemple : 2 parcelles, 3 variétés de rose
i=1,..,2 j=1,…,3 k=1,2
Effet parcelle
2
2 0
1
1 0
9
Exemple : 2 parcelles, 3 variétés de rose
Effet variété
1<0 2 0 3 0 10
Exemple : 2 parcelles, 3 variétés de rose
1<0 2 0 3 0
Interaction
1<0 2 0 3 0
11 0 12 0 13 0 21 0 22 0 23 0 11
Exemple : 2 parcelles, 3 variétés de rose
2
1<0 2 0 3 0
11 0 12 0 13 0 21 0 22 0 23 0
1<0 2 0 3 0
11<0 12 0 13 0 21 0 22 0 23 0 12
111 0
Exemple : 2 parcelles, 3 variétés de rose
On ne dispose que de l’info suivante : la taille de chaque fleur, sa
variété et la parcelle dans laquelle elle est cultivée
y221
y212 y222 y231 y
y211 232
y121 y122 y131 y
132
y112
y111
Et on cherche à estimer :
: la taille moyenne des fleurs (quelle que soit la parcelle et la variété)
: l’effet de la parcelle i
j : l’effet de la variété j
ij : l’effet de l’interaction variété - parcelle
13
Définition du modèle à 2 facteurs
Écriture du
modèle sous
forme indicée
effet moyen
effet principal du niveau i du facteur 1
effet principal du niveau j du facteur 2
effet de l’interaction des facteurs 1 et 2 pour les niveaux i et j
résiduelle
Écriture matricielle du modèle :
14
15
Contraintes
1 + I + J + IJ paramètres mais IJ paramètres indépendants
modèle sur-paramétré besoin de contraintes
Contraintes :
1 = 0
La modalité 1 du 1er facteur sert de référence
1 =0 La modalité 1 du 2ème facteur sert de référence
∀ , 1 = 0 Les interactions avec les modalités 1 du 1er et
∀ , 1 =0 du 2ème facteur servent de référence
Il est extrêmement difficile d’interpréter les coefficients estimés
avec ces contraintes pour des modèles avec interactions
(l’interprétation d’un coefficient dépend du modèle)
ATTENTION : ces contraintes sont utilisées par défaut dans R
ne pas utiliser les fonctions par défaut
16
Contraintes
1 + I + J + IJ paramètres mais IJ paramètres indépendants
modèle sur-paramétré besoin de contraintes
Contraintes : Exemple :
17
18
Estimation des paramètres du modèle
par la méthode des moindres carrés
Minimiser revient à minimiser = ′
, , = ′ ′
Annulons la dérivée par rapport à pour trouver le minimum
Règles de calcul pour
! "² ! %&% ! % & '$ ! $& ' & % ! $& ' & '$
= =0 dérivation matricielle
!$ !$ !$ !$ !$
0 =0 ( ′) ( )′
= =
() ()
= ( ) ′ ( )
= = ′
() ()
X’X non inversible : sur-paramétrisation (besoin de contraintes)
X’X inversible : l’estimateur de est :
Propriétés :
19
Estimation des paramètres du modèle
Prédiction et résidus
Valeurs prédites :
Résidus :
Estimateur de la variabilité résiduelle
∑, , -
*+ =
………….
Propriété :
20
Estimation des paramètres du modèle
Cas particulier du plan équilibré (complet équirépété) :
21
Décomposition de la variabilité
Cas complet et équirépété : les SC s’additionnent
I-1
n-1 J-1
(I-1)(J-1)
ddlR
22
Test global d’un effet
Test du facteur A :
Hypothèses :
Idée : ………………………………………
23
Test global d’un effet
Test du facteur A :
Hypothèses :
Statistique de test :
Si
0.6
rejet de
0.4
0.2
0.0
0 2 4 6
f 24
Rejet
Test global d’un effet
Test de l’interaction AB :
Hypothèses :
Statistique de test :
Si
0.6
rejet de
0.4
0.2
0.0 0 2 4 25
6
f
Rejet
Test de conformité d’un coefficient
Hypothèses :
On sait que : avec
d’où :
0.3
Statistique de test :
0.2
Si
0.1
Décision : si
0.0
rejet de
-6 -4 -2 0 2 4 6
Rejet Rejet
Intervalle de confiance :
26
Exemple
library(FactoMineR)
AovSum(Note ~ Produit+Juge+Produit:Juge,data=donnees)
Prod Juge Note $Ftest Sum Sq Df CM F value Pr(>F)
P1 J1 1 Prod 12.0000 1 12.0000 9 0.02401 *
P1 J1 3 Juge 8.0000 2 4.0000 3 0.12500
P1 J2 1 Prod:Juge 8.0000 2 4.0000 3 0.12500
P1 J2 1 Residuals 8.0000 6 1.3333
P1 J3 2 ---
P1 J3 4 $Ttest Estimate Std.Error t value Pr(>|t|)
P2 J1 2 (Intercept) 3.0 0.333 9.0 0.000
P2 J1 2 Prod - P1 -1.0 0.333 -3.0 0.024
P2 J2 4 Prod - P2 1.0 0.333 3.0 0.024
P2 J2 6 Juge - J1 0.0 0.471 -2.121 0.078
P2 J3 4 Juge - J2 0.0 0.471 0.0 1.000
P2 J3 6 Juge - J3 1.0 0.471 2.121 0.078
Prod-P1 : Juge-J1 1.0 0.471 2.121 0.078
Prod-P2 : Juge-J1 -1.0 0.471 -2.121 0.078
Prod-P1 : Juge-J2 -1.0 0.471 -2.121 0.078
Prod-P2 : Juge-J2 1.0 0.471 2.121 0.078
Prod-P1 : Juge-J3 0.0 0.471 0.0 1.000
Prod-P2 : Juge-J3 0.0 0.471 0.0 1.000
27
Extension de l’analyse de variance
Généralisation immédiate à un nombre
quelconque de facteurs
Si les données sont déséquilibrées :
•
• les SC ne s’additionnent plus
• dépendent du modèle
28
Modèle linéaire
Contextes d’application
Modèle de régression
• Sources de variabilité quantitatives
Modèle d’analyse de la variance
• Sources de variabilité qualitatives
Modèle d’analyse de covariance
• Sources de variabilité de natures différentes
Tous ces modèles sont des modèles linéaires
29
Analyse des résidus
Homoscédasticité Normalité des
des résidus ? résidus ?
40
5
30
Frequency
20
0
10
-5
1 2 3
-2 0 2 4 6
Test Bartlett Tests Shapiro-Wilks, yKolmogorov,
30