Analyse de la variance :
ANOVA un facteur
SirRonaldFischer18901962
Thmes
Le modle linaire gnral
Les postulats de base
La logique de lanalyse de la variance
Exemples
Les tests post-hocs
La taille deffet
Le modle gnral linaire
Xij = + j + eij
Exemple:lataillemoyenne
deshommesest68etla
taillemoyennedesfemmes
est65
Latailledunhommesera
donc:
66.5+1.5+e
etlatailledunefemme:
66.51.5+e
Xij - la valeur observe pour le
sujet i du groupe j
- la grande moyenne
j - linfluence du traitement
sur le groupe j (j = j - )
eij - lerreur ou les rsidus -
selon les postulats - sont
distribus de manire normale
avec une moyenne de = 0 et
un cart-type de .
Rpartition des variances
xij=+j+eijavec
: X
j:
eij:
Donc:
ij
Xj
xij X X j X xij X j
Les sommes des carrs
ij
x
x
ij
ij
X
2
n X
x
2
ij
Xj
ij
X x ij X j
2
X j
SCtotal SCeffect SCerreur
Les postulats de base
1. Le modle gnral sapplique aux donnes
2. Les valeurs sont distribues normalement
dans la population
3. Les chantillons ont des variances
homognes
4. Les chantillons sont indpendants
La logique de lANOVA
chantillon
Population
Moyenne
Variance
I2
I2
I2
I2
La logique de lANOVA (suite)
Les variances des diffrents chantillons sont donc
gales et elles sont gales la variance de la
population p.
1 = 2 = ... = ij = p avec
1 = s1 =
i1 X1
Nous pouvons donc
la variance de la population
n1 estimer
1
partir de la moyenne des variances des chantillons ou bien:
ij
NJ
Selon le thorme des limites centrales: la
distribution dchantillonnage a une moyenne
de et une variance de 2 /n
si lhypothse nulle est vraie il suit donc que:
2
2
X
j
2
p
Es2x E
x
J 1
n
pour lestim de p 2 il faut multiplier par n
n j Xj X
J 1
Exemple
Afin de tester lhypothse que la consommation de cafine
facilite lapprentissage trois groupes dtudiants se
prparent un examen: le groupe 1 boit une tasse, le
groupe 2 boit 2 tasses et le groupe 3 boit 3 tasses de caf.
Voici leurs scores lexamen:
Groupe1
Groupe2
Groupe3
50
48
57
42
47
59
53
65
48
45
59
46
55
51
45
m=49
m=56
m=51
Exemple suite
70
60
50
40
30
0
2
Groupe
Sommes des carrs moyens
Intragroupe:
Xj
ij
NJ
x ij Xj
2
2
2
2
50 49 42 49 ... 46 51 45 51
15 3
NJ
1 49 ... 25 36 468
39
12
12
Intergroupe:
n Xj X
J 1
549 52 556 52 551 52
2
3 1
59 16 1
65
2
Calcul de F
SCMint er 65
1.667
SCMint ra 39
Valeurcritiquepour2,12dfet=.05>3.89
Exemple 2
Groupe1
Groupe2
Groupe3
47
55
54
53
54
50
49
58
51
50
61
51
46
52
49
m=49
m=56
m=51
Suite
65
60
55
50
45
40
35
30
0
2
Groupe
Sommes des carrs moyens
Intragroupe:
Xj
ij
NJ
x ij Xj
2
2
2
2
47 49 53 49 ... 51 51 49 51
15 3
NJ
4 16 ... 0 4 94
7.83
12
12
Intergroupe:
n Xj X
J 1
549 52 556 52 551 52
2
3 1
59 16 1
65
2
Calcul de F
SCMint er
65
F
8.3
SCMint ra 7.83
Valeurcritiquepour2,12dfet=.05>3.89
Tableau ANOVA
Source
SC
df
SCM
Intergroup
130
65
8.3
.005
Intragroup
94
12
7.84
Total
224
14
Rsum
Lavarianceintragroupe(lasommemoyennedescartscarrsentre
chaqueobservationetlamoyennedugroupe)estunestimdela
variancedelapopulation.
Quandlhypothsenulleestvraieetseulementdanscecasla
varianceintergroupe(lasommemoyennedescartscarrsentre
chaquemoyennedegroupeetlagrandemoyenne)est,selonle
thormedeslimitescentrales,aussiunestimdelavariancedela
population
Quandilyauneffetdetraitement,doncquandlhypothsenulleest
fausse,lavarianceintergroupeestpluslargequelavarianceintra
groupe
Lanalysedelavarianceconsistecalculerlerapportentrelavariance
intergroupeetlavarianceintragroupeetdecomparerlersultatavec
unedistributiondchantillonnageconnue:ladistributionF.
Les tests post-hocs
Erreurs
Erreur (ou ) par comparaison - le niveau choisi
pour une seule comparaison de moyennes
Erreur par famille - le nombre moyen des erreurs
faites par famille de comparaisons
1- (1-)c C
Exemple: = .01 et C = 5
= .049 ou approx. .05
Contraste
Dfinition: Une comparaison de J moyennes
telle que la diffrence entre deux des J
moyennes ou la diffrence entre une moyenne
et la moyenne de deux autres moyennes
c11c22cjjcjj
Excursion - Orthogonalit
Une comparaison est orthogonale si:
(c1jc2j)/nj= 0
Exemple:
jth moyenne
1
2
3
4
C 1:
1 -1
0
0
C2:
1
0
-1
0
C3:
0
0
1
-1
1 vs 2: c1jc2j =(1)(1) + (-1)(0) + (0)(-1) + (0)(0) = 1
1 vs 3: c1jc2j =(1)(0) + (-1)(0) + (0)(1) + (0)(-1) = 0
Tukeys-HSD
(John Tukey, 1915-2000)
HSD qk ,df ,
SCMintra
n
7.83
HSD 3.77
4.72
5
La taille deffet
Taille de leffet
La corrlation entre la VI et la VD (r)
Le pourcentage de la variance de la VD
expliqu par la VI (r2)
La diffrence entre deux moyennes en
units dcart-type (d)
Taille deffet: eta2 et omega2
2
F dfeffet
F df df
effet
erreur
SCeffet
SCtotal
SStreat k 1MSerreur
SStotal MSerreur
2
2
f
1 2
Treatment Outcome
Alive
D ead
Treatm
ent
66
34
100
Control
34
66
100
100
100
Les tailles
Puissance
La probabilit de trouver un effet de taille x dans
un chantillon de taille N en utilisant un test
statistique avec un donn.
0.09
0.08
0.07
0.06
0.05
Fcrit=2.58
0.04
0.03
0.02
0.01
0
0
10
Value of F
12
14
16
18
Les erreurs
Taille deffet et beta
Variance et beta
Calcul de
puissance
Calcul de puissance
http://members.aol.com/johnp71/
javastat.html#Power