L’Analyse de Variance 1
1. Généralités
2. Le modèle
3. Calculs pratiques
4. Conditions d’application de l’ANOVA
5. Mesure de la décomposition de la SCE
L’Analyse de Variance 1
1. Généralités
Le modèle linéaire simple
Projection :
Y = a + bX1 + b2X2 +….+ ei
X continue: régression linéaire simple
X discrète: ANOVA
Combinaisons: régression multiple, ANOVA2, ANCOVA
Les erreurs suivent une distribution :
normale
centrée
de variance constante
et sont indépendantes
L’Analyse de Variance 1
1. Généralités
Quand utiliser l’ANOVA
Fréquence
Pour tester l’effet d’une
variable explicative discrète
variable explicative = facteur
et chaque facteur a plusieurs
niveaux ou traitements
l’ANOVA teste si toutes les mC mN mN+P
moyennes sont égales Rendement
Témoin
Expérimental (N)
Expérimental (N+P)
L’Analyse de Variance 1
1. Généralités mN+P
Fréquence
Possibilités et limites
Permet de tester si
toutes les moyennes
sont égales (au niveau mC mN
a)...
Fréquence
…mais si on rejette H0,
l’ANOVA ne dit pas
lesquelles
mC mN mN+P
Rendement
L’Analyse de Variance 1
1. Généralités
Types d’ANOVA
Fixe : les traitements sont déterminés (manipulés)
par le chercheur
Aléatoires : les modalités sont choisies au hasard
dans une population de modalités: on peut estimer
l’effet du facteur pour d’autres modalités non étudiées
Données identiques, modèles différents, calculs
identiques mais seulement pour l’ANOVA à un critère
de classification!
L’Analyse de Variance 1
1. Généralités
ANOVA fixe :
rendement agricole
sable argile terreau
21 16 23
20 18 31
16 11 24
ni 3 3 3 9 =N
Ti. 57 45 78 180 = T
yi. 19 15 26 20
L’Analyse de Variance 1
1. Généralités
ANOVA aléatoire:
poids de l’ours noir
280
240
variable dépendante est
Poids (kg)
le poids, 200
160
facteur (X) = site, p=3
120
Question = effet site,
Riding Kluane Algonquin
au-delà des sites étudiés
Mountain
L’Analyse de Variance 1
2. Le modèle
Y Les p moyennes sont-
elles identiques?
Les modalités de A
m ai influencent-elles Y?
e ij
Yij m a i eij
A1 A2 A3 A4
m moyenne de Y
a i effet de la ième modalité
(constante). Ho : ai = 0
e ij erreur aléatoire
L’Analyse de Variance 1
2. Le modèle
Dans une ANOVA, la variance totale est répartie en
deux composantes:
intergroupe: variance des moyennes des différents
groupes (traitements)
intragroupe (erreur): variance des observations
autour de la moyenne du groupe
L’Analyse de Variance 1
2. Le modèle
Répartition de la somme des carrés totale
m2
Y m
m3
m1
SC Totale SC Modèle (Groupes) SC Erreur
Groupe 1
Groupe 2
Groupe 3
L’Analyse de Variance 1
2. Le modèle
Décomposition de la Somme des Carrés
des Ecarts (SCE)
Ho : les p moyennes sont égales
Ha : au moins une moyenne diffère des autres
SCET = SCEA + SCER(=E)
p ni p ni p ni
ij .. i. .. ij i.
(Y Y ) 2
(Y Y ) 2
(Y Y ) 2
i1 j1 i1 j1 i1 j1
= SCEinter + SCEintra
= SCEB + SCEW
L’Analyse de Variance 1
2. Le modèle
Tableau d’ANOVA
Sources Somme Degré de Carré F
de variation des carrés liberté (ddl) moyen (CM)
k ni
(Yij Y )
2
Totale n-1 SCET/ddl
i 1 j1
k CMA
n i (Y i Y )
2
Facteur p-1 SCEA/ddl
i 1 CMR
k ni
Y i j Yi
2
Résidus ( ) n-p SCER/ddl
i1 j 1
L’Analyse de Variance 1
2. Le modèle F plus petit mN+P
Frequence
CMintergroupe mesure les mC mN
différences moyennes au F plus grand
Frequence
carré entre moyennes des
groupes
CMrésiduel est une mesure de la
précision
mC mN mN+P
Rendement
L’Analyse de Variance 1
2. Le modèle F plus petit mN+P
Frequence
L’hypothèse nulle
H0: les moyennes de tous les
groupes sont les mêmes, ou mC mN
H0: il n’y a pas d’effet des F plus grand
Frequence
groupes, ai =0 , ou
H0: F = CMintergroupe/ CMerreur = 1
pour p groupes et pour un
nombre d’observations N, on
compare avec la distribution
de F au niveau a avec p - 1 et
N - p degrés de liberté mC mN mN+P
Rendement
L’Analyse de Variance 1
3. Calculs pratiques
SCET (Yij Y ) 2 Yij Y 2 2YijY
2
ij ij ij ij
Yij NY 2 2Y Yij
2
, or : Y ij NY
ij
ij ij
Yij NY
2 2 2
SCET Yij
2 T
ij
N
ij
SCE A (Yi. Y ) 2 n i (Yi. Y ) 2
2 2
Ti. T
ij i
SCE A
i ni N
SCE R SCET SCE A
L’Analyse de Variance 1
3. Calculs pratiques
Exemple
sable argile terreau
21 16 23
20 18 31
16 11 24
Ti. 57 45 78 180
2
180
SCET 212 20 2 .... = 264
9
57 2 45 2 180 2 = 186
SCE A ....
3 3 9
L’Analyse de Variance 1
3. Calculs pratiques
Exemple
SV SCE ddl CM F
A 186 2 93 7,15
R 78 6 13
T 264 8
F2
6,a 0,05 5,14
L’Analyse de Variance 1
4. Conditions d’application de l’ANOVA
eij aléatoires = indépendants et chaque eij : N (0, )
2
- indépendants : plan d’expérience :
• modalités indépendantes
• individus indépendants : pas de double mesure, tirage au
hasard
- de moyenne nulle : par construction
- de distribution normale : normalité de Y? étude graphique (TP)
- de même variance : homoscédasticité
L’Analyse de Variance 1
4. Conditions d’application de l’ANOVA
Ces conditions s’appliquent aux résidus et non aux
données brutes
…on doit tester les conditions d’application après que
l’analyse soit faite et que les résidus soient obtenus
L’Analyse de Variance 1
5. Mesure de la décomposition de la SCE
Part de la variabilité de Y expliquée par l’ANOVA :
SCE A
2 0 2 1
SCE T
NB:2 inclue
* SCET expliquée de façon linéaire : r2
* SCET expliquée de façon non linéaire : 2-r2
2 ≥ r2
L’Analyse de Variance 1
5. Mesure de la décomposition de la SCE
Exemple
Part de la variabilité du rendement
expliqué par le sol:
186
2
0,70
264