0% ont trouvé ce document utile (0 vote)
59 vues54 pages

Anova

Ce mémoire présente une analyse de la variance multivariée (MANOVA) et un examen approfondi de l'ANOVA à un et deux facteurs. Il aborde les principes, les types d'ANOVA, ainsi que les tests d'hypothèses associés, tout en incluant des applications pratiques sous le logiciel R. L'objectif principal est d'étudier l'effet de plusieurs variables qualitatives sur des variables quantitatives et multidimensionnelles.

Transféré par

bintoubarry3105
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
59 vues54 pages

Anova

Ce mémoire présente une analyse de la variance multivariée (MANOVA) et un examen approfondi de l'ANOVA à un et deux facteurs. Il aborde les principes, les types d'ANOVA, ainsi que les tests d'hypothèses associés, tout en incluant des applications pratiques sous le logiciel R. L'objectif principal est d'étudier l'effet de plusieurs variables qualitatives sur des variables quantitatives et multidimensionnelles.

Transféré par

bintoubarry3105
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

République Algérienne Démocratique et Populaire

Ministère de l’Enseignement Supérieur et de la Recherche Scienti…que

UNIVERSITÉ MOHAMED KHIDER, BISKRA


FACULTÉ des SCIENCES EXACTES et des SCIENCES de la NATURE et de la VIE

DÉPARTEMENT DE MATHÉMATIQUES

Mémoire présenté en vue de l’obtention du Diplôme :

MASTER en Mathématiques

Option : Statistique

Par
BESSIOUD Ziad

Titre :

Analyse de la variance multivariée


Membres du Comité d’Examen :
Pr. Meraghni Djamel UMKB Président

Dr. ROUBI A¤ef UMKB Encadreur

Dr. Hassouna Houda UMKB Examinateur

Juin 2018
Dédicace

Je dédie ce travail modeste :


A mes chèrs parants ,qui ont bien élevés, aidés, soutenus et encouragés durant toutes ces
années d’étude, qu’AllAh la protège .

A mes très chers fréres .


A mes très chéres soeurs
A mes amis durant mes années d’études qui ma beacoup encouragé
-A toutes mes pro¤eseurs que j’ai connus durant mes études.
-A mes connaissances de proche ou de loin .
-A tous ceux que J’aime et me souhaitent la réussite pour toute ma vie .
Bessioud ziad

i
REMERCIEMENTS

Louange à Allah , seigneur de l’univers, Avant tout puissant de m’avior donné la volonté
et la force pour réaliser ce travail et sans qui ce travail n’aurait , sans doute , pas pu voir
le jour Mes vifs remerciments sont adressés à mon encadreur Madame Roubi A¤ef pour
ces conseils et ces orientations qui m’ont été d’une grande utilité au cours de l’élaboration
de mon mémoire .
Je tiens à remercie spécialement Monsieur Meraghni Djamel ( Pro¤esur à l’université de
Biskra) qui m’a fait l’honneur de présider mon jury de mémoire .
Je tiens à remercie également Mademoisselle Hassouna Houda pour avoir pris le temps de
lire et juger ce travail.
Je remercie tous les enseignants qui aider pour …naliser ce travail surtout le pro¤eseur
Meraghni Djamel et Mon encadreur Roubi A¤ef
Ainsi que tous les employé du Département de Mathématique .
Je remercie tout particulièrement mes parents pour leurs encouragements et soutien sur
tous les aspects et aussi tout ma famille .
Je remercie tous ceux qui ont …nalisé ce mémoire soit de prés du loin.

ii
Table des matières

Remerciements ii

Table des matières ii

Liste des …gures v

Introduction 1

1 Analyse de la variance univariée 3


1.1 Généralité sur l’ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1 Di¤érents types D’ANOVA . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Les principes d’ANOVA . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Analyse de la variance à un facteur (ANOVA 1) . . . . . . . . . . . . . . . 4
1.2.1 Structure des données . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2 Modèle d’ANOVA 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.3 L’équation fondamentale d’ANOVA 1 . . . . . . . . . . . . . . . . . 6
1.2.4 Tests d’hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Analyse de la variance à 2 facteurs (ANOVA 2) . . . . . . . . . . . . . . . 9
1.3.1 Les étapes de L’ANOVA 2 . . . . . . . . . . . . . . . . . . . . . . . 12

2 Analyse de la variance multivariée à deux facteurs (MANOVA 2) 16


2.1 Généralité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

iii
Table des matières

2.2 Présentation des données d’une MANOVA 2 . . . . . . . . . . . . . . . . . 18


2.3 Modèle de MANOVA 2 à e¤ets …xe avec interaction . . . . . . . . . . . . . 18
2.4 Tests d’hypothèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4.1 Le test de Wilks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4.2 Autres tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4.3 Le test de Roy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4.4 Le test de Pillai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4.5 Le test de lawley -Hotelling . . . . . . . . . . . . . . . . . . . . . . 23
2.5 Exemple d’application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3 Application Numérique sous logiciel R 28


3.1 Exemple 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2 Exemple 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.1 Application de L’ANOVA 2 . . . . . . . . . . . . . . . . . . . . . . 32
3.2.2 Application de MANOVA 2 . . . . . . . . . . . . . . . . . . . . . . 33

Conclusion 36

Bibliographie 37

Annexe A : Logiciel R 39
3.3 Rappel sur l’algèbre linéaire [3; 9] . . . . . . . . . . . . . . . . . . . . . . . 39
3.4 Rappel sur les statistiques multidimensionnelles [7] . . . . . . . . . . . . . 43
3.4.1 Notations matricielles de vecteurs aléatoires . . . . . . . . . . . . . 43
3.4.2 Lois de Gauss multivariée[7; 9] . . . . . . . . . . . . . . . . . . . . . 44
3.5 Rappel sur quelque distributions [9] . . . . . . . . . . . . . . . . . . . . . . 45

Annexe B : Abréviations et Notations 47

iv
Table des …gures

3.1 Radicules et épicotyles des graines germées. . . . . . . . . . . . . . . . . . 31

v
Introduction

La Statistique est la science qui à partir de l’observation des phénomènes on peut obtenir
des informations ; elle utilise principalement les méthodes de la statistique mathématique
pour obtenir des résultats qui forment l’information statistique, ils peuvent porter sur
tous les domaines : économie, médecine, technique...etc. Dont le rôle de statisticien est de
prendre des décisions sur la base de résultats expérimentaux, en étant conscient [Link] y’
a un risque d’erreur lié à l’incertitude des observations ou des résultats expérimentaux,
avant de prendre une telle décision, il testera une hypothèse statistique correspondant à
son problème.

Dans le cadre des tests d’hypothèses, nous avons émis des hypothèses concernant la
moyenne d’une population puis comparé les moyennes de deux populations. L’analyse
de la variance (ANOVA) est la méthode employée pour comparer plusieurs moyennes. Au
cœur de cette méthode est la décomposition de la variabilité totale selon les di¤érentes
sources présentes dans les données. La variabilité totale est décomposée en deux sources :
la variabilité intra dûe à l’erreur expérimentale et la variabilité inter dûe aux écarts de
moyenne entre les di¤érentes modalités d’un facteur.

Une autre méthode appelée analyse de la variance multiple (MANOVA) sert à comparer
des moyennes mais des moyennes vectorielles de plusieurs échantillons, ou d’une autre
façon elle permet d’étudier l’e¤et d’un ou des plusieurs variables qualitatives (facteurs)
sur une variable multidimensionnelle.

L’objectif de ce mémoire est d’étudier le cas où deux facteurs se présentent. Pour arriver

1
Introduction

à la réalisation de nos objectifs, nous proposons le plan de ce mémoire suivant

Chapitre 1 : Nous traitons dans ce chapitre, la technique d’analyse de la variance à un


et à deux facteurs (ANOVA 1 et ANOVA 2), leurs di¤érentes types, principes, ainsi leurs
di¤érentes étapes.

Chapitre 2 : Ce chapitre est consacré à l’étude en détails de la méthode de l’analyse de


la variance multiple à deux facteurs (MANOVA 2).

Chapitre 3 : Ce dernier chapitre est consacré à l’application de tous ce que nous avons
parlé dans les chapitres précédents sur des données réelles sous le logiciel R.

2
Chapitre 1

Analyse de la variance univariée

Ce chapitre est consacré à une méthode statistique appelée l’analyse de la variance (ANOVA)
qui a pour objectif d’étudier l’e¤et d’un ou de plusieurs variables qualitatives sur une va-
raible quantitative.

1.1 Généralité sur l’ANOVA

Dans cette section ,on va parler sur l’analyse de la variance (ANOVA), leurs types et ses
principes.

1.1.1 Di¤ érents types D’ANOVA

Il existe trois types d’ANOVA

Type 1 (e¤ets …xes)

Les traitements sont déterminés par le chercheur.

Type 2 (e¤ets aléatoires)

Les traitements ne sont pas sous le controle de l’expérimentateur .

3
Chapitre 1. Analyse de la variance univariée

Type 03 (modèle mixte)

Au moins un facteur du type 1 et au moins un du type 2.

1.1.2 Les principes d’ANOVA

L’analyse de la variance a pour objectif de tester l’e¤et d’un ou de plusieurs variables


qualitatives sur une variable aléatoire continue.
Chaque variable qualitative est appellé un facteur et chaque facteur peut avoir deux ou
plusieurs niveaux ou traitements.
Une
8 ANOVA teste si toutes les moyennes sont égales donc
>
< H0 : égalité.
.
>
: H1 : au moins une di¤érence .
A utiliser quand le nombre de niveaux est supérieur à deux.

Conditions d’applications de l’ANOVA

IL y a trois conditions pour l’application d’ANOVA

1 / Indépandance les échantillons comparés sont indépendants .

2 / Homoscédasticité les échantillons comparés ont même variance (Homogénéité des


variances). Il y’a plusieurs tests permettent de tester l’égalité de plusieurs variances (le
test le plus utilisé est le test de Bartlett ).

1.2 Analyse de la variance à un facteur (ANOVA 1)

Dé…nition 1.2.1 L’analyse de la variance à un facteur nous permet de tester l’e¤et d’un
facteur contrôlé A ayant p modalités sur les moyennes d’une variable quantitative Y .

4
Chapitre 1. Analyse de la variance univariée

Facteur A1 A2 ::: Ai ::: Ap


Y11 Y21 ::: Yi1 ::: Yp1
Y12 Y22 ::: Yi2 ::: Yp2
.. .. .. ..
. . ::: . ::: .
Y1n1 Y2n2 ::: Yini ::: Ypnp
Moyennes Y 1 Y2 Yi Yp

Tab. 1.1 –Les données d’ANOVA 1.

1.2.1 Structure des données

Un facteur contrôlé A se présente sous p modalités, chacune d’entre elles étant notée Ai .
Pour chacune des modalités nous e¤ectuons ni >2 mesures d’une réponse Y qui est une
p
X
varible continue. Nous notons n = ni le nombre total de mesures ayants été e¤ectuées.
i=1
Les données relatives à une analyse de variance à un facteur contrôlé sont structurées dans
un tableau du type suivant
Conséderons p échantillons Yi d’e¤ectifs ni , issu des p populations qui suivent p lois nor-
2
males N ( i ; ) de même variance. Chaque observation s’écrit Yij , avec

i = 1; p et j = 1; ni .

L’e¤ectif total est


p
X
n= ni .
i=1

Moyenne de chaque échantillon

n
1X i 2
Yi = Yij v N i; ; i = 1; : : : ; p.
ni j=1 ni

Globalement, la moyenne de toutes les observations

p n p
1 XX i 2
1X
Y = Yij v N ; avec = (ni i ) .
n i=1 j=1 n n i=1

5
Chapitre 1. Analyse de la variance univariée

Variance de chaque échantillon

n
1X i
2
s2i (Y ) = Yij Yi ; i = 1; : : : ; p.
ni j=1

Variance de toutes les observations

p n
2 1 XX i
2
s (Y ) = Yij Y .
n i=1 j=1

1.2.2 Modèle d’ANOVA 1


p
X
1
Soit = n
(ni i ) et i = E [Yi ] En terme d’observation on a
i=1

Yij Y = Yij Y i + Y i Y ,
| {z } | {z } | {z }
écart total écart résiduel écart factoriel

Le modèle théorique et
Yij = Yij + i

= "ij est l’e¤et résiduel


Yij i
.
i = i est l’e¤et principal
Nous introduisons le modèle

Yij = + i + "ij ; i = 1; :::; p; j = 1; :::; ni ;

p
X
avec "ij v N ( ; 2
) et la contrainte supplémentaire i = 0:
i=1

1.2.3 L’équation fondamentale d’ANOVA 1

A partir du modèle fondamentale

Yij = + i + "ij

6
Chapitre 1. Analyse de la variance univariée

et avec les estimateurs des paramètres des modèles


Sous H0
Yij = + "ij , b = Y ;

Sous H1
Yij = + i + "ij , b + bi = Y i ;

d’où
8
>
< bi = Y i Y
>
: "b = Y b bi = Yij Yi
ij ij
en remarquant que
Yij Y = Yij Yi+Yi Y,

il vient facilement

p n p n p
1 XX i
2 1 XX i
2 1X 2
Yij Y = Yij Yi + ni Y i Y .
n i=1 j=1 n i=1 j=1 n i=1

Remarque 1.2.1 L’equation ne contient pas de double produit car la somme des doubles
produits est nulle en raison de la nullité de la somme de écarts par rapport à la moyenne

En e¤et

p ni ni
" p
#
X X X X
2 Yij Yi Yi Y =2 Yi Y Yij Yi = 0.
i=1 j=1 j=1 i=1

formule qui n’est autre que celle de la variance totale décomposée en variance des moyennes
et moyenne des variances

p n p p
2 1 XX i
2 1X 2 1X 2
s (Y ) = Yij Yi = Yi Y + s (Y ) (2:1)
n i=1 j=1 p i=1 p i=1 i

on multiple l’équation (2:1) par n, on obtient l’équation fondamentale de l’analyse de la

7
Chapitre 1. Analyse de la variance univariée

variance !
p ni p p ni
X X 2 X 2 X X 2
Yij Y = ni Y i Y + Yij Yi ,
i=1 j=1 i=1 i=1 j=1
| {z } | {z } | {z }
SCT OT SCF ac SCRe s

SCF ac : est la variation due au facteur,

SCRe s : est la variation résiduelle,

SCT ot : est la variation totale.

On a alors la relation fondamentale de l’ANOVA

SCT ot = SCF ac + SCRe s .

On y associe des degrés de libertés

n 1 = (p 1) + (n p)

Les sommes des carrés des écarts peuvent être divisées par leur nombres de degré de liberté
respectifs,
8 on obtient alors, les carrés moyens
>
>
>
> CMT ot = SCT ot (n 1)
<
CMF ac = SCF ac (p 1) :
>
>
>
>
: CMRe s = SCRe s (n p)

1.2.4 Tests d’hypothèses

Nous construisons le tableau d’analyse de la variance à partir des informations précédentes


F comparée à f , obtenue à l’aide d’une table de Fisher pour un seuil donné , avec la
2
loi de Fisher étant dé…nie comme le rapport de deux lois du .
Nous souhaitons faire le test d’hypothèse suivant

8
Chapitre 1. Analyse de la variance univariée

Sources de variation ddl Sommes des carrés Carrés moyens F Décision


CMF ac
Inter-group (Fac) p 1 SCF ac CMF ac F = CMRe s
H0 ou H1
Intra-group (Rés) n p SCRe s CMRe s
Total n 1 SCT ot

Tab. 1.2 –Tableau d’analyse de variance à un facteur.


8 8
>
< H0 : 1 = 2 = >
< H0 : 1 = 2 =
= p= , = p = 0,
() .
>
: H1 : 9 (k; l) 2 f1; 2; :::; pg tel que 6= l , >
: H1 : 9i 2 f1; 2; :::; pg tel que 6= 0.
K i
On a

SCF ac SCRe s CMF ac


CMF ac = v 2
p 1; CMRe s = v 2
n p et F = v F (p 1; n p) .
p 1 n p CMRe s

Nous concluons alors à l’aide des tables, en utilisant le quantille f de loi de Fisher à p 1
et n p degrés de liberté que
si F < f on dit que H0 est accepté et on conclut qu’il n’existe pas une in‡uence signi…-
cative du facteur A.
si F f , on a H0 est rejetée et conclut qu’il existe une in‡uence signi…cative du facteur
A.
Nous concluons alors à l’aide de la p-valeur, rejet de H0 si elle est inférieure ou égale au
seuil du test.
Lorsque l’hypothèse nulle H0 est rejetée, nous pouvons procéder à des comparaisons mul-
tiples des di¤érents e¤ets des niveaux du facteur.

1.3 Analyse de la variance à 2 facteurs (ANOVA 2)

Cette section est consacrée à l’étude des situations expérimentales dans lesquelles l’e¤et de
deux facteurs (variables qualitatives) est étudié simultanément, c’est-à-dire dans le même
protocole expérimental. En cela, elle constitue une extension à la situation précédente dans
laquelle on n’étudiait qu ’un seul facteur à la fois (ANOVA d’ordre 1).

9
Chapitre 1. Analyse de la variance univariée

N B1 B2 BJ
A1 Y111 Y121 Y1J1
Y112 Y122 Y1J2

Y11K Y12K Y1JK


A2 Y211 Y221 Y2J1
Y212 Y222 Y2J2
.. .. ..
. . .
Y21K Y2;2;K Y2;J;K
.. .. .. .. ..
. . . . .
AI YI11 YI21 YIJ1
YI12 YI22 YIJ2
.. .. .. ..
. . . .
YI1K YI2K YIJK

Tab. 1.3 –Les données d’ANOVA2 avec répétitions.

L’identi…cation de l’ANOVA d’ordre 2 ( ANOVA 2 ) au sens littéraire peut être résumé


dans la dé…nition suivante

Dé…nition 1.3.1 L’analyse de la variance à deux facteurs teste l’e¤et de deux facteurs
controlés A et B (variables qualitatives ) ayant respectivement I et J modalités sur les
moyennes d’une variable quantitative Y .

Les problèmes concernés par la technique ANOVA 2 se présentent en générale de la manière


suivante
et son modèle mathématique est donné par

Yijk = ij + ijk ; avec i = 1; J et k = 1; K, (1.1)

où Yijk est la k eme réalisation de la variable quantitative Y , lorsque on …xe le premier


facteur à la ieme modalité et le deuxième facteur à la j eme modalité et ijk sont les erreurs
de mesure (inconnues) de plus "ijk v N (0; 2
" ).

10
Chapitre 1. Analyse de la variance univariée

Ce modèle peut-être réécrit sous sa forme détaillée comme suit

Yijk = + ai + bj + cij + ijk , avec i = 1; I; j = 1; J et k = 1; K,

ce qui s’explique que la réalisation de la variable Y est un cumule d’une constante


(indépendante des deux facteurs), de l’e¤et du premier facteur A, de l’e¤et du deuxième
facteur B et de l’e¤et d’interaction des deux facteurs c et de l’erreur de mesure .
Si le modèle de référence retenu est le modèle (2.1), alors le test pour lequel nous intéressons
à réaliser sera8formulé comme suit 8
>
< f1; : : : ; Ig >
< i1 ; i2 2 f1; : : : ; Ig
H0 : "8i 2 ij = " contre H1 : "9 tel que
>
: j 2 f1; : : : ; Jg >
: j1 ; j2 2 f1; : : : ; Jg
i1 j1 6= i2 j2 ".

Par contre, si le modèle de référence retenu est le modèle (2:2), alors l’analyse de la variance
à deux facteurs avec répétitions consiste en réalisation de trois tests de Fisher à la fois,
dont la formulation est

1/ E¤et du premier facteur


H0 :"Les paramètres ai sont tous nuls " contre H1 : " les paramètres ai ne sont pas tous
nuls ".
2/ E¤et du second facteur
H0 :"Les paramètres bj sont tous nuls " contre H1 :"les paramètres bj ne sont pas tous
nuls ".

3/ E¤et de l’interaction des deux facteurs


H0 :" Les paramètres cij sont tous nuls " contre H 1 :"les paramètres cij ne sont pas tous
nuls ".

11
Chapitre 1. Analyse de la variance univariée

1.3.1 Les étapes de L’ANOVA 2

La mise en oeuvre d’une ANOVA 2, se fait principalement en 4 étapes. Les détails de ces
étapes sont comme suit

Étape 1 (Conditions)

A…n de réaliser une analyse de la variance à deux facteurs, les conditions suivantes doivent
être véri…ées préalablement
Les IJ échantillons comparés sont mutuellement indépendants.
La variable quantitative étudiée suit une loi normale dans les IJ populations comparées.
Les IJ populations comparées ont même variance : Homogénéité des variances.

Étape 2 (Moyennes et variances )

Quanti…er les di¤érentes statistiques intervenant dans L’ANOVA à deux facteurs et qui
sont
La moyenne globale de toutes les observations

1 XXX
I J K
Y ::: = Yijk avec n = IJK;
n i=1 j=1 k=1

Moyenne de chaque échantillon

1X
K
Y ij = Yijk pour i = 1; I et j = 1; J;
K k=1

Moyenne de chaque modalité du premier facteur

1 XX
J K
Yi = Yijk pour i = 1; I;
JK j=1 k=1

12
Chapitre 1. Analyse de la variance univariée

Moyenne de chaque modalité du deuxième facteur

1 XX
J K
Y j = Yijk pour i = 1; I;
IK i=1 k=1

La somme des carrés des erreurs totale

X
I X
J X
K
2
SCT ot = Yijk Y ::: ;
i=1 j=1 k=1

La somme des carrés des erreurs résiduelles

X
I X
J X
K
2
SCRe s = Yijk Y ij ;
i=1 j=1 k=1

La somme des carrés des erreurs du premier facteur

X
I X
J X
K
2
SCA = Yi Y ::: ;
i=1 j=1 k=1

la somme des carrés des erreurs des deux facteurs

X
I X
J X
K
2
SCB = Y j Y ::: ;
i=1 j=1 k=1

La somme des carrés des erreurs des deux facteurs

X
I X
J X
K
2
SCAB = Y ij Yi Y j + Y ::: ;
i=1 j=1 k=1

Avec le même raisonnement que dans l’ANOVA 1, on peut démontrer que la variation
quadratique totale des observations autour de la moyenne Y ::: peut être décomposée comme
suit
SCT ot = SCRe s + SCA + SCB + SCAB :

13
Chapitre 1. Analyse de la variance univariée

Étape 2 (Les carrés moyens)

A partir de la décompositon précédente, l’idée la plus naturelle est que le facteur ou


l’interaction des facteurs n’a pas d’impact sur le caractère étudié si la variation inter-
groupes (engendrée par les deux facteurs ou/et leurs interaction ) associée au caractère
est négligeable par rapport aux ‡uctuations individuelles. Pour comparer ces quantités,on
considère les carrés moyens suivants
SCRe s
Carré moyen due aux ‡uctuations individuelles : CMRe s = IJ(K 1)
.
SCA
Carré moyen de mesure de l’e¤et du premier facteur : CMA = (I 1)
.
SCB
Carré moyen de mesure de l’e¤et du second facteur : CMB = (J 1)
:
Carré moyen de mesure de l’e¤et de l’interaction entre les deux facteurs : CMAB =
SCAB
(I 1)(J 1)
:
Notons que, si les trois conditions citées précédemment (Indépandance,Normalité et Homogénéité)
sont véri…ées alors sous l’hypothèse H0

CMA
v F((I 1);IJ(K 1)) ;
CMRe s

CMB
v F((J 1);IJ(K 1)) ;
CMRe s
CMAB
v F((I 1)(J 1);IJ(K 1)) ;
CMRe s

Étape. 4 : (Décision)

Pour un seuil de risque ,nous quanti…ons les valeurs critiques fa , fb ; fc ( par la lecture
sur le table de Fisher ), telle que
CMA CMB CMAB
P CMRe s
< fa = 1 ;P CMRe s
< fb = 1 ;P CMRe s
< fc = 1 .
Ainsi les décisions des tests se font comme suit

CMA
Décision sur le premier facteur Si CMRe s
< fa ; alors le premier facteur n’a pas une
in‡uence signi…cative sur le caractère étudié.

14
Chapitre 1. Analyse de la variance univariée

Source de variation SC ddl CM Fobs Fisher


due à FA SCA (I 1) CMA CMA CMRe s fa
due à FB SCB (J 1) CMB CM B CMRe s fb
due à FA FB SCAB (I 1) (J 1) CMAB CMAB CMRe s fc
Résiduelle SCRe s IJ (K 1) CMRe s
Total SCT ot n 1

Tab. 1.4 –Tableau d’ANOVA 2 avec plan équilibré.

CMA
Si CMRe s
fa , alors le premier facteur a une in‡uence signi…cative sur le caractère
étudié.

CMB
Décision sur le deuxième facteur Si CMRe s
< fb , alors le deuxième facteur n’a pas
une in‡uence signi…cative sur le caractère étudié.
CM B
Si CMRe s
fb ; alors le deuxième facteur a une in‡uence signi…cative sur le caractère
étudié.

CMAB
Décision sur l’interaction des deux facteurs Si CMRe s
< fc , alors l’interaction
des deux facteurs n’a pas une in‡uence signi…cative sur le caractère étudié .
CMAB
Si CMRe s
fc , alors l’interaction des deux facteurs a une in‡uence signi…cative sur le
caractère étudié.

Remarque 1.3.1 Les résultats d’une ANOVA 2 sont souvent présentés dans un tableau
de la forme suivante

15
Chapitre 2

Analyse de la variance multivariée à


deux facteurs (MANOVA 2)

Dans ce chapitre on s’intéresse à la comparaison des vecteurs moyens par la méthode


MANOVA 2 (l’analyse de la variance multiple a deux facteurs) La MANOVA est souvent
considérée comme extension de l’anova à deux facteurs pour des situations où il ya deux
variables ou plus dépendantes. Le but principale du MANOVA 2 est de tester s’il y’a un
e¤et de l’ interaction entre les deux variables indépandantes sur deux variables ou plus
dépendantes.

2.1 Généralité

Dans le cas de l’analyse de la variance univariée, l’hypothèse nulle a été

H0 : 1 = 2 = = K,

où K représente le nombre total des niveaux du facteur.

16
Chapitre 2. Analyse de la variance multiple à deux facteurs ( MANOVA 2 )

Pour la MANOVA à un facteur, l’hypothèse nulle serait

H0 : 1 = 2 = = K,

où i (i = 1; K) est un vecteur des moyens.


Nous voulons tester si le vecteur des moyens est égale pour plusieurs groupes indépendants,
et notre nouvelle hypothèse nulle serait
0 1 0 1 0 1
B 11 C B 21 C B K1 C
B C B C B C
B 12 C B 22 C B K2 C
B C B C B C
H0 :B . C = B . C = = B . C,
B .. C B .. C B .. C
B C B C B C
@ A @ A @ A
1p 2p Kp

où p représente le nombre total de variables dépendantes pour les niveaux du facteur.


Rappelons que pour l’ANOVA, la statistique de test est le rapport entre les carrés moyens
associés au facteur et les carrés moyen résiduels.
Pour MANOVA 1 (Analyse de la variance multiple à un facteur ), notre statistique de test
est calculée comme le rapport entre les déterminants de deux matrices comme suit

jEj
= v p;#H ;#E , ( est une variable de Wilks de paramètre p est de degrés de liberté #H et #E ),
jT j

où jEj et jT j sont les déterminants des matrices des sommes carées et des produits rési-
duelles et totales respectivement, que nous les étudions dans la section suivante.
On rejette l’hypothèse H0 si p;#H ;#E .

Les paramètres dans la distrubution de Wilks sont


p : nombre des variables,
#E ,#H : sont les degrés de liberté associés au facteur et au résiduelle.

17
Chapitre 2. Analyse de la variance multiple à deux facteurs ( MANOVA 2 )

N B1 B2 BJ
A1 Y111 Y121 Y1J1
Y112 Y122 Y1J2
.. .. ..
. . .
Y11K Y12K Y1JK
A2 Y211 Y221 Y2J1
Y212 Y222 Y2J2
.. .. ..
. . .
Y21K Y22K Y2JK
.. .. .. .. ..
. . . . .
AI YI11 YI21 YIJ1
YI12 YI22 YIJ2
.. .. .. ..
. . . .
YI1K YI2K YIJK

Tab. 2.1 –Les données d’une MANOVA 2.

2.2 Présentation des données d’une MANOVA 2

Soient A et B deux facteurs à I et J niveaux respectivement, pour chaque combinaison de


ces deux facteurs, nous e¤ectuons K mesures d’un vecteur Y de dimension p. Les résultats
de l’expérience sont présentées sous la forme suivante

0
Yijk = (Yijk1 ; Yijk2 ; :::; Yijkp ) ; 8i = 1; I; 8j = 1; J; 8k = 1; K:

2.3 Modèle de MANOVA 2 à e¤ets …xe avec interac-

tion

Le modèle mathématique associé à chaque observation est donné par

Yijk = + ai + bj + cij + "ijk = ij + "ijk ,

i = 1; 2; : : : ; I, j = 1; 2; : : : ; J, k = 1; 2; : : : ; K,

où ai est l’e¤et du ieme niveau d’un facteur A sur chacune des p variables de Yijk , bj est

18
Chapitre 2. Analyse de la variance multiple à deux facteurs ( MANOVA 2 )

Source Somme des carrés et des produits df


de variation
P 0
A HA = KJ i (Yi Y ) Yi Y I 1
P 0
B HB = KI j Y j Y Yj Y J 1
P 0
AB HAB = K ij Yij Yi Yj Y Yij Yi Yj Y (I 1) (J 1)
P 0
Erreur E = ijk Yijk Yij Yijk Yij IJ (K 1)
P 0
Totale T = ijk Yijk Y Yijk Y IJK 1

Tab. 2.2 –Table d’analyse de la variance multiple à 2 facteurs.

l’e¤et du j eme niveau de B et cij est l’e¤et d’interaction. Nous utilisons les conditions

X X X X
ai = bj = cij = cij = 0,
i j i j

P
et les "ijk sont indépendamment et identiquementdistrubués selon la loi N p (0; ). Sous
P
la condition i ai = 0, l’e¤et de A est la moyenne sur les niveaux de B, donc ai = i ,
P P
où i = j ij J, et = ij ij IJ, il y’a des dé…nitions similaires pour bj et cij .
P
Comme dans le cas univarié, le vecteur moyen Yi est dé…ni par Yi = jk Y ijk KJ.
P
Les moyennes Y j , Yij , et Y , ont des dé…nitions analogues : Y j = ik Yijk KI,
P P
Yij = k Yijk =K, Y = ijk Yijk KIJ.
Le tableau de l’analyse de la variance multiple à deux facteurs contient les matrices des
sommes carrés et des produits et les degrés de liberté associés et il est de la forme suivant.
Noton que les degrés de liberté sont les mêmes dans le cas univarié.
Pour le modèle à deux facteurs plan équilibré, la matrice des sommes carrés et des produits
totales et partitionnée comme

T = HA + HB + HAB + E. (2.1)

La structure des matrices HA et HB est similaire.


Par exemple HA a sur la diagonale, la somme des carrés pour le facteur A pour chacune
des p variables, les éléments hors diagonale de HA sont les sommes correspondantes de

19
Chapitre 2. Analyse de la variance multiple à deux facteurs ( MANOVA 2 )

produits pour toutes les paires de variables. Ainsi, le reme élément de HA correspondant à
eme
la r variable ( r = 1; 2; : : : ; p) est donnée par

X
I
2 X
I
Y2 Y 2r
i r
hArr = KJ Yi r Y r = , (2.2)
i=1 i=1
KJ KIJ

où Y i r et Y r représentent les remes composantes de Yi et Y respectivement, et Yi r et


Y r sont des totaux correspondants aux Yi r et Y r . Le (rs)eme élément de HA est

X
I XI
Yi r Yi s Y rY s
hArs = KJ Yi r Y r Yi s Y s = . (2.3)
i=1 i=1
KJ KIJ

De la formule (2.1) et le tableau (2.1), nous obtenons

X Yij2 r Y 2r
hABrr = hArr hBrr , (2.4)
ij
K KIJ
X Yij r Yij s Y rY s
hABrs = hArs hBrs .
ij
K KIJ

Pour la matrice E, les formules de clalcul de E sont basés sur (2.1)

E=T HA HB HAB .

Ainsi les éléments de E ont la forme

X Y 2r
2
err = Yijkr hArr hBrr hABrr , (2.5)
ijk
KIJ
X Y rY s
ers = Yijkr Yijks hArs hBrs hABrs .
ijk
KIJ

2.4 Tests d’hypothèse

Comme dans le cas univarié, il existe trois hypothèses à tester, qui sont

20
Chapitre 2. Analyse de la variance multiple à deux facteurs ( MANOVA 2 )

1/ E¤et du premier facteur

H0 : "Les paramètres ai sont tous nuls " contre H1 : "les paramètres ai ne sont pas tous
nuls".
2/ E¤et du second facteur

H0 : "Les paramètres bj sont tous nuls " contre H1 :"les paramètres bj ne sont pas tous
nuls ".
3/ E¤et de l’interaction des deux facteurs

H0 : "Les paramètres cij sont tous nuls" contre H 1 :"les paramètres cij ne sont pas tous
nuls ".
Le test de validité de ces hypothèses peut se faire par di¤érentes méthodes, que nous
examinerons dans ce qui suit.

2.4.1 Le test de Wilks

Les matrices HA , HB et HAB peut être comparées à E pour tester l’e¤et des deux facteurs A
et B et l’e¤et d’interaction . Alors, pour chaque cas et sous l’hypothèse H0 , les statistiques
Lambda de Wilks ( ) utilisées pour tester l’e¤et de A, B et l’e¤et de l’interaction de cet
ordre sont dé…nies comme suit

jEj
A = p;I 1;IJ(K 1) ,
jE + HA j
jEj
B = p;J 1;IJ(K 1) ,
jE + HB j
jEj
AB = p;(I 1)(J 1);IJ(K 1) .
jE + HAB j

Notons que H0 sera rejetée pour petites valeurs de .

21
Chapitre 2. Analyse de la variance multiple à deux facteurs ( MANOVA 2 )

2.4.2 Autres tests

Dans la littérature statistique, on trouve d’autres tests permettant d’aprouver la même


hypothèse nulle. Nous donnons leur principe ci-dessous.
Notons que dans cette section , H représente (dénote) l’hypothèse testée dans le modèle
du MANOVA. Par exemple, lorsque on veut tester l’e¤et d’interaction H = HAB .

2.4.3 Le test de Roy

La statistique du test de Roy (appellé aussi le test de la plus grande racine de Roy).se
1
base sur la plus grande valeur propre de la matrice E H, qu’on la note 1 Pour tester
H0 , on utilise la statistique
1
= ;
1+ 1

on rejette H0 au risque si ;s;m;N ,où

s = min (#H ; p) ;
1
m= (j#H pj 1) ;
2
1
N = (#E p 1) ;
2

dont les valeurs critiques de sont données sous forme de tableaux.


Une autre approximation qui permette de mettre en oeuvre ce test est celle de Fisher,
dé…nie par
(#E d 1) 1
F = ;
d

avec d et #E d 1 degrés de liberté, où d = max (p; #H ).

2.4.4 Le test de Pillai


1
Le test de Pillai est basé également sur les valeurs propres de la matrice E H.

22
Chapitre 2. Analyse de la variance multiple à deux facteurs ( MANOVA 2 )

La statistique de ce test est

X
s
i
(s) 1
V = tr (E + H) H = ; s = min (#H ; p) .
i=1
1+ i

(s) (s)
On rejette H0 , au seuil si V (s) V , où les valeurs critiques de V sont tabulées.
(s)
La valeur V est indexée par les paramètres s,m et N qui sont les mêmes paramètres que
ceux du test de Roy (pour plus de détail voir [8]):

2.4.5 Le test de lawley -Hotelling

La statistique de Lawley-Hotelling est dé…nie par

X
s
(s) 1
U = tr E H = i; s = min (#H ; p) .
i=1

2.5 Exemple d’application

Le tableau (2.2) contient des données concernant une expérience sur 32 pièces de barres
en acier. L’objectif de cette expérience est d’étudier l’e¤et des deux facteurs vitesse de
rotation (A) et lubri…ants (B) qui ont 2 et 4 niveaux respectivement sur deux variables
mesurées sur chaque pièce de barre en acier, qui sont

Y1 : le moment de la force,

Y2 : la déformation.

Les tabeaux suivants résument les calculs des totaux pour chaque variable, pour chaque
combinaison des deux facteurs (dans les cellules) et les toataux marginaux sont pour
chaque niveau de A et B.
En utilisant les formules de calcul de hArr dans (2.2), l’élément (1,1) du HA (correspondant

23
Chapitre 2. Analyse de la variance multiple à deux facteurs ( MANOVA 2 )

A1 A2
Y1 Y2 Y1 Y2
B1 7:80 90:40 7:12 85:1
7:10 88:90 7:06 89:0
7:89 85:90 7:45 75:9
7:82 88:80 7:45 77:9
B2 9:00 82:50 8:19 66:0
8; 43 92; 40 8:25 74:5
7:65 82:40 7:45 83:1
7:70 87:40 7:45 86:4
B3 7:28 79:6 7:15 81:2
8:96 95:1 7:15 72:0
7:75 90:2 7:70 79:9
7:80 88:0 7:45 71:9
B4 7:60 94:1 7:06 81:2
7:70 86:6 7:04 79:9
7:82 85:9 7:52 86:4
7:80 88:8 7:70 76:4

Tab. 2.3 –Les valeurs de Y1 et Y2 selon les deux facteurs.

A1 A2
B1 30:61 29:08 59:69
B2 32:61 31:34 64:12
B3 31:79 29:45 61:24
B4 30:22 29:32 59:54
125:40 119:19 244:59
Tab. 2.4 – Les totaux pour Y1.

A1 A2
B1 354:0 327:9 681:90
B2 344:70 310:0 654:70
B3 352:90 305:0 657:90
B4 355:40 323:90 679:3
1407:0 1266:80 2673:8
Tab. 2.5 –Les totaux pour Y2.

24
Chapitre 2. Analyse de la variance multiple à deux facteurs ( MANOVA 2 )

à Y1 ) est donné par

(125:40)2 + (119:19)2 (244:59)2


hA11 = = 1:205.
(4) (4) (4) (4) (2)

Pour l’élément (2,2) du HA (correspondant à Y2 ) nous avons

(1407:0)2 + (1266:8)2 (2673:8)2


hA22 = = 614:25.
16 32

Pour l’élément (1,2) du HA (correspondant à Y1 Y2 ) nous utilisons (2.3) pour obtenir hArs

(125:40) (1407:0) + (119:19) (1266:8) (244:59) (2673:8)


hA12 = = 27:208.
16 32

Donc 0 1
B 1:205 27:208 C
HA = @ A.
27:208 614:251

Nous obtenons HB de manière similaire

(59:69)2 + + (59:54)2 (244:59)2


hB11 = = 1:694,
(4) (2) 32

(681:9)2 + + (679:3)2 (2673:8)2


hB22 = = 74:874,
8 32

(59:69) (681:9) + + (59:54) (679:3) (244:59) (2673:8)


hB12 = = 9:862.
8 32

d’où 0 1
B 1:694 9:862C
HB = @ A.
9:862 74:874

25
Chapitre 2. Analyse de la variance multiple à deux facteurs ( MANOVA 2 )

Pour HAB nous avons, par (2.4)

(30:61)2 + + (29:32)2 (244:59)2


hAB11 = 1:205 1:694 = 0:132,
4 32

(354:0)2 + + (323:9)2 (2673:8)2


hAB22 = 614:25 74:874 = 32:244,
4 32

(30:61) (354:0) + + (29:32) (323:9) (244:59) (2673:8)


hAB12 = 27:208 ( 9:862) = 1:585,
4 32

alors 0 1
B0:132 1:585 C
HAB = @ A.
1:585 32:244

La matrice d’erreur E est obtenue en utilisant les formules de calcul données pour err et
ers dans (2.5). Par exemple, e11 et e12 sont calculés comme

2 2 2 (244:59)2
e11 = (7:80) + (7:10) + + (7:70) 1:205 1:694 0:132 = 4:897,
32

(244:59) (2673:8)
e12 = (7:80) (90:40)+ +(7:70) (76:4) 27:208 ( 9:862) 1:585 = 1:890.
32

En procédant de cette manière, nous obtenons


0 1
B 4:897 1:890 C
E=@ A.
1:890 736:390

avec
#E = IJ(K 1) = (2)(4)(4 1) = 24.

26
Chapitre 2. Analyse de la variance multiple à deux facteurs ( MANOVA 2 )

Pour tester l’e¤et principal de A avec le test de de Wilks, nous calculons

jEj 3602:2
A = = = 0:474 < 0;05;2;1;24 = 0:771,
jE + HA j 7600:2

et nous concluons que la vitesse a un e¤et signi…catif sur Y1 ou Y2 ou sur les deux.
Pour l’e¤et principal de B, nous avons

jEj 3602:2
B = = = 0:6916 > 0;05;2;3;24 = 0:591.
jE + HB j 5208:6

Nous concluons que l’e¤et des lubri…ants n’est pas signi…cative.


Pour l’interaction entre A et B, on obtient

jEj 3602:2
AB = = = 0:6916 > 0;05;2;3;24 = 0:591,
jE + HAB j 5208:6

par conséquent nous concluons que l’e¤et d’interaction n’est pas signi…cative.

27
Chapitre 3

Application Numérique sous logiciel


R

L’analyse de la variance multiple à deux facteurs (MANOVA 2) est une méthode visant à
expliquer des variables quantitatives par deux variables explicatives qualitatives (appelées
facteurs). Dans ce chapitre, nous allons présenter sous le logiciel R cette méthode en
utilisant deux exemples numériques réalisées sur des données réelles.

3.1 Exemple 1

Les données résumées dans le tableau (3.1) sont issues d’une expérience dans laquelle la
concentration de calcium (mg/100 ml) dans le plasma et le taux d’eau perdu (mg/min)
a été mesurée chez 12 oiseaux des deux sexes ayant subi ou non l’administration d’un
traitement hormonal ( [26]). Dans cet exemple l’objectif est de tester l’existence d’un e¤et
de sexe, de traitement et de leur interaction sur la concentration de calcium dans le plasma
et le taux d’eau perdu.
Les deux facteurs sont codés de la manière suivante
Pas de Traitement hormonal : h1, Traitement hormonal : h2 ;
Femelle : s1, Male : s2.

28
Application Numérique sous logicel R

Pas de Traitement hormonal Traitement hormonal


Femelle Male Femelle Male
Ca H20 Ca H20 Ca H20 Ca H20
16,5 76 14,5 80 39,1 71 32,0 65
18,4 71 11,0 72 26,2 70 23,8 69
12,7 64 10,80 77 21,3 63 28,8 67

Tab. 3.1 –Concentration en calcium (en mg/100 ml) et taux d’eau perdu (mg/min) des
individus en fonction de leur sexe et de l’administration d’hormone.

Pour entrer les données sous R, on utilise ces instructions


CA<-c(16.50,14.50,18.40,11.0,12.70,10.80,39.10,32.0,26.2,23.8,21.3,28.8)
H20<-c(76,80,71,72,64,77,71,65,70,69,63,67)
hormone<-factor(gl(2,6,labels=c("h1","h2")))
sexe<-factor(gl(2,1,12,labels=c("s1","s2")))
On place les 2 variables CA et H2O dans un [Link] convenable comme suit

Y=cbind(CA,H2O)
Les sommes des carrées et des produits sont obtenues à l’aide de la fonction manova,
comme on montre ci dessous

manova(Y~hormone*sexe)
Call :
manova(Y ~hormone * sexe)

Terms :
hormone sexe hormone :sexe Residuals
resp 1 635:1075 14:7408 7:2075 228:7533
resp 2 102:0833 18:7500 36:7500 151:3333
Deg. of Freedom 1 1 1 8

Residual standard error : 5:347351 4:349329


Estimated e¤ects may be unbalanced

Les tests sur les e¤ets principaux des 2 facteurs et l’e¤et d’interaction se fait en tapant la
commande suivante

29
Application Numérique sous logicel R

summary(manova(Y~hormone*sexe))

Df Pillai approx F num Df den Df Pr(>F)


hormone 1 0:85574 20:7624 2 7 0:001140
sexe 1 0:25408 1:1922 2 7 0:358439
hormone :sexe 1 0:30894 0:30894 2 7 0:274351
Residuals 8
——

Signif. codes : 0 ‘***’0:001 ‘**’0:01 ‘*’0:05 ‘.’0:1 ‘’1

Au risque = 0:05, les résultats des tests indiquent un e¤et signi…catif du facteur hormone
sur les deux variables CA et H2O puisque la p valeur est inférieure à 0:05 (0:001140 < 0:05),
tandis que l’e¤et du facteur (sexe) n’est pas signi…catif (0:358439 > 0:05). Il n’y a par
ailleurs pas d’e¤et d’interaction entre les deux facteurs (0:274351 > 0:05) : l’e¤et du
facteur hormone est le même quelque soit le sexe des individus.

Remarque 3.1.1 - Les autres tests sont également disponibles sous R, et ils sont obtenus
en exécutant ces instructions
summary(manova(Y~hormone*sexe),test="W")
summary(manova(Y~hormone*sexe),test="H")
summary(manova(Y~hormone*sexe),test="R")
- Ces trois tests donnent les mêmes résultats que ceux obtenus par le test de Pillai.

3.2 Exemple 2

L’expérimentation est menée sur des grains de blé dur (Triticum durum Desf) fournies par
C.C.L.S (coopératives de céréales et légumes secs) de Biskra, les génotypes qui sont retenus
sont : HEDBA, BELYOUNI, BIDI 17. Les essais ont été conduits au laboratoire de
biologie d’université Mohamed Khider de Biskra El-Hadjeb.
Selon le protocole expérimental suivi, 20 grains sont placés dans une boîte de Pétri et ils

30
Application Numérique sous logicel R

sont tapissés par deux couches de papier absorbant humidi…ée par des di¤érentes concen-
trations de NaCl (0 g/l, 5g/l, 10g/l, 15g/l). Chaque traitement est répété trois fois. Après
15 jours, la longueur de radicule (racine) et de l’épicotyle (feuille) est mesurée (en cm).
Alors, chaque observation est présentée sous la forme suivante

Yij = (l1 ; l2 );


l1 : la longueur de radicule ;
l2 : la longueur de l’épicotyle.

Fig. 3.1 –Radicules et épicotyles des graines germées.

Dans cet exemple, on veut étudier l’e¤et de variété de blé dur et de la concentration de
NaCl sur la longueur de radicule et la longueur de l’épicotyle.

La technique la plus adéquate pour traiter ce problème est la MANOVA 2 (les deux
facteurs simultanément). Notons qu’on peut aussi faire une MANOVA1 (chaque facteur
indépendamment).

Dans cette section, on va résoudre ce problème par une ANOVA 2 (l’étude de l’e¤et des
deux facteurs sur chaque variable séparément), puis on va appliquer la MANOVA 2.

31
Application Numérique sous logicel R

Variété Concentration Moyenne Variété Concentration Moyenne


Radicule v1 c1 5:4317 Epicotyle v1 c1 3:8667
c2 5:0800 c2 2:9217
c3 3:2500 c3 0:7750
c4 0:9567 c4 0:2167
Total 3:6796 Total 1:9450
v2 c1 6:8983 v2 c1 4:6433
c2 4:6400 c2 2; 0900
c3 2:1767 c3 0:4033
c4 0:5650 c4 0:0983
Total 3:5700 Total 1:8087
v3 c1 7:3967 v3 c1 5; 7500
c2 4:6050 c2 2; 6400
c3 2:1250 c3 0:3050
c4 0:5633 c4 0:0600
Total 3:6725 Total 2:1888
Total c1 6:5756 Total c1 4:7533
c2 4:; 7750 c2 2:5506
c3 2:5172 c3 0:4944
c4 0; 695 c4 0:1250
Total 3:640694 Total 1:9808

Tab. 3.2 –Résultas du calcul des moyennes.

3.2.1 Application de L’ANOVA 2

Avant d’appliquer l’ANOVA 2, un calcul des moyennes pour chaque variable, pour chaque
combinaison et pour chaque niveau des deux facteurs nous fournis les résultats présentés
dans le tableau (3.2).

Remarque 3.2.1 On a utilisé les notations v1, v2, v3 pour le facteur variété et c1, c2,
c3 et c4 pour les niveaux du facteur concentration.

L’analyse préliminaire des moyennes, montre que


Les trois types de variétés ont une longueur moyenne des radicules presque similaire, tandis
qu’elles ont des longueurs moyennes de l’épicotyle di¤érentes.
Lorsque la concentration de NaCl augmente, la longueur des radicules et de l’épicotyle
diminue pour toutes les variétés.

32
Application Numérique sous logicel R

Response RADICULE :
Df Sum Sq Mean Sq F value Pr(>F)
VARIETE 2 1:8 0:90 0:7857 0.4562
CONCENTRATION 3 3571:17 1190:36 1036:1911 <2e-16 ***
VARIETE :CONCENTRATION 6 186:4 31:06 27:0411 <2e-16 ***
Residuals 708 813:3 1:15

Response EPICOTYLE :
Df Sum Sq Mean Sq F value Pr(>F)
VARIETE 2 17:79 8:90 18:042 2.279e-08 ***
CONCENTRATION 3 2459:67 819:89 1662:946 <2.2e-16 ***
VARIETE :CONCENTRATION 6 119:35 19:89 40:346 <2.2e-16 ***
Residuals 708 349:07 0:49
Signif. codes : 0 ‘***’0:001 ‘**’0:01 ‘*’0:05 ‘.’0:1 ‘’1

Tab. 3.3 –Résultas obtenus par l’ANOVA 2.

Les résultats de l’ANOVA 2 fournis par le logiciel R pour les deux variables radicule et
épicotyle sont présentés respectivement dans le tableau (3.3).
D’après les résultats de l’analyse de la variance et au seuil de risque = 0:05, on constate
que
D’une part, il n’existe pas un e¤et signi…catif du facteur variété sur la longueur des ra-
dicules puisque la p valeur est supérieure à (0:4562 > 0:05), mais il est hautement
signi…catif sur la longueur de l’épicotyle (la p valeur est inférieure strictement à ).
D’une autre part, il y’a des e¤ets très hautement signi…catifs de la concentration de NaCl
et ainsi de l’interaction (variété : concentration) sur les deux variables (radicule, épicotyle).

3.2.2 Application de MANOVA 2

L’application de la technique MANOVA 2 nous à fournis les résultats suivants


De la comparaison des p valeurs de chaque terme indiquées dans les tableaux de test
MANOVA (tableau (3.4)) au seuil de signi…cation ( = 0:05), on résulte que

E¤et du facteur variété

D’une part, la p valeur associée à ce facteur est strictement inférieure à (cela pour les

33
Application Numérique sous logicel R

Df Pillai approx F num Df den Df Pr(>F)


VARIETE 2 0.05238 9.521 4 1416 1.350e-07
CONCENTRATION 3 1.11315 296.219 6 1416 <2.2e-16
VARIETE :CONCENTRATION 6 0.32792 23.142 12 1416 <2.2e-16
Residuals 708
Df Wilks approx F num Df den Df Pr(>F)
VARIETE 2 0.94768 9.63 4 1414 1.108e-07
CONCENTRATION 3 0.08368 579.03 6 1414 <2.2e-16
VARIETE :CONCENTRATION 6 0.68408 24.63 12 1414 <2.2e-16
Residuals 708
Df Hotelling-Lawley approx F num Df den Df Pr(>F)
VARIETE 2 0.0552 9.73 4 1412 9.101e-08
CONCENTRATION 3 8.5986 1011.77 6 1412 <2.2e-16
VARIETE :CONCENTRATION 6 0.4443 26.14 12 1412 <2.2e-16
Residuals 708
Df Roy approx F num Df den Df Pr(>F)
VARIETE 2 0.0540 19.13 2 708 8.118e-09
CONCENTRATION 3 8.3158 1962.52 3 708 <2.2e-16
VARIETE :CONCENTRATION 6 0.4005 47.25 6 708 <2.2e-16
Residuals 708

Tab. 3.4 –Analyse de la variance multiple (MANOVA 2) avec les quatres statistiques du
test.

quatre statistiques du test), donc il existe une di¤érence signi…cative entre les longueurs
moyennes des radicules des trois types de variétés ou les longueurs moyennes des épicotyles
des trois types de variétés ou les deux.

Ce résultat est con…rmé par les résultats présentés dans le tableau (3.3) où on a montré
que pour un seuil de risque , le facteur variété a un e¤et signi…catif sur l’épicotyle mais
elle n’a pas un e¤et signi…cative sur la longueur des radicules.

E¤et du facteur concentration

Les di¤érents tests statistiques indiquent un e¤et hautement signi…catif du facteur concen-
tration sur la longueur des épicotyles ainsi que sur la longueur des radicules. Ces résultats
sont confondus avec les résultats obtenus précédemment.

E¤et de l’interaction entre les deux facteurs

34
Application Numérique sous logicel R

Les résultats de l’analyse de la variance multiple indiquent aussi qu’il existe un e¤et
d’interaction entre les deux facteurs variété et concentration très hautement signi…catif
sur la longueur des radicules et la longueur des épicotyles. Ces résultats sont similaires à
ceux présentés dans le tableau (3.3).

35
Conclusion

En…n L’analyse de la variance multivariée (MANOVA) utilise dans le même cadre concep-
tuel que l’ANOVA. Il s’agit d’une extension de l’ANOVA permettant de prendre en compte
une combinaison de variables dépendantes plutôt qu’une variable dépendante unique. Dans
le cadre de la MANOVA, les variables explicatives sont souvent appelées facteurs.
Ainsi l’avantage de l’utilisation d’une MANOVA au lieu de plusieurs ANOVA simultanées
réside dans le fait qu’elle prend en compte les corrélations entre les variables réponses et
permet ainsi une meilleure utilisation des informations provenant des données. La combi-
naison des variables dépendantes peut représenter une variable non mesurable directement.
Donc la MANOVA teste les e¤ets de facteurs sur plusieurs variables réponses. Avec une
MANOVA, il est donc possible de tester conjointement toutes les hypothèses testées par
une série d’ANOVAs avec plus de chance d’observer un e¤et signi…[Link] utilisée pour
e¤ectuer des tests multivariés dont le but est de véri…er si les paramètres correspondant aux
di¤érentes modalités d’un facteur sont signi…cativement di¤érents ou non. Par exemple,
on peut tester les e¤ets de quatre traitements appliqués à des plantes sur une qualité de
production représentée par une combinaison de variables, en incluant ou non des e¤ets
d’interaction.
L’objectif du présent mémoire est de discuter le cas de MANOVA 02 c’est -à-dire l’étude
de l’e¤et d’un 2 facteur …xe sur plusieurs variables, la réalisations de l’analyse de variance
multiple est équivalente à la réalisation d’un test ou plusieurs tests

36
Bibliographie

[1] Mouloud Cherfaoui, (2017) Polycopiés du cours Biostatistique, Statistique Appliquées


à l’Expérimentation En Science Biologique, UNIVERSITE MOHAMED KHIDER ,
BISKRA

[2] [Link] Roberts(2002) one-Way Multivariate Analyse of Variance MANOVA Sou-


thern Methodist University Simmons School of Education and Human Devellopement
Departement of Teaching and Learning .

[3] [Link] , (1975). Analyse de la variance à plusieur variables. Les press agrono-
mique de Gembeux ASBL.

[4] Fanny MEYER , Morgane CADRAN , Margaux GAILLARD ,Analyse de la variance


M2 Statistique et Econometrie .

[5] Richard A Johnson and Dean [Link], (2007) . Applied Multivariate Statistical
Analysis, sixth edition ; Upper River , New Jersy.

[6] P. Mayer (Mars 2011) Analyse de la variance , comparaison de Plusieurs Moyennes


Laboratoire de Biostatistique et informatique Médicale , fac de Medecine de Strasbourg
.

[7] Pro¤esseur P. Francour (22.05.2015) Analyse de variance à un ou plusieurs Facteurs ,


Régression , Analyse de covariance , Modèles Linéaires Généralisés .

francour@unice .fr

[8] Alvin C Rencher ,.(2002) .Method of Multivariate Analysis, second edition .

37
Bibliographie

[9] Gilbert. Saporta , (2006) Probabilité, Analyse des données et Statistique, deuxièmme
edition .Edition TECHNIP 27 rue Ginoux , 75737 PARIS , Cedex 15, FRANCE .

38
Annexe A : Rappel sur l’algèbre
linéaire et statistique

Dans cette Annexe on va présenter quelques notions sur l’algèbre Linéaire ( matrice,
l’inverse d’une matrice,. . . ) ainsi que les statistiques multidimensionnelles ( notations,
espérance ,: : :) ou nous focalisons principalement sur le cas d’un vecteur gaussien .

3.3 Rappel sur l’algèbre linéaire [3; 9]

Dé…nition 3.3.1 (Matrice)

Une matrice X est un tableau rectangullaire de [Link] dit que X est de taille n p;si
X a n0lignes et p colonnes
1 .Une telle matrice est repésentée de la manière suivante :

B x11 : : : x1p C
B . .. .. C
X=B B .
. . . C
C
@ A
xn1 xnp
ou xij est l’élément de la ieme ligne de la j eme colonne , on le note aussi (X)ij .

Dé…nition 3.3.2 (La matrice identité )

La matrice identité est une matrice de dimension n, notée In , telle que :

8
>
< 1 si i = j
xij =
>
: 0 si i = j

39
Annexe A : Rappel sur l’algébre linéaire et statistique multidimensionnelle

c’est-à dire :

0 1
B1 0 0C
B C
B0 1 0C
B C
In = B . .. C
B .. . . . .. C
B . .C
@ A
0 0 1

Dé…nition 3.3.3 ( la matrice nulle )Une matrice est dite nulle si ses éléments sont toutes
nuls, c’est-à-dire :

xij = 0 8i = 1; n 8j = 1; p

Dé…nition 3.3.4 (Transposé)

La transposée de la matriceX , notée X t , est obtenue à partir de X en interchangeant les


lignes et les colonnes, c’est-à-dire : (X t ) = (Xji ) : Remarquer que si X est une matrice de
taille n p, alors X t est de taille p n .

Dé…nition 3.3.5 (Symétrie)

On dit qu’une matrice est symétrique si X t = X .

Dé…nition 3.3.6 (la trace)

La trace d’une matrice carée X d’ordre p, notée tr (X) est la somme de ses éléments
diagonaux, c’est-à-dire :

p
X
tr (X) = xii :
i=1

Dé…nition 3.3.7 (Le déterminant)

40
Annexe A : Rappel sur l’algébre linéaire et statistique multidimensionnelle

A toute matrice carrée d’ordre p, correspond un nombre réel ; noté jXj ou det (X) ; appelé
le déterminant de X , qui peut être obtenu comme suit :
Pour une matrice d’ordre 1 :

jx11 j = x11 ;

Pour une matrice d’ordre 2 :

x11 x12
= x11 x22 x21 x12 ;
x21 x22

D’une façon générale , le déterminant d’une matrice carrée X peut être calculé grâce
aux notions de mineurs ou de cofacteurs.
Le mineur de l’élément xij d’une matrice X est le déterminant que l’on obtient en éliminant
la ieme ligne et la j eme colonne X .
Le cofacteur Xij de xij est égal au mineur de xij multiplié par ( 1)i+j .
Le déterminant de X peut être calculer en e¤ectuant la somme des produits des di¤érents
éléments d’une même colonne par leurs cofacteurs respectifs :

p
X
det (X) = xjj Xjj (pour tout j)
i=1
p
X
= xij Xij (pour tout i)
i=1

Dé…nition 3.3.8 (L’inverse d’une matrice)

Notons que la transposée de la matrice des cofacteurs Xij est appelée ” matrice adjointe
”est désignée par adj (X).
1
La matrice inverse de X ; notée X ; peut être obtenue notamment en divisant la matrice
adjointe de X par le det (X) :

41
Annexe A : Rappel sur l’algébre linéaire et statistique multidimensionnelle

1 adj (X)
X = ; det (X) 6= 0:
det (X)

Soit X une matrice de taille n n, les trois conditions suivantes sont équivalentes :
[Link] X = 0:
2. il existe un vecteur colonne V 2 Rn est un vecteur colonne de taille n, alors
XV = 0 =) 0Rn :

1
3.X possède une matrice inverse , c’est-à-dire il existe une matrice X telle que :
1 1
X X = XX = In :

Dé…nition 3.3.9 (Les valeurs propres )

Les valeurs propres ou les valeurs caractérestiques d’une matrice carrée X d’ordre p,sont
les p solutions de l’equation caractérestique :

det (X Ip ) = 0:

Les valeurs propres peuvent être réelles ou complexes, positives, nulles ou négatives, dis-
tinctes ou confondues , mais on s’interesse ici aux valeurs propres réelles, alors que leurs
sommes est égale à la trace de la matrice X et leurs produits à son déterminant :

p
X
i = tr (X) ;
i=1
p
i = det (X) :
i=1

42
Annexe A : Rappel sur l’algébre linéaire et statistique multidimensionnelle

3.4 Rappel sur les statistiques multidimensionnelles

[7]

3.4.1 Notations matricielles de vecteurs aléatoires

Pour établir les propriétés d’un p-uplets (X1 ,X2 , : : : ; Xp ) de variables aléatoires, il est
préférable d’adopter la notation matricielle. Ainsi, on note :

X = (X1 ; X2 ; : : : ; Xp )t ;

le vecteur de dimension p a valeur dans Rp .


On dé…nit alors l’espérance mathématique de X, noté E [X] ; par le vecteur des espérances
mathématique (si elle existent) :

E [X] = (E [X1 ] ; E [X2 ] ; : : : ; E [Xp ])t :

Si les covariances des composantes prises 2 à 2 existent, la matrice d’élément (i; j) égal à
cov (Xi ; Xj ) est appelle matrice des variances-covariances de X de taille p p et on la note
X
V (X) ou ,

0 1
2
B X1 cov (X1 ; X2 ) : : : cov (X1 ; Xp )C
B C
X B
B cov (X 2 ; X2 ) 2
X 2
cov (X 2 ; Xp )C
C
V (X) = =B .. .. .. C
B ... C
B . . . C
@ A
2
cov (Xp ; X1 ) cov (Xp ; X2 ) Xp

Notons que cette matrice est symétrique et que ses éléments diagonaux sont les variances
des composantes du vecteur aléatoire X , en e¤et :

43
Annexe A : Rappel sur l’algébre linéaire et statistique multidimensionnelle

cov (Xi ; Xj ) = E [(Xi E [Xi ]) (Xj E [Xj ])]

= E [(Xj E [Xj ]) (Xi E [Xi ])] (la commutativitée de produit dans R) ;

= cov (Xj ; Xi ) ;

et

cov (Xi ; Xi ) = E [(Xi E [Xi ]) (Xi E [Xi ])]

= E (Xi E [Xi ])2

= V ar (Xi ) :

Soient maintenant A une matrice de taille q p et C un vecteur appartient à Rq ; Alors la


relation Y = AX +C dé…nit un vecteur aléatoire a valeur dans Rq , dont les caractérestiques
sont résumées dans la proposition suivante :
Soit X un vecteur aléatoire d’espérance E [X] et de matrice de variance-covariance V (X)
et soit le vecteur Y tel que :

E [Y ] = AE [X] + C et V (Y ) = AV (X) At :

3.4.2 Lois de Gauss multivariée[7; 9]

Dans ce passage nous considérons un vecteur aléatoire X = (X1 ; X2 ; : : : ; Xp ) tel que


2
Xi N ( i; i); 8 i = 1; p:

Dé…nition 3.4.1 un vecteur aléatoire gaussien X de dimension p est parfaitement dé…ni


P
par son vecteur des espérances noté et sa matrice de variance-covariance notée . Sa
loi est noté Np ( ; ) .

44
Annexe A : Rappel sur l’algébre linéaire et statistique multidimensionnelle

la densité conjointe de ses composantes au point x = (x1 ; x2 ; : : : ; xp ) est :

1 1
fX (x1 ; x2 ; : : : ; xp ) = 1=2
exp (X )t 1
(X ) :
(2 ) (det ) 2

Proposition 3.4.1 on dit qu’un vecteur aléatoire gussien a des composantes linéairement
indépandantes si et seulement si sa matrice des variances-covariances est diagonale , c’est-
à-dire si et seulement si les covariances des composantes prises deux à deux sont nulles
(cov (Xi ; Xj ) = 0 ; i 6= j) :

3.5 Rappel sur quelque distributions [9]

Dé…nition 3.5.1 (La distrubution de WISHART) Les distrubutions d’échantillonage


des matrices des sommes des carrés et des produits des écarts A sont des distributions de
WISHART de paramètres k, p , , ou :

p : le nombres des variables considérées.

ni : l’e¤ectif de l’échantillon i ;

k : le degrés de liberté,avec k = ni 1;

: la matrice des variance covariance de la population parent:

dont la densité de probabilité donnée par :

jAj(k p 1)=2
exp 1
2
trA 1
f (A) = c ;
j jk=2

avec c est une constante déterminée en fonction de p et ni , de manière à donner la valeur


1 à l’integrale multiple de f .

45
Annexe A : Rappel sur l’algébre linéaire et statistique multidimensionnelle

Dé…nition 3.5.2 (La distrubution de WILKS) Les distrubutions de WILKS sont re-
latives à des expressions du type

jA1 j
= ;
jA1 + A2 j

ou les matrices A1 et A2 étant des variables de WISHART indépandantes à k1 et k2 degré


de liberté et de même paramètres p et .

Dé…nition 3.5.3 (la distribution de KHI-deux)Soit Z1 ,. . . ,Zv une suite de variables


aléatoires gaussiennes centrées réduites E [Zi ] = 0 et V (Zi ) = 1 , 8 i = 1; v ; alors X =
Pv 2
i=1 Zi est une variable aléatoire qui suit loi appelée ”loi de KHI-deux à v degrés de

2
liberté ” , on la note v; et sa densité de probabilité est donnée par :

1 x2 p
1
f (x) = v
e 2 x2 2
;
2v=2 2

Z x
avec (x) = tx 1 e t dt:
0

Dé…nition 3.5.4 (La distrubution de Fisher-Snedecor) étant deux variables aléa-


2 2
toires suivants indépandamment des lois v1 et v2 alors :

X1 =v1
F = ;
X2 =v2

est une variable aléatoire qui suit une loi de Fisher a v1 et v2 degrés de liberté, avec
la densité de probabilité correspondante est donnée par :

v1=2 v1
v1 1
1 v2
x2 (p) (q)
f (x) = v1 v2 (v1 +v2 )=2
; avec (p; q) = :
; v1 (p + q)
2 2 1+ v2
x

46
Annexe B : Quelques commandes de
logiciel R

Le tableau ci-dessous présente les principales fonctions à utiliser a…n d’e¤ectuer d’analyse
de varince et la régression

47
Annexe B : Abréviations et Notations

Commande Description

plot(Y v factor (X)) inspection graphique .

aov(Y v factor (X)) construit un modéle d’analyse de la variance de


la réponse y par le facteur.

summary(aov (Y v factor (X))) tableau d’analyse de la variance ((AN OV A 1)) :

anova(Im (Y v factor (X))) tableau d’analyse de la variance (AN OV A 1) :

[Link]( ) comparaisons deux à deux

[Link] Permet de réaliser un test de normalité de


shapiro-wilk.

[Link] Permet de réaliser un test Bartlett d’égalité


de variance.

[Link](Y; factor (X); factor (Z))) inspection graphique.


. aov(Y v factor (X) factor (Z)) analyse de la variance à 2 facteurs avec interaction.

summary(aov (Y v factor (X) factor (Z))) tableau d’analyse de la variance (AN OV A 2)

names ( ) Liste les noms des variables dans un [Link].

plot ( ) génère un nuage de points.

Im( ) Déterminer la ligne de régression


des moindres carrés.

xyplot ( ) Commande Lattice pour produire un diagramme


de dispersion.

con…nt( ) intervalle de con…ance des paramètres de


régression .

Tableau à 2 dimensions dont les lignes sont des


[Link]( ) individus et les colonnes des variables.
(numérique ou facteurs) :

48

Vous aimerez peut-être aussi