3320
STT 6410: Analyse de la variance
Martin Bilodeau
Département de mathématiques et de statistique
Université de Montréal
4 septembre 2015Table des matiéres
1 Introduction
ad
1.2
Généralités . . nae
Planification et analyse «+. = -
2 Comparaison de deux traitements
21
2.2
Mode linéaire : eae
Mod&lé basé sur la randomisation
3 Exemples de modéles linéaires
31
32
Le mode linéaire . -
Notation matricielle
4 Formes linéaire et quadratique
ad
42
43
44
45
46
Concepts élémentaires et loi multinormale
Loi du khi-deux 20.2. ++
Formes linéaire et quadratique -
‘Théoreme de Cochran
Loi
Bxemples 62-2002
5 Estimation et test @’hypothése
5.
5.2
53
54
55
5.6
5.7
Regles de dérivation sae
Modéle sans contrainte... . foie
Modéle avec contrainte... 6...
Modble réduit du modéle avec contrainte
Estimateurs BLUE (Markov)...
‘Test ’hypothése linéaire eo
Puissance du test Fs. . see
a
°
iw
12
17
17
19
26
29
29
33
33
a4
35
37
38
39
aLTABLE DES MATIERES
5.8 Quotient de Rayleigh 2.0.2... orotate
5.9 Intervalles simultanés de Scheffé . 42
Plan a un facteur 45
G1 Estimation... 2.20... 20, sees +. a5
6.2. Test dhypothése . 2... ser teeea secrete td
6.3 Intervalles simultanés. 62... 2 a 48
6.3.1 Scheffe . ae : ane 48
6.3.2. Bonferroni. : eae seen AD
63.3 Tukey .......... sea 49
6.4 Contrastes orthogonaux eee reece
6.5 Unexemple . . eee ese see eee etree eee ee ea
6.6 Tests d'étendues multiples... 56
6.7 Autres paramétrisations +. 88
6.7.1 La restriction Pynja; = 0 seealtee 80)
6.7.2 La restriction a =O... ear . 59
6.8 Facteur quantitatif eae ‘ ses 60
Plan a blocs randomisés complets 63
71 Deux traitements Berner sree earn essere
7.2 Plusiewrs traitements ©... 0.0... : 66
7.3 Test dhypothtse 2.0... ac - 69
74 ANOVA . ee pee TO
7.5 Intervalles de confiance.........-2.0..004 a
7.6 Unexemple ..... : : : 1.7
7.7 Paceur quantitatif 6... ee Loe BB
Plan équilibré A blocs incomplets 75
8.1 Estimation des paramdtres Hire eeeea neces . 5
8.2 Comparaisons des traitements . : SereaeceeeD
8.3 Estimation de la variance 0?» 2... ee 80
84 Test dhypotlidse ee 81
8.5 Comparaisons multiples... eee 83
8.6 Un eccenuple sree ter vente reece astrc arate vee eee es 88
8.7 Efficacité relative see 84TABLE DES MATIERES
9 Plan factoriel complet
9.1 Deux facteurs . . « Bria eat
9.2 Estimation... .. + eee
9.2.1 Modéle sans contrainte
9.2.2. Modéle sans interaction
9.3. Tests des facteurs . «
9.4 ANOVA . :
95 Paramétrisation du modele .
9.6 Interprétation des hypotheses
9.7 Intervalles simultanés . 5...
9.8 Modele sans interaction
9.9. Une observation par traitement.
9.10 Contrainte d’une modalité nulle . . . «
9.11 Plan factoriel & plusieurs facteurs.
9.12 Un exemple... 6... +--+ +
9.13 Types I, et WIL...
10 Plan factoriel fractionnaire
10.1 Introduction... -
10.2 Le groupe commutatif ordre ”
10.3 Le plan général 2* .
10-4 Batimations des contrastes
10.5 Plan factoriel fractionnaire
10.6 Un exemple... -
10.7 Un plan 2° partiellement confondn
ger
87
88
+. 88
+. 89
++ 89
91
92
93
rere
et a eee tO.
96
97
97
100
101
107
107
ea
oe ed
Bee erapLLo,
eee
Se aeeercset da:BS
TABLE DES MATII
vi
eS es OeChapitre 1
Introduction
1.1 Généralités
— Expérience : Une investigation ott le systéme étudié est sous le contréle
de Pexpérimentateur, Les individus, la nature des traitements ot les
méthodes de mesure sont décicées par Vexpérimentateur. Par exemple,
dans un essai clinique randomisé, des patients sitisfaisant des crittres
bien définis (Péligibilité, sont assignés par une méthode impersonnelle,
aun de dens traitements : un nouveau traitement T et un traitement
standard on contrdle C, lequel est peut-étre le meilleur traitement
ponible on un placebo. Les patients sont suivis un certain temps et
une ou plusieurs réponses sont enregistrées.
— En agriculture, 1m champs expérimental est divisé en ‘plots’ de taille et
de forme déterminée par Pexpérimentateur. Chaque plot est assigné &
un, parmi plusieurs, traitement de fertilisant, souvent une combinaison
de différentes quantités de substances fertilisantes, et le produit de la
récolte est: mesuré
— Dans une enquéte sur les attitudes sociales, un groupe dindividus
est interviewé disons chaque année. Dans de telles enquétes, Vat-
trition (départ d’individus pour une raison ow une autre) est ume
préoccupation fréquente. Une fagon de réduire attrition est doffrir
lun petit montant quelques jours avant V'interview. Une expérience
sur Pefficacité d'une telle mesure pourrait, prendre la forme dindivi-
dus randomisés dans un de deux groupes : avec et sans récompense
monétaire. La réponse binaire serait achdvement ou non de I’inter-
12
CHAPITRE 1, INTRODUCTION
view.
— ‘Trois éléments principaux A une expérience :
les traitements, et la réponse. Une version schématisée d'une expérience
est celle oh on a un certain nombre de différents traitements sous
Gtuce, Pexpérimentateur assigne um traitement & une unité expérimentale
et, ensuite, oberve la réponse obtenue. Les unités expérimentales sont
essentiellement les patients, ‘plots’, animaux, les matériaux bruts dans
une étude. Deux unités expérimentales penvent recevoir différents trai-
tements.
— Lobjectif est toujours de comparer Veffet de différents traitements sur
la réponse. Cet effet est évalué par des estimés et des intervalles de
confiance de Pampleur des différences de traitements.
— Les estimés doivent étre exempts d’erreurs systématiques, e’est-a-clire
de binis. Liexpérience doit. autant que faire se peut minimiser les er-
reurs aléatoires. Il doit étre possible ¢estimer Pampleur de ces erreurs
aléatoires par un intervalle de confiance.
1.2. Planification et analyse
— Lobjectif Pune bonne planification d’expérience est: de rendre Pana-
lyse et son interprétation la plus simple et claire que possible. Certains
défauts dans une planification peuvent, parfois étre corrigés par une
analyse plus élaborée; cependant, cela est souvent accompagné dune
diminution de la confiance qu'on porte & Vinterprétation des résultats,
— Les analyses considérées iei porteront sur des variables possédant une
distribution continue A Paide de modles linéaires. Cela méne & Pana-
lyse par la méthode des moindres carrés du modéle linéaire normal
— Deux termes souvent rencontrés sont équilibré et orthogonalité. Equi-
libré réfere & une symmeétric dans la structure combinatoire du plan.
Orthogonalité réfere & une simplification dans analyse souvent ren-
contrée dans les plans équilibrés. Dans un plan d’expérience ott les
unités expérimentale sont arrangés en blocs, le plan est dit équilibré
si chaque traitement se retrouve le méme nombre de fois dans chaque
bloc. Dans analyse dun moddle linéaire, deux types d’effets sont or-
thogonaux si les colomnes respectives de la matrice du moddle linéaire
sont orthogonales au sens algébrique (vectems perpendiculaires).
— Fisher, R.A. (1926). The arrangement of field experiments. J. Ministry1.2, PLANIFICATION ET ANALYSE 3
of Agric., 33, 503-513. Premidre discussion systématique du réle des
plans d'expérienee.
— Fisher, R.A. (1935). Design of experiments. Edinburgh : Oliver &
Boyd. Premier livre sur les plans d’expérience.
— Piantadosi, . (1997). Clinical trials. New York : Wiley. Description
Alaborée des plans et des analyses dans le contexte des essais cliniques.
— Montgomery, D.C. (1997). Design and analysis of experiments, 4th
edition, New York : Wiley. Emphase portée surtout sur l'analyse des
modiles.CHAPITRE 1, INTRODUCTIONChapitre 2
Comparaison de deux
traitements
2.1 Modéle linéaire
— Toute variation autre que les différences entre traitements sont consi-
dérées comme aléatoires. Ceci comprend les variations entre unités
expérimentales et les erreurs de mesures.
— On arr observations sur chacun des deux groupes Tet C.
Vays ey ¥ini Yous +++ Yon
‘ive Qae
BY) = +6, Be) = a
Un modéle
que
Yo, = #45 4 ery, Yo, =n—S+ cy,
ott les erreurs aléatoires sont centrées en 0 avec une variance com-
anmune o?. C’est une paramétrisation qui assigne aux deux groupes des
moyennes arbitraires.
— Deux possibilités pour compléter la sp*
1. Moments d’ordre 2 : Les ¢; sont mutuellement non corrélés et ont
la méme variance o?.
ification du modele sont.6 CHAPITRE 2. COMPARAISON DE DEUX TRAITEMENTS
2. Loi normale : Les ¢; sont indépendantes de loi wormale de variance
constante 0. €) wv ii N@a®
Notre intérét. porte sur la différence ce traitement A = 25
Lrestimateur des moindres carrés de A est: la différence des moyennes
‘x. Ye
oi Yr. est la moyenne des observations recevant T et ¥c, est la moyenne
des observations recevant C.
— La somme de carrés résiduelle moyenne est
8 =D {(%, - Yr)? + (Vo, - Yo)*} /(2r — 2).
a
— Lrestimateur usuel de la variance de A est
var (A) = ag evar(A) = 28?/r.
— Sous I'hypothése des moments C’ordre 2 nous avons cles estimateurs:
sans biais
=4,
var(A). = ee =4ge
2.2 Modéle basé sur la randomisation
Ily a différentes facons, toutes équivalentes, de randomiser tes 2 traite-
ents, Supposons ae Acs unités i oa ‘ujgntales sont numérotées Uj, .
n=2r Oo) (a (Gal C
1. Tous les sous-ensembles de is 2r)\f(rir!) peuvent en prin-
cipe étre énumérés et l'un d'eux est choisi au hasard pour recevoir
a
2. Une premiére unité est choisie au hasard parmi U,,...,U, pour rece-
voir T. Puis, une deuxitme unité est choisie parmi celles qui restent,
et, ainsi de suite jusqu’é ce que r unités aient été choisies.
3. Une permutation au hasard des nombres 1,...,n est effectuée, los
premiers nombres sont assignés au traitement T.2.2. MODELE BASE SUR LA RANDOMISATION 7
— Ppest la probabilité induite sur les unités expérimentales par la rando-
misation. On notera par Bp et var Pespérance et: la variance calculée
avec la probabilité Pr.
— Par exemple,
Pala, Us) = eS “pe
(2r—2)! _
Ppal¥n, € Un Yo, € U3 #0) ®
Alors, ¥z, a la méme chance de venit de n’importe Inquelle des 2r
unités
Mod@le additif unité-traitement ; Il existe cles co
1,...)2, une pour chaque unité, et une constante
antes, € pour 5 =
telles que
1. si T’ est assigné a U, alors, observation est 5 + 5,
2. ot si C eat assigné & U, alors, Pobservation est £4 ~ 4.
‘Supposons qu’on estime encore A = 26 par les formules du modéle
linéaire. On définit des indicatrices
y= by Si Test assigné & Us,
10, si C est assigné & Us.
La contribution de Punité ¢ au total ¥z, est
T(E +8)
et celle an total Yo, est
(1 L)Es— 9)
— Lestimatenr est done
A = Sule) (1 LG—A}/r
Fie ee
= Le -G—Dhin Jo veer
ee
EUR) efye ee BES Oy)
x8 CHAPITRE 2. COMPARAISON DE DEUX TRAITEMENTS
Les propriétés probabilistes de A découlent de celles de I, a 1 i
Ens)
vare(l.) =
of
1
\ cour(Is ht) = En(lel) ~ at Pall
Way h SB 1 ¢
- 1
Gy a 2Qr=1) 4
Neen :
yzee) . ee anded
So eer Bd) ~ = DYE ah Bint mA?
Wa Jew SEK 2 : ifwro (1) ot
A oF OL. era = 2{ee De iI}
CV WKY i oe
ae mz a{dee4(we Ze) 5}
AED Ts boh Mls a
'
232 2% Seep vw 1
il =Lgs-038 & 7 Dy y '
4
( — Le dernier résultat Se rroAhONO gis YOUN LE 1
\
se démontre rapidement en utilisant Pestimation de la variance dune
population finie (théorie de Péchantillonage). Notons dabord que
Dever (A= a% Fa [overt]
'
ate ne dépend_pas de J. Qu peut done supposer sans perte de généralité
sts Me, ~ Tr ramns parte de généralité :
Li emne et les valeurs '
+ (Ye = Fe Lamoyente rep err 01 les valeurs £1...
Y S : — Crepligd? ates in Par qoye> '
T2Cn-t ig de \A
bea nye weds cirnansion
Hey ay bee
car :
scalolere> eh salar & La poblactom
Bp
(
(
\
t
‘
‘
¢
; a (
Bp [ewar(A)] = var(A) ie
‘
‘
¢
¢
€
¢
(
¢
¢
(
€
(
(
C
ha wedia & & , latnanse ¥E ¢
‘
«22. MODELE BASE SUR LA RANDOMISATION 9
La moyenne et la variance d'un échantillon aléatoire S de taille r (sans
as) = 1Ds mestm de la muha S
ca
us) = i peo) eam
as
et procurent des estimatems s
Bey = &
Flos) = Vv.
De plus,
Bi amd tid we
var [é(S)] = ert
ott (1—r/n) est le Facteur de conection pAAFRS TA Ape or pi Sori bed
done
Bp [evar(A)] = 28s? & dibs Gath
tate daw
- na AW + 2WVle yoy “(3b (22%4]
ig \-n A
TERRA & © 7Qr= Ten L& ey? = a
tape i SFE
Cee On peut recalculer plus simplement la vasianee exacte comme suit "iam
WEB.
om Ga = TES (7 bt velo de MA
vare(A) = varr De
a pea 1)
ee
= Te ye ey.
Ee Fare la ranbwicadion,
=10
CHAPITRE 2. COMPARAISON DE DEUX TRAITEMENTScept I+
Chapitre 3
Exemples de modéles linéaires
3.1 Le modéle linéaire
Un modéle linéaire décrit, Ia relation entre une réponse y et des variables
explicatives 1, ..,%m par une fonction linéaire de la forme
La moyenne de la variable y, pour des valeurs données des variables expli-
catives @;, s'exprime comme une forme linéaire de paramtres inconnus 9).
Les variables explicatives ; peuvent prendre plusieurs formes selon que Pon
aun modile de régression, d’analyse de variance ou analyse de covariance.
On suppose toujours que les termes d'erreurs € du modele
y= + > Oya; +e
rt
Ils décrivent: toutes les variations aléats
sont centrés en 0, E(e) =
expliquées par les variables explicatives considérées. Le modele décrivant
observations s'éeri
=O +S Byay + ey
ja
pour compléter la spécification du modéle sont
cr12 CHAPITRE 3. EXEMPLES DE MODELES LINEAIRES
BLEe,) x07 0A
1, Moments d'ordre 2 : Les ¢; sont, mutuellement non corrélés’et ont Ia
anéme vari Po Ble Ret
2. Loi normale : Les ¢; sn pan de loi normale de variance
constante a”. gy yo NO) 2
Des méthodes d'inférence sur les paramiétres 8; peuvent alors étre élaborées :
estimation de paramétres, tests d’hypothéses, région de confiance.
3.2 Notation matricielle
On écrit les variables réponses y4, les paramétres 5, les erreurs ¢; et les
variables explicatives «;; sous forme «le vecteurs ou de matrices
& O Bm, / 6
n Lien. 2m a e
yale +e
Uw Lam. awm) \ 9 ew
‘ow plus simplement
Y=Xbre
Selon Phypothise faite sur les termes derreur, on supposera Pune des deux
possibilités :
1. Moments d’ordre 2 : E(ee’) = o?Iy
2. Loi multinormale : e~ N(0,07Iy).
Sous Phypothase de Ja loi multinormale pour les etreurs, le mod’le linéaire
devient i
Y ~ N(X0, oly).
Exemple 1. Le déclin des aptitudes en mathématiques des étudiants (males)
en premiére année universitaire entre 1967 et 1978. Les variables sont y, la
moyenne des étudiants & examen de mathématiques, et «, année. Le moddle
linéaire le plus simple s*6crit
y= O12 +6,
Pour V’écriture matricielle
1 67 bid
1 68 512
ave 6 ( % )
a
1 7 494
ey,
we 7eet 1
3.2, NOTATION MATRICIELLE 13
Exemple 2. Production objets fabriqnés A partir de feuilles dacier inoxy-
dable, La production (nombre d’objets par fouille) est variable. L'ingénieur
croit que la production (PROD), y, dépend de trois facteurs : largeur de la
feuille (WID), «1, densité (DEN), 2, force de tension (STR), 13. Les obser-
vations des 20 derniers jours sont, modélisées par le modléele linéaire
Ely) = 60 + Ores + Ont + Oats.
Pour Pécriture matrigielle
1 19.8 is eg 763
PROD %
1 2.9 110 72 7 650 _{ &
cs eee eee 0
1 20.0 91 62 559 Os
Interprétation di! Parbeuve 8, : Le paramétre 0, roprésonte le change-
ment dans la réponse moyenne, c’est-A-dire E(y), lorsque la variable expli-
cative «; est augmentée de 1 et que toutes les autres variables «;, 7 # i,
demeurent fixes. En effet, par exemple,
Eyles + 1, 22,23) — Eyles, x2, 23)
= (04 O1(a + 1) + Baste + Osees}
[00 + Or201 + Once + Ayers)
= b
Exemple 3. La qualité d'un produit est fonction de dewx variables : la
température, 23, et la pression, a2, qui penvent varier lors de la production.
its Suh 9 ontiaioone différentes de température et pres-
sion, puis ln qualité du produit est mesurée. Un modéle linéaire décrivant la
qualité moyenne du produit comme fonction des deux variables explicatives,
température et pression, pourrait étre ajusté
Ey) = 8 + O11 + Oaa%g + 04:27 + Ba00% + Oram
aux données codées
pipe 2fendo (neal
Obeeration pia cece
2 nett 19 linecattelad
oncl modelo
Dn em batep sobre
cogyrerene) sr degre le 3e4
nwel.atece
nn Xe lh prt
aa wad pod Ves lic.
4 CHAPITRE 3. EXEMPLES DE MODELES LINEAIRES
La relation est non linéaire (quadratique) comme fonction des variables ex
plicatives. Le mod@le wen demeure pas moins un modéle linéaire pnisque la
relation est une forme linéaire ces parambtres 0;. Pour l’éeriture matricielle
%
149 t-a-111 oy
141 t4a.i11 b
fae Sete Ou
134 1 0 15 0 225 0 O29
Or
Exemple 4. Comparaison de deux traitements. Deux traitements T ct C
sont randomisés sur cleux groupes d’upités expérimentales, chacun de taille
(nad. \of, La moyenne théorique du groupé T oD) it L.0 et celle du groupe C, u—6.
~~" définissant une indicatice de traitement sur chaque unité,
{ 1, si T est assigné & l'unité,
—1, si C est assigné a I'unité
le modéle s*éerit. oe
BQ) = w+ dx Had
Pour Vécriture matricielle es a ak,
yng. aaognatl m™ we nen
Cayhatirren : ee ‘ \g
dxy =: (Xx)! x oo x a
es
AA‘ = T
os Napavove nile)
Yc,
Ale he -4 i
Ici, le plan étant équilibré, les deux colonnes de la matrice X sont orthogo-
nales ce qui se traduit par une matrice
ar 0
xix=( 0 y=?
de structure diagonale.
Exemple 5. Plan factoriel complet randomisé A deux facteurs. Il consiste
en un nombre égal d’unités expérimentales (réplicats) pour toutes les com-
binaisons possibles des modalités de ceux facteurs. Par exemple, dans une3.2, NOTATION MATRICIELLE 15
expétience sur Peffet de la dite sur le poids de poussins de 24 semaines, on
Gtudie V'effet de 2 facteurs : le niveau de protéines i deux modalités, | ou 2, et
le type de protéines @ dex modalités, arachide ou soya. Cela donne 2x2=4
taitements possibles avec um nombre égal de 4 unités par traitement pour
1G unités en tout. Les réponses obtemues dle rexpérience sont dans le tableau
suivant
Feacterg
‘Type de proteines | Niveau de frotéines | Poids (e:)
aradhi I 6504 6622
A ay 7528 856 X* ( ~! )
z 6738 GHA
A eld a= | 7338 6361 ¥ (1)
soya 1 6943 6249
a) m) 7359-7292 ¥! (1)
2 6748 6422 ,
4 67646560 8 (+)
Les traitements sont assignés au hasard aux unités. Par exemple, on énumdre
dans un certain ordre les 4 traitements, puis on effectue une permutation au
hasard des nombres 1 A 16. Les 4 premiers poussins recoivent le premier trai-
tement, les 4 poussins suivants le deuxiéme traitement, et ainsi de suite. Les
modalités des facteurs peuvent Age qualitative type de protéines) ou quan-
titatives (niveau de protéines). Ur models linéaire pour ce plan d'expérience
est
Ey) = w+ 02x, + Beg + 7,22,
ot Wheraces «A
si type=soya,
speeds
a
4
Avec cotte paramétrisation, le tablean des moyennes théoriques des 4
traitements est done
niveau=1 niveau=2
typessoya | wtatAty}uta—B—7
type=arachide | wa +8—7 | wa-f +7
sot 1416 CHAPITRE 3. EXEMPLES DE MODELES LINEAIRES
‘Au facteur niveau=1, la différence de moyennes lorsque Von varie le facteur
type est: de 20+ 27, alors qu’au facteur niveau—2 nce est de 2ar—
2y. On parle dans ce cas d'une présence (Pinteraetion entre les deux facteurs.
Cette interaction est absente sous In condition y = 0. Cette condition peut
atre confrontée sous Ia forme d’un test d’hypothése. Berivons finalement ta
1 1-1
1 1-1
Lael
Tt -1 -1
-1 -1
-1 -1 KM
a
My 1x 1 3
1 7
Le plan étant équilibré, la matrice X'X = 16Z, et done les colonnes de X
sont mutuellement orthogonales. On yerra plus loin les simplifications que
procure cette orthogonalité.
nvedo |
be diyerance, -enaten
= (Ares ety) -C Hr 4g -¥)
Farrar
nprle le Tee
(pra p-e)~ (pr a — ptr)
zaK_2N Ys n> inaction
Xx = Ty were erkggoraen 7 indepenshedes xin
bed —
meqseet 14
Chapitre 4
Formes linéaire et quadratique
L'exomple le plus simple est celui ePobservations indépendantes et identi-
quoment distribuées (iid) yy,...,yy suivant la loi N(}6,02). La moyenne est:
ume forme linéaire et la variance, une forme quadvatique i r +
1, L dns i =|
5 WY =AX i ctoed ‘sl. L
(V0 s% = Ya =¥' [iy — away] Y= BY (Gre comdnctea)
a Ne, x
demptoal derank n-1
Grub idem
Le vecteur Jy est un vected dont utes les composantes sont ogales 3 1
Cet exemple correspond an modéle linéaire le plus simple
Y ~ N(Jiey07Iy)-
4.1 Concepts élémentaires et loi multinormale
I’espérance d'une matrice aléatoire M = (mj) est la matrice
On vetting de
B(M) = (E(my,
(i) = (Blom) Oe
En particulier, la matrice de covariance d'un vecteur aléatoire Y UM vee
de moyenne B(Y) = 11 est LO
Ms co¥) = BUY — WY - 4]
= = (Elvi = mus = os)
ae ( CL, | wey aleato rw = aes ee pom fener ef
Ye erin que sigue
E mi) e 17
EMs= [7 =
i Ee ERupnee 3
14 sept ores ah we wy! vaor (9, tev A) ABU) hevlGXI
Cov LAMB e A vravixe!
2
Vow 2 Bh aade Data! 4S
CONC) = ce UTD et eae et
ce oakery) = Cov Ce) A Cae he > :
CHAPITRE 4, FORMES LINEAIRE ET QUADRATIQUE ‘
eetentlene Li aa
a re 1a covariance entre deux vecteurs X ot Z est Reeder Ot) :
igs cou(X, Z)
CoV bx )= Cav (4) — SoibY de moyenne js et de Oe ee
et) di dune transformation linéaire oe fo ecegnam teas 4
=H AEC] x= Anko. AK =A eee 4a) ‘
ao SoA OAD SAS” ve ONS :
cou(BY +0, AY +a) = bya oF =
Se 31) cou(BY +b, AZ =
> KO -4 aint AZ +a) = BooY, Z) a" Baer a gem |
Le vecteur ¥ suit la lot multi
ok — ait In ok multinormale My V)y oi Yt ie
= ELOCR Sy) = xy ;
as re] . ) = en rAIv) exp [Hy —ntv "ey
“at — Ta fonctic énél ‘ice ¢
es ibe ion génératrice des moments (fgm) de ¥ ~'N,(it, V) eat
Oi de, ae my pantet las {twee ;
I tik oe [>©%® My Preuve : Rappelons dabord :
(6 fecha “ree: Bayada dst aque la fgin de la toi z ~ N(0,1) es
/2). Ml découle que si Z ae
(Me @)= Ele santes iid N(0,1) alors, Saal
| =B(e*) Foal) = ot
( Ensuite, par la formule ae .
“4d Ba Changement de vviable, si Z ~ Ny(Oyl),
Ve Y= veg ~
Sete Pn . ae my
ae my() = exple(V'?Z +4) “Ge Disa’ aude) ‘
vane = explti paw Ted Sane
= exp tus deve
cvC=D- 7 Vérifi ( 7
z i Y~ :
eae oe ie 1g 75 AY a git I oi eet
AV. te
ace x J soins a 9 10, ) Po & PU). De pls si
i aie f » YY ~ x°(p) :
] xe i a on tei ty
Ve he ce
2c Q0C2 van tute
aay oe: my 6 We! 7 "Ah zee?
“A i
ta (v 4) {2
\ Yeu Nlot) Aut Vx wy [5 Seet
a to Nelo DAy'y ~ fs 1)
wade) awe BA) ary K “en mR He.
4.2. LOI DU KHI-DEUX
ale CaN) VT pe)
4.2 Loi du khi-deux ee
La loi du khi-deux décentré a p cegrés de liberté et paramétre de
décentralité A = y’p/2, notée x*(p,d), est la loi de Y'Y, ob Y ~
Nel ) 1 we >
Un argument géométrique simple utilisant "invariance orthogonale de
la distribution Na 4 montre en effet que ROY, <2)
(en) ) va vgletsoree to. =@ at Ve.
ee “Cr
: Ms (ti)= eX -2)
est orthogonale, Alors, 2= Y/Y = X'X, ot 7 st) eo ee a
X ~ Ny ((2d)"?,0,...,0)',)- poisson ram /peaK).,
La variable z a la représentation comme une somme de deux variables
indépendantes SVew Vo. Aedptte, sus
y= fae AR 470) !ab% eee
Hy =
= } rast f ey hl
xearmy (Ny) reve norm
$a 7 ya sly
=xlx L
2 + (X Bao. ¥ Ket)
HSS
= yt ve,
LENT eor ewer ty15 sephembre moe ee oe ty, © ee
of di Rik YS
DP chines? Sue
M srved bee, homens Ae Aw eas
UML So
z 20 Sec prbns 4, fds sey tian bates 7
Ma BE 5 “ey NEV! ees vii
PUN & Pp ~My v= en”, ay 4p — 1} En a dela saree ay
\ Min) SNM, ae
aN eoekp .
NE = Chere raygoosel)
ml =m 12) \
Tne reste a wa obtenir
1 2
7 “af — ee ‘Tee a —))| de
2d
(1 —2t)? ex ("a )
denies w n oS if ) PLT
00
es 0 (= 27 oP »| y=
* yg |
aan then (2 AY al “3 A
Deux conséquences directes de la fgm sont (l-2t)
E[x2(p,d)] = p+ 2d, var [x*(p, d)] = 2p +8
de
et si 2) ~ x2(pi, Ai), i= 1,...,k, sont indépendantes alors
&
Pind) »)
a
La fagon la plus simple d’obtenir les moments est «utiliser le mélange
poissomnien.
Barve de
4.3 Formes linéaire et quadratique
MWe (24% — On éuonce maintenant tn fym une forme quadratique quel
conque. Si ¥ ~ N,(11,V), od V est définie positive, alors q = Y'AY,
4
exel 24 Yon et) al ow A ext symétrique, a pour fgm
Cte) (i) = Wm 2tave esp {Sul avy] eo wh
= [= 2AV 4? exp [ey ACT 20v,a) tn] ,
Ye NUnl)
définie si t < ty = min {t : [J — 2tAV| = 0}.
Yanda)
3 dave un vorrimge te t=2
"egal
reat
hye4.3. FORMES LINEAIRE ET QUADRATIQUE a
Preuve : On fait d’abord la preuve pour V = I. On écrit Ja décompo-
sition spectrale oe ea
oS Dive mes vale Nees]
LALDAIY, AL = Dy = ddiag( A) fe
On pose 7 = IY dont la distribution est N,(6,1) avec 8 = Py. La
forme quadratique devient ly’ yay =v fi me ¥
. ‘9
a= 2D2-4, fiat
» Bus
ot les 2? ~ x1, 92/2) sont indépendantes. La fgm est done :)
o FB avdndgin (Sir
u » ;
fqn & 7 mid) = [[B (0?)
Ba
cy Tl 2) ex [rnazv(a 2td)|
HAT = Dyer OO
i apace |r 2p Po [ese Sos - 24).
= 7 -atO
uy développement algébrique simple
> Oras FB potonpament ates
TALI — 2tA)'P
y TAU ~2tay'r =
Cap schay the) = Dy,
rer -24a re
2duy Ltr2 wot Ai/(1 — 21A,), ce qui permet d’écrire
38 & Oe =chag O/ce aun)
\6F/(L— 244) = 9'D,S :
tatoo & pe = aroe OH
= = KTD Tp at
= kay Oal-ztary ) Say Pact atay a
Finalement,
tA(I—2tay! = ~pr-20a =IN(i- 28a)! = +} [1-27]
Se ea ata elbIA)< Ts
be Uno tr Ling) 22 CHAPITRE 4. FORMES LINBAIRE ET QUADRATIQUE it
{lio)= elon) : ‘
& (W Jeb ce qui prouve le résultat lorsque V = J. Lorsque Y ~ N,(j1,V), on i
pose
by (a= a tnd ; a av MY NV pt) :
(AQ) = ae ct la forme quadratique devient q¢ = Y’AY = Z'V'?AV¥?Z, sur la- :
La) = 7 a) quelle on applique le résultat, démontxé lorsque V = I. (
Gz y ag Concemant les moments de formes linéaire ot quadratique, si, ‘
4 Y ~N,(ys,V), alors yl tel" ley) an (
SZ Way EWV'AY) = tr(AV) + e’Aye pave)
IV QR var(Y/ALY) = 2tr(AiV AV) + 4y/ AV Apt i
cou(Y' ALY, Y'AaY) 2tr(ALV A2V) + 4p! AV Aap He
- yes cov, YAY) = 2V Ay 0
cor(BY,Y'ALY) = 2BVAyp.
>
1
\ FeV Les deux premitres expressions peuvent étre obtenues en dérivant deux °
fois la fam m,(l) dune forme quadvatique. Pour ce faire on aura besoin ‘
\ Ay! B des régles de dérivation suivantes. Soit, A une matrice dont les éléments C
1 sont fonction d’une variable £. Alors, on définit a
Care) =A tB ¢
aN dA _ (das '
(aizck : de ae q
+ = pt (
{apy =8°A On peut alors montrer ¢
dal _ (da ¢
/ de 7 We (AVS '
a® dashed al Ay H
dt ( 4
‘La premitre expression Pv soa lus fagilement compre ‘
ty (Ay ai y(n 'A) ye & seogerasrd de. ONT ate la ‘
= DY EW'AY) = Btr(AYY!) = o[A BY] ‘
= tr[A(V + py')] = tr(ALV) + x Hu Ga «
Condition pour qu'une forme quadratique suivk une Ikhi ‘
deux. Soi Y ~ N,(y4,V); V définie positive. Alors, COLO §
= 2 n
gry AY 9 = VAY ~ x (0A), 1 An/2) °
yep Ypres ZO Np oF, fi
Elbe peal ‘
a WY;
Bee yn oy tt 4
DO ue TY Ya
pat ay deg OMY Veta)
ye
\: ened
ZEON a a al
. a
ae a Ay)
cor eLny EUNL &,
+E LE
(
122 CHAPITRE 4. FORMES LINBAIRE ET QUZBRATIQUE
ce qui prouve le résultat lorsque V = I. Lorsque ¥ AN,(j1, V), on pose
‘et la forme quadratique devient g = YIf¥ = Z'V?AV¥?Z sur la-
forsque V =I.
— Concernant les moments de for: inéaire et quadratique, si
Y ~ N,(u,V), alors
BY'AY)
(AV) +H Ae
= 2tr(A\VAV) + 4p AV Aye
QW Ay
= 2tr(A\VAgV) + 4p AV Agu
= 2BV Ay.
Les deux premijfes expressions peuvent étre obtenues en dérivant dew
fois la fgm_ d'une forme quadratique. Pour ce faire on aura besoin
dos ragles dy/Aérivation suivantes. Soit A une matrice dont les éléments
sont fonct6n d’une variable ¢. Alors, on définit,
dA _ (des
dt dt
peut alors montrer
ala
or lest cependant plus facile d’obtenir les moments directement comme
suit. On pose ¥Y = p+V¥?Z, ot Z ~ N,(0, 7). Une forme quadratique
q=Y'AY s’écrit alors
q=
(Au + 2WAVI?Z + ZVYP AVIA,
Ensuite, on obtient E(q) = p!Au + Bir(Z’V?AV'?Z), ot
Btr(Z'V?AV¥2Z) = tr[V? AV (ZZ')| = tr(AV).4.3, FORMES LINEAIRE ET QUADRATIQUE 23
ne
Pour te deuxitme moment, on pose T’= V7 AV" et on développe
(HAM) + (ZTZ) + 4QiAV'PZy +
+2(u'Ap)(Z'TZ) + 4(n Au) (uAV?Z) + 4(2'TZ)(u' AVY? 2). a
Par symétrie, les moments mixtes @ordre 3 de Z étant tous nuls, les
deux demiers termes ont une espérance nulle. On évalue & présent les
cespérances des autres termes :
BWAVP Ze E(w AV? Z2'V? Ap) = AVAL
E(Z'T2Z) = tr(T) = #r(AV).
Pour le terme restant, on écrit 2'TZ = ry tiy%Z, Pod
?
2
CSA) ATA) = titer
im
En utilisant les moments mixtes d’ordre 4 de Z,
E(ZZj2,21) = pir = Subiy + bud + Subp,
on obtient
TAY) = YS" tester(Sudss + Sud + 5
oes im
ez zi ‘) = Vita +208,
: tu: eZ, 7
cE (22r5 t(D) + 26r(T2) = (AV) + 2tr(AVAY).
On a tous les éléments pour obtenir £(q?) et var(q). De semblable
fagon, on obtient
cou(¥, YAY) = cov(V¥9Z, ZV V#AV PZ + QAVYAZ)
= VIP BIA(ZV'PAVPZ + 22'V¥? Ay]
= WAREZ VY Ap = QW Ap.
La formule de la covariance entre deux formes quadratiques découle de
Véquation suivante
var[¥"(Ay + Ax)¥] = var(¥'A\Y) + var(¥/AaY) + 2cov(VALY, YAY)
2tr[(Ay + Aa)V (Ar + Aa)V] = 2tr(AiVALV) + 4p’ AyV Ay + 2tr(AgV AgV)
F4yl(At + Aa)V(Ay + Aa) +4 AgV Agu + 2cov(Y'ALY, Y'AaY).43. FORMES LINEAIRE ET QUADRATIQUE 23
si et seulement si AV est idempotente. cvr=Da
Preuve : Supposons d'abord que AV est idempotente et éetivons V =
C'G, o't C est inversible. Alors, B = CAC! est aussi idempotente de \~ THe
méme rang que A. En effet, coe ot 1
BP = CAC'CAC' = CACICAC'CC™ = CAV AVC ar
all = CAV = CAC'CR! = B. Vee ad
Mexiste P orthogonale telle que fe C= pe c'
PAT =b i on .
rae =e r’ar= 5 oe 2 HON TINgUla ne]
on
reps di oar “RP on paw ¥ Peter ye hy ony
YAY, = Z''CACTZ ~Np (rece c c cD
= SUBS
= (a1 8)(5 8)(B) WM perelecer
ei aaa
= AZ. 1»)
Done q ~ x(r,), 08 av oy i a
q
wena eo (4) Car oro nye :
eats gl oe = open yy BS CAS Dead!
oe geneous = HAW? oo:
e(A)= tr ay)
Pour la réciproque, considérons d’abord le cas V = I, Par hypothese,
tmg(t) = |f— 2tA-Y? exp [tp A(T — 2A) yt]
= (1 28)? exp ftp’ An /{1 ~ 24).
Cette égalité implique nécessairement
(= =[Ja-ay (41)
7
zone ov pe
me - {Alict
pee Unc ay
: Nyinde
re net2
CHAPITRE 4, FORMES LINEAIRE ET QUADRATIQUE
et
HACE ~ 2A) "ye = Ap /(1 — 2), (4.2)
olt les + sont les valeurs propres de A. Les deux polyndmes dle (4.1)
sont égaux lorsque r des 7% = 1 et les autres sont nuls. Une matrice
symétrique dont toutes les valeurs propres non nulles sont égales A 1
est nécessairement idempotent. La matrice A est done idempotente.
Lorsque A est idempotente, on notera que (1.2) est satisfaite, Pour
tune matics V générale, on pose Z = VARY, ~ NV *74 1). Si
Y’AY ~ y2(p(A), n'Ae/2) alors, ys 2VMe
PVP AVA ms x4 p(VYPAV') AEM VIRAV YR. VG /2),
Ceci implique V'/?AV"/? est idempotente et done que AV est idem-
potente.
Un résultat sur la diagonalisation simultanée de deux matrices
symétriques. Soient A et B deux matrices symétriques. Il existe I
orthogonale telle [’AP ct PBT sont diagonales si ct seulement si AB
est symétriqne (AB = BA)
Prouve : Supposons que [YAM et IBY sont diagonales. Alors
TABP = TAP -P'BE = TBE TAL = 1'BAP
= ph
ce qui implique AB = BA. Pov la réciproque on suppose AB = BA
Il existe P orthogonale telle que
PAP = diag(Malny--)Aslru)
oft on a tom compte de la multiplicité. La matrice PB commute
avec la matrice diagonale IYAT. On peut vérifier que si ume matrice X
commute avec une matrice diagonale D dont les éléments diagonawx
égaux sont regroupés alors, X est bloc diagonale. En effet, (XD);j =
au ot (DX)y = diy ot done y(t ~ dj) = 0. Ceci impliqne que
c1j = O lorsque d # dj, Poi la structure bloc diagonale de X. Done
IBY = diag(Bi,..., Bs),
ot By £7) X reat symétrique. Il existe des matrices orthogonales P,
joer, belles que
PBL = diag (tiny)
On définit la matrice orthogonale I = diag(Py,...,P,) et on vérifie
que P'f' est la matrice recherchée.
Soe MO Cn Cd)alsest
4.3. FORMES LINEAIRE ET QUADRATIQUE, 25
Indépendance de deux formes quadratiques. On prend Y ~
Np ¥), ot V est définie positive et Ay, Az sont deux matrices
symétriques. Les formes quadratiques Y'AY et ¥'A2Y. sont indépendantes
si et seulement si A,V A, = 0.
Supposons d’abord A,V Az = 0. Il existe C' inversible telle que V =
C'C. On définit Q = CA,Ct et T = C'AgC" ot on vérifie que QT
Done, Q et T peuvent étre dingonalisées simultanément. Il existe I
orthogonale telle que
D0) 0 0
var=(% 0) Prr=(5 b) \
On effectue le changement de variable, 7
Orly ww NC, 1)
Y=CTZ, 2%
z:
Les formes quadratiques peuvent étre réécrites comme wie ) pol:
VAY = ZPCACTZ ~ AVON — Zz — an
YAY = 2D%Z,
ott oe
ae(” acr)
Gaia 2irtc
a deux composantes indépendantes. Supposons & présent que les deux
formes quadratiques sont indépendantes, Alors,
ott q = ¥"(t Ai + t2Az)¥. Supposons d’abord V = J et montrons que:
A Ag = 0. De la fgm dime forme quadratique, on doit avoir
ne
|P— 2b Ay — tA] = | — 2t Ai] - [I — 2taAal.
Si on dérive cette équation par rapport & f on aura
tr [1 = 2t,Ay ~ 2tgAg)"' Ai] = tr [UE - 2A Al)
Gn soustrait ensuite tr(Ay) de chaque cdté
tr { [( = 2A, — 2tzAa)* — FAs} tr {[(I— 2A, - T] Ai}
tr [(L— 2tyAt — Bt) (tA? + tededy)] = 2tstr ((0-2t,A1)" Al]
t
tr a — 2ty Ay — 2teAy)! (# + ea) tr (0 = 21) 149]Bove gpd:
ee lthetat
de codaprenk ed
26
Conta ate
a eee
alte
CHAPITRE 4. FORMES LINEAIRE ET QUADRATIQUE
Le membre de droite posside une limite lorsque ty — 0. Pour t fixe,
Je membre de gauche posstde une limite lorsque f -» 0 si et seulement
si ApAy =
Dans le cas général, on pose Z = V-"Y, Alors,
YAY = ZV AVIPZ
YAY = ZV AVIPZ
et si les denx formes quadratiqnes sont indépendantes,
VP aviryiegyire—
et done A,V Ay = 0.
Indépendance de formes linéaire et quadratique. Le vectour
Y ~ N,(qt,V) ot la matrice A ost symétrique. La forme quadratique
YAY et la forme linéaire BY sont indlépendantes, si et seulement si
BVA=0.
Prewve : Tl existe C inversibletelle V = C'C. On définit Q@ = CAC".
11 existe [ orthogonale telle que
rer—p-( 4 a)
Soit ¥ =O'TZ, Z=P'C'Y ~ aro, 1). Alors,
YAY = ZDiZ
BY = BCT2=G7=(G G) ( 2 Jean + Gat
a
Done Y’AY est indépendante de BY ssi Gy = 0. Mais G, = 0 ssi
GD =0 ssi BVA = 0 puisque
BVA=GEC" oe
Théoréme de Cochran
Tore’ = Gb. Tc
Propriété des matrices idempotentessSoient des matrices symé-
triques By: p x p de rang r; et B= 5), B; de rang r. Si B est,44. THEOREME DE COCHRAN, qT
idempotente et r= 77; alors, les B; sont idempotentes et BiB; =
Pau Rappetons dabord que pour toutes matrices C et D,
AC + D) < pC) + pl).
Rappelons aussi que pour toute matrice symétrique C : p x p,
AC(I — C)) = p(C) + pI —C) ~p.
En effet, soient 1,....rp les valeurs propres de C. On définit Ay =
{i: A £0} et Ay = {i A; 4 1p. Alors,
#AoU AL) = dtAa + #Ai — #(AoM At)
Pp = AC) + pI —€)— ACU C)),
Puisque B est idempotente de rang r, p(I — B) = p—r. D'une part,
PU — Bj) = pl ~ B+ 3B) 0. De plus, si un élément. diagonal
est 0 alors, en examinant les minus principaux dordre 2, tous les
éléments de sa ligne et de sa colonne sont aussi 0. On pent done réécrire
la dernidre équation comme
(Tir o)=(0 a) *(0 8).
En prémultipliant par "BT,
(28)-(88)+(43)
dot GH
— Pour le théoréme de Cochran, on prend ¥ ~ N,(v1, V), m matrices
symétriques A; de rang rj, A= 7, Ai. Si p(A) = DY, 7 eb AV est
idempotente alors,
1. les Y’A,Y sont mutuellement indépendantes,
2. YAY ~ x2(ris nt! Aatt/2)- Ces ronama@plarst (
Preuve : Il existe C inversible telle que V = C’C. On définit
0. Ceci donne I” BT'T’B,T' = 0 et finalement B;B; = 0.
B-CAC=S7GA -S 2, B= CAC"
et évidemment p(B) = 32, (Bj). De plus B est idempotente puisque
BY
vit = CAC'CAC' = ‘Ayacac” = CAVAVC =CAVC = CAC’.
BB; = 0 lorsque ¢ # j. Les matrices A\V sont done aussi idempo-
tentes puisque
(AC'CYAC'C) = C(CAC)(CACIC = CMCACIC = ACC. =A V
(iN LAW) HACE ONCE
wate le lemme précédent, toutes les B; sont idempotentes et satisfont |
(
'
i
’
4
(
i de Dice
ane ee
Cc ria4.5. LOIF 29
Cette condition est suffisante pour que
VAY ~ x7(ri, 4 Ant/2).
L'indépendance par paire est aussi vérifiée puisque
AWA; = C(CACYGAC)C '= 0 'B,BC™
Ag z
Mais en fait, on a en pl épendance mutuelle. On peut le voir en
posant Z = C'
VAY =Z(CAGY, = 2'B,2 = 2'B1Z = BZIP. lex dengton tl
L’indépendance mutuelle est satisfaite puisque GiZoOr meuamoude sloporels
BL By ~( 8 ‘ 7
coo}: Jal: [tC By + Bw) =diag(Br,-+-, Br) ee
Bm Bu Oo Be
aN
4.5 Loi F Weird
On définit la loi F décentrée. On prend q, ~ x2(p1,A) indépendante de? * ot
2 ~ X2(p2). Par définition, 1a loi de Ja variable Dd canrs
_ alr
e/a
est Ia loi F a py degrés de liberté au numérateur, py dogrés de liberté au
dénominateur ct parambtre de «écentralité 4 > 0. Dans ce eas, on écrit,
Fw F(a).
En particulier, on écrit. P(p1,p2) au lien de F(p1,p2,0) dans le eas contré,
est d=0.
4.6 Exemples
1, Echantillon aléatoire yj,..., yx iid de la loi N(p, 07) T=
¥ ~ M(Jut0°Fn)- ue A
@au wa) Gann Wn]
ve Nad ly)
30 INES SAIRE ET QUADRATIQUE
la 2
chy URN dee we = te =H
a rae
2 i o
" ahYME Gr al “oP Dare 3s bo
a a ed z
: 7 GEORG 1 Vite xO
1 1
ny? x hoy y
7 Indy + [In — Se Inedy
Gas Une] mnt LW
axon x fig) = V LED.
A Sin Les formes quadvatiques 41 AU, NP /(20%)) et a2 ~ 0?x2(N-1)
sont indépendantes.
N
L
aN \ 2, Plan équilibré & deux traitements T~1 et C = 2 et NV = 2r observa-
A B tions, Avee les matrices w=
neds
<
!
when Yne 1 (
IalegJnp me) (i Jeti) 2) : ail care ders}
oe
= Mea So helt vel Me] xel 7 } | on(4 ’
N ya 1-1 é ¢
wd) 2 HEN : wihensehy ay
a de oo ie 1-1 fa a jlo (
a 72 © Cyan de Y devient whe Boe Re
h :
A _ {ete wwla &lyie
Tel Ce oe BO) = xo= (MS Jon ae
woe \y 2.6 mode linéaive serie
Yow (( wre jou ott)
La décomposition de la variance totale est
ae
ah ea ae xf = Me oa a" Sow a?
Sv ~ Far, 7 = Y'X(X'X) 1x" 1
ven Get how Ie) " orca Whecae oe = \a luda
4 ~ to
we iat |e) B)esue/
2 te WSL: wl [ated F
pUgy'e'> WA st] obs nito~ sede)
\4.6. EXEMPLES 31
ie le(i roses [C4 test]
q= bs at Heweat ier
N = 141+(N-2).
Les formes quadratiquies
th ~ 0°x%(1, Nye /(20%))
te ~ 0? x(1, N6?/(20"))
gy ~ 0 x"(N -2)
ituellement indépendantes.
tions équicorrélées de la loi_N(y1,0?). Le moddle linéaire
dant est
YON (Ivin¥
o°((1 — plu + pI Jl) -
Considérons les formes quadratiques
—-
Nye = Y
IvIRY
l
sot] ¥. i.
Soient les matrices
i fl
A = aarcinami)
1 ates
4 = aap [1 x Judy]
Alors, les formes quadratiques a = Y’A1Y et dz = Y'Aa¥ satisfont
a ~ CL, NyE/(207[(1 — p) + oN)
% ~ (N21)32
CHAPITRE 4, FORMES LINEAIRE ET QUADRATIQUE
sont indépendantes puisque
lip
AV = ade
cst idempotente de rang 1 et
Aw = In — Jd
est idempotente de rang NV — 1 eb A\VAy = 0. En fait, la forme
linéaire § ~ N(q,02[(1 =p) + pN]/N) est indépencante de la forme
quadratique 72, (yi — 9)? puisque
" a lay
Teale = (Lp + Np)Iylly — yy dvd
On aurait pu aussi appliquer le théroréme de Cochran avec la matrice
1
o iaiis asin Pate urine
er) [fm (=p) ten
IyJhy
On vérifie alors
A = AtA;
N = 14+(V-1)
et AV = Iry est ume matrice idempotente de rang NV.Chapitre 5
Estimation et test d’hypothése
Le modéle linéaire oit Jes observations sont indépendantes de distribution eno
ecko
normale se résumne dans la distribution conjointe Se mrance
A 2
Y ~ M(X0,07ly), ee? ex Hoa
ott la matrice de constantes X : N x p est de rang colonne complet p(X) = p. :
Pour l'estimation des paramétres on utilise la méthode pasée sur \ ygaisem vy-xXe) W -e)j
2
Dianog des paranBas fet 7 7 py)= ler? | 8K? oe E &
In L(0, 7) = —(N/2) In(2n) — (N/2)In() — (¥ — X0)'(¥ ~ X0)/(27).
On obtient les estimatenrs en maximisant cette fonction des paramétres.
5.1 Régles de dérivation
On applique les régles de dérivation d’une fonction par rapport A un
vecteur. Si f(é) est une fonction de t= (t,..tn)', on définit le vecteur
gradient
Of ft,
Vy = 4 (O/at = :
Of [tn
et sa transposée df(t)/dl’ = (df (t)/dt)’. Aussi, on définit la matrice Hes-
sienne (symétrique), ou la matrice des dérivées secondes, par
0 = aupcosanat = (525-110).
3334 CHAPITRE 5. ESTIMATION ET TEST D'HYPOTHE
En particulier si f(0) —tAt-+ Ut -+-6, A symétrique, alors,
Vy = 2Ab+b
Hy = 2A.
5.2 Modéle sans contrainte
Appliquant ces régles, on trouve les équations satisfaites par les estima-
tours
X'x6 = xy Scorn reopeclo @
F = QDIN, 3 comvespetd — Waa.
ott in WY (xa
Q(0) =(Y - x0)(Y = x0). i oe
Avec Phypothése que X est de rang complet on obtient HKG ty,
A cbt "x! 6 = xy exes lee
= \
EAE yey ot = Vy xox tan.) TL OK) dy
yone ski ¥ X EOS= 6
Agere UE (AY). La matrice X(X'X)"1X' est idempotente de rang p et la matrice Iy —
QUA) —X(XIX)-EX’ est idempotente de rang N — p. Les distributions des esti-
vimatwrareY mateurs sont done ExY)
at WOE HK
6 ~ N,(0,0%(X'X)")
QO) /o ~ Np)
+
oit 6 et Q(4) sont indépendantes puisque
(XX) EX" [ly — X(XX) 7X] = 0.
Ceci suggéve utiliser plutdt Pestimateur sans biais
# = QO) (N —p)-
@optimalité des estimateurs découlent, du fait que ce moddle
le exponentielle de distributions, e’est-d-dire que la dens23 sept |
5.3. MODBLE AVEC CONTRAINTE 35
Drolet nw Htinemall)
est de la forme
H¥50,7) = Qn) esp |
(y — xoy(y — xo)]
ay
1 1
mf ‘X'XO Lary - oxy]
xD. ex |-35 7
wK
NAT ta bres osvty
= a(0, Vol exp [= Siem] Y aes St ame
7 rae | mroppr
HO = h36
CHAPITRE 5. ESTIMATION ET TEST D'HYPOTHESE
oil comme avant on a encore
(0) = (W — oy ~
dno RS Bodh
Finkt § Jang @)HS=h
ween Ae
Finalemént, 6 s’écrit
+t
en ferme de Save
fe\P
XQ.
JR premitze équation
= (XX) x'¥ 4H’). OM)
On substitue cette expression de @ dans la tré
6 =(H(X’x) tH)
TRI VaNIS om
= H(X"
"
ng équation pour obtenir
che,
¥I
goot erdenrly &
olen 2
ete eve ES
9 Ab Bh
ott 6 = (X'X)1X’Y est Vestimateur sans contrainte et
A = 1,-BH
B= (XX) A(X'X) HY.
Les propriétés suivantes des matrices sont maintenant démontrées.
(a) A est idempotente de rang 7
(b) (XIX)! = A(KIX)
%
AUX) LA,
(c) XA(X'X)"1X! eat idempotente (symétrique) de rang r,
(A) Iy — XA(X'X)-1X" est idempotente de rang N — r,
Remarquons dabord que HB = I, ce qui implique BHBH = BH, i.e. que
BH, et par conséquent A= ,~ BH, sont idempotentes. Le rang de A est
AA) = tr(A)
Calculons maintenant
(XX) TA = (XX) (XX) TB!
(X1X)} = (XX) LX X) LL XX)
= (X'X)"! — BH(X'X)*
= Axtxy?
A(X'XYA = ALAXX)! = AIX),
=p-tr(HB) =p—q.20ND
e
5.4, MODELE REDUIT DU MODELE AVEC CONTRAINTE 37
et
axy-tyt. 1 NXY VX! = XA XEXY EX! = XACATX)EN!, Wenn Og, 25
XAURIX) ANT: ACLU) AN = KAREN! = XA) ANY, Megraetd le,
En ce qui concerne le rang, -
ioe iean es ayy D=Tp-th
La pattie (d) est ume conséquence immédiate de (c). = pa aye
On obtient maintenant les distributions des estimateurs en commencant
E ALLO x (xe +e PBN
am y
: 2 A HA HOWE +OM
AB+ Bh EURO TAG OTK 2+OK
OF AXXO qu lyr Xe Jair
Tstensuit A Ontine B any (Or eA IHREN AY
O~ N,(0,07A(X'X)'). A x' TA EA CRT
Pour Q(0) on écrit, S Banele, rex’) yy
z aces on x'e
Y-XO = [ly-XA(X'X! Xe Yo RSA TKO au oe
A ; Hx) =e = MAX
QO = ely —XAXY Xe. Fy vin veo Je
La matrice jy — XA(X'X)-1X" étant idempotent de rang N —r Zien pe psNo
Hat ~ 2
Q()/0? ~ X(N 1). Hone
On utilise plutét Pestimatenr sans bi
# = QO")
‘L'indépendance entre @ et Q(6) est facilement établie par le produit,
A(XIXY AX Ey — XA(XXY IX] = 0.0,
-
5.4 Modéle réduit du modéle avec ¢ontrainte
Une autre fagon équivalente de résoudre le modéle avec contrainte est de
considérer le mode réduit. Supposons que H et 9 sont partifionnées de sorte
que os OR)
HO = Hy0, + Had, =h A
o- | )8
gz [ea
=u ve)
neaBin enlate © ~AS +h
38 CHAPITRE 5. ESTIMATION ET TEST D'HYPOTHESE
oi Hy sq xq est de rang q. On peut exprimer q des parambtres en fonction
des r autres paramétres
0, = Hy — Hy Hae.
On utilise une partition conforme pour X = (X, Xz ) et on substitue dans
Ie modele pour obtenir Yaxe te Ye Ki8h —KHth lee Ogre!
QE 5 61 aXe Oehe
Y—MHy"h = (X2—XHy A) +e
Ya = Xno +e.
Kiene
L’estimation dans ce modéle est en tout point identique au cas sans contrainte
0, = Fret
58 = Qnlds)/(N 7)
Qnl(02) = (Yr — X02) Ve ~ Xn2).
Les statistique exhaustives et complates sont donc Op et Qr(b2) = Q(6). Les
estimatenrs proposés sont done UMVUE pour les mémes raisons.
5.5 Estimateurs BLUE (Markov)
On peut également obtenir une propriété d’optimalité plus faible sans
supposer In normalité et en utilisant uniquement la méthode des moindres
carrés. On s'en tiendra uniquement au modéle sans contrainte. Le probe
optimisation
minimise Q(0)
a aussi pour solution 6 = (X'X)"IX'Y. Dans le modéle
Y= X0+e, avec Elec’) = oly,
6 est encore sans biais et var(4) = 02(X'X)-. On monte maintenant
que pour toute combinaison linéaire des parametres, a’8, Vestimateur a’8
posséde la plus petite variance parmi tous les estimateurs linéaires et sans
biais (BLUE ou best linear unbiased estimator). Soit 6 = CY un estimateur
linéaire et sans biais. Alors,
4 = E(CY) =CXO, pour tout 0,
Q 6) = (y¥-x8)! Ye)
ae) a
vans ( 4 teat V a> Ge=Ql
sere pr ned
SB
) Mn-?)R
5.6. TEST D'HYPOTHESE LINBAIRE 39
C'est-i-dire CX = Ip. Le théoreme de Markov est satisfait, oA CUI-xxy x! ]eo20
Gen
var(a’d) eo
<
puisque la matrice Jy — X(X'X)"!X" est définie semi-positive.
5.6 Test d’hypothése linéaire
On confionte Phypothese linéaire ‘ 4
Ho: HO—h ted?) = ce) Eat ee LEO
els) =N- x0) qe
dans le modéte li
Y ~ N(X6,07ly)
Le test dut rapport de vraisemblance (TRY) consiste & rejeter Phypothese
nulle Hy lorsque sass parle encore ay
eB) oc nq MecallOe?) he 33
ete) ™*E(0,0%)
est petit. Les calculs pour obtenir le TRV A ont
- Gee 7-1
jw 2) _ [2
Q) Q0) _
ot
6 = (XX) XY
6 = Ad+Bh
B= (X'X) A TH(X'X) ay ra
A = I-BH Be U-onse,
20) — (—XoyY — x0) KO =
xm
Pour obtenir la statistique du test il est approprié d’écrire Ny = Q(0) —
Q(8) = 0 comme une foungs quadratique. Dans ce but, on écrit ze
okay ~ X64 XB(HO—h)
= Y- XA 6 +x3h e
2 z3 a
- \-* CE -64) 8 =xBH w= | Ware 6 )
= \y-x6)+x8u A (ydYX6 WS-)
2 Y-X* (ET - By )d-*By Wd WRATH)
+
oe)" eee Dep & WW ehexe,
(y>6)'% = y! LT Hote x] ™* + 80-930
40 CHAPITRE 5. BSTIMATION ET TEST DiHYPOTHESE
gla) =~ x8" (as ae ;
et on observe Porthogonalité =y! yy a -~Ox \}
i (v-xdx=0. TYy-XKO Jy ‘
La diffrence Ny s'exprime done sous la forme Qf 4 — yey xeks
= (ONY BIX'XBEHO-I) (yy. xb) &nt
= (HO — hy H(X'X) HHO a). ee
xB.) (yk?
La distribution de Nyy est une conséquence immédiate de \
(HO h) ~ N,(HO— ho? H(X'X) "Hy
qui donne
Nulo? ~ x2(q,X ait bk
lufo” ~ xq.) Ror ley
avec iv
= (110 — ny LHX)" HHO ny /(202) it teate Baws
(a — nya) \10 Ioan. ke Se
On se rappellera aussi que e hes
Q(O)/o? ~ 2(N — »)
Il reste & montrer que N;, et Q(O) sont deux formes quadratiques indépen-
dantes. Soit @* une solution quelconque de 1a contrainte H@ = h. On a les
deux vecteurs
ond Y—XO = [Uy—X(X'X) XY — x6")
Hoh = H(X'X)1X"(Y — x0)
qui sont des formes linéaires du méme vecteur
Y — X0* ~ N(X0 — X0*,07Iy).
Les formes quadratiquos s’expriment maintenant
Q0) = (Y — XO [ly — X(X'XY XY — XO")
Ny = (¥— X60"! XBH(X'X)"'H'B'X'(Y — X60")
i Uy — X(XIX) XX BH(XIX)HHIBIX! =
yz
at independ.5.7. PUISSANCE DU TEST F a
mobls tekato
ce qui établit leur indépendance. wmideko aprscal
Un TRY est done équivalent au test F qui rejette Hp pour de grancles valeurs
de ™ YWdoonrotet
= ght —~ la. 2.2)
© QOD ve da sen
Le TRV de niveau a consiste donc & refeter Hg lorsque a
™ 3)- 968)
Pag Fela Np). nye 408)
La statistique Nj du numérateur est simplement augmentation dans la
somme de carrés résiduelle qui se produit on passant du modéle complet au
modéle réduit. Pour Vobtenir il suffit done d’ajuster les deux modéles,
5.7 Puissance du test F
De manitre générale, soit
Ta(PisP2 A) = PLF (Pi, P2, A) > Fo(Py,P2)]
(Disb TP(ispy ) > Op
la puissance dun test F de niveau a. Cette puissance satisfait les propriétés
aby prek pe cont 1xed 9) HS eo gees
(a) mopotone eroissante en d ¢
(b) monotone eroissante en a
(c) monotone croissante en pz
(d) monotone déeroissante en py.
Pour chacun des énoneés on garde les antres valeurs fixes
= SF soot
+ : No Po ah
°5.8 Quotient de Rayleigh aap. ae
i
= =
Rappelons d'abord Je quotient de Rayleigh. Soit IV une matrice définie 4
positive, Alors, ie : iste Ga, a
(a'2)? — yl, Mee Qorhy. gh
awa 2° 4
pour tout vecteur a # 0. En effet, avec b= Wa,
(a'z)? _ a'ea'a UWP WP e wb
= SAW ae) soe,
dWa Wa vb42 CHAPITRE 5. ESTIMATION ET TEST D'HYPOTHESE.
Done si a’W-le < ¢ alors, (a'2)/(a'Wa) < ¢, Va # 0. La réciproque est
aussi vraie en choisissant a = Wx. Ceci donne Péquivalence
(way.
Vous aimerez peut-être aussi