0% ont trouvé ce document utile (0 vote)
54 vues130 pages

Analyse de La Variance

Le document présente une analyse de la variance (ANOVA) et aborde divers modèles linéaires pour comparer des traitements. Il détaille les concepts de planification expérimentale, de randomisation, et d'estimation des paramètres, ainsi que les tests d'hypothèses associés. Des exemples pratiques et des méthodes d'analyse sont fournis pour illustrer les applications des modèles statistiques dans différents contextes expérimentaux.

Transféré par

Dana Ruiz Moreno
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
54 vues130 pages

Analyse de La Variance

Le document présente une analyse de la variance (ANOVA) et aborde divers modèles linéaires pour comparer des traitements. Il détaille les concepts de planification expérimentale, de randomisation, et d'estimation des paramètres, ainsi que les tests d'hypothèses associés. Des exemples pratiques et des méthodes d'analyse sont fournis pour illustrer les applications des modèles statistiques dans différents contextes expérimentaux.

Transféré par

Dana Ruiz Moreno
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF ou lisez en ligne sur Scribd
3320 STT 6410: Analyse de la variance Martin Bilodeau Département de mathématiques et de statistique Université de Montréal 4 septembre 2015 Table des matiéres 1 Introduction ad 1.2 Généralités . . nae Planification et analyse «+. = - 2 Comparaison de deux traitements 21 2.2 Mode linéaire : eae Mod&lé basé sur la randomisation 3 Exemples de modéles linéaires 31 32 Le mode linéaire . - Notation matricielle 4 Formes linéaire et quadratique ad 42 43 44 45 46 Concepts élémentaires et loi multinormale Loi du khi-deux 20.2. ++ Formes linéaire et quadratique - ‘Théoreme de Cochran Loi Bxemples 62-2002 5 Estimation et test @’hypothése 5. 5.2 53 54 55 5.6 5.7 Regles de dérivation sae Modéle sans contrainte... . foie Modéle avec contrainte... 6... Modble réduit du modéle avec contrainte Estimateurs BLUE (Markov)... ‘Test ’hypothése linéaire eo Puissance du test Fs. . see a ° iw 12 17 17 19 26 29 29 33 33 a4 35 37 38 39 aL TABLE DES MATIERES 5.8 Quotient de Rayleigh 2.0.2... orotate 5.9 Intervalles simultanés de Scheffé . 42 Plan a un facteur 45 G1 Estimation... 2.20... 20, sees +. a5 6.2. Test dhypothése . 2... ser teeea secrete td 6.3 Intervalles simultanés. 62... 2 a 48 6.3.1 Scheffe . ae : ane 48 6.3.2. Bonferroni. : eae seen AD 63.3 Tukey .......... sea 49 6.4 Contrastes orthogonaux eee reece 6.5 Unexemple . . eee ese see eee etree eee ee ea 6.6 Tests d'étendues multiples... 56 6.7 Autres paramétrisations +. 88 6.7.1 La restriction Pynja; = 0 seealtee 80) 6.7.2 La restriction a =O... ear . 59 6.8 Facteur quantitatif eae ‘ ses 60 Plan a blocs randomisés complets 63 71 Deux traitements Berner sree earn essere 7.2 Plusiewrs traitements ©... 0.0... : 66 7.3 Test dhypothtse 2.0... ac - 69 74 ANOVA . ee pee TO 7.5 Intervalles de confiance.........-2.0..004 a 7.6 Unexemple ..... : : : 1.7 7.7 Paceur quantitatif 6... ee Loe BB Plan équilibré A blocs incomplets 75 8.1 Estimation des paramdtres Hire eeeea neces . 5 8.2 Comparaisons des traitements . : SereaeceeeD 8.3 Estimation de la variance 0?» 2... ee 80 84 Test dhypotlidse ee 81 8.5 Comparaisons multiples... eee 83 8.6 Un eccenuple sree ter vente reece astrc arate vee eee es 88 8.7 Efficacité relative see 84 TABLE DES MATIERES 9 Plan factoriel complet 9.1 Deux facteurs . . « Bria eat 9.2 Estimation... .. + eee 9.2.1 Modéle sans contrainte 9.2.2. Modéle sans interaction 9.3. Tests des facteurs . « 9.4 ANOVA . : 95 Paramétrisation du modele . 9.6 Interprétation des hypotheses 9.7 Intervalles simultanés . 5... 9.8 Modele sans interaction 9.9. Une observation par traitement. 9.10 Contrainte d’une modalité nulle . . . « 9.11 Plan factoriel & plusieurs facteurs. 9.12 Un exemple... 6... +--+ + 9.13 Types I, et WIL... 10 Plan factoriel fractionnaire 10.1 Introduction... - 10.2 Le groupe commutatif ordre ” 10.3 Le plan général 2* . 10-4 Batimations des contrastes 10.5 Plan factoriel fractionnaire 10.6 Un exemple... - 10.7 Un plan 2° partiellement confondn ger 87 88 +. 88 +. 89 ++ 89 91 92 93 rere et a eee tO. 96 97 97 100 101 107 107 ea oe ed Bee erapLLo, eee Se aeeercset da: BS TABLE DES MATII vi eS es Oe Chapitre 1 Introduction 1.1 Généralités — Expérience : Une investigation ott le systéme étudié est sous le contréle de Pexpérimentateur, Les individus, la nature des traitements ot les méthodes de mesure sont décicées par Vexpérimentateur. Par exemple, dans un essai clinique randomisé, des patients sitisfaisant des crittres bien définis (Péligibilité, sont assignés par une méthode impersonnelle, aun de dens traitements : un nouveau traitement T et un traitement standard on contrdle C, lequel est peut-étre le meilleur traitement ponible on un placebo. Les patients sont suivis un certain temps et une ou plusieurs réponses sont enregistrées. — En agriculture, 1m champs expérimental est divisé en ‘plots’ de taille et de forme déterminée par Pexpérimentateur. Chaque plot est assigné & un, parmi plusieurs, traitement de fertilisant, souvent une combinaison de différentes quantités de substances fertilisantes, et le produit de la récolte est: mesuré — Dans une enquéte sur les attitudes sociales, un groupe dindividus est interviewé disons chaque année. Dans de telles enquétes, Vat- trition (départ d’individus pour une raison ow une autre) est ume préoccupation fréquente. Une fagon de réduire attrition est doffrir lun petit montant quelques jours avant V'interview. Une expérience sur Pefficacité d'une telle mesure pourrait, prendre la forme dindivi- dus randomisés dans un de deux groupes : avec et sans récompense monétaire. La réponse binaire serait achdvement ou non de I’inter- 1 2 CHAPITRE 1, INTRODUCTION view. — ‘Trois éléments principaux A une expérience : les traitements, et la réponse. Une version schématisée d'une expérience est celle oh on a un certain nombre de différents traitements sous Gtuce, Pexpérimentateur assigne um traitement & une unité expérimentale et, ensuite, oberve la réponse obtenue. Les unités expérimentales sont essentiellement les patients, ‘plots’, animaux, les matériaux bruts dans une étude. Deux unités expérimentales penvent recevoir différents trai- tements. — Lobjectif est toujours de comparer Veffet de différents traitements sur la réponse. Cet effet est évalué par des estimés et des intervalles de confiance de Pampleur des différences de traitements. — Les estimés doivent étre exempts d’erreurs systématiques, e’est-a-clire de binis. Liexpérience doit. autant que faire se peut minimiser les er- reurs aléatoires. Il doit étre possible ¢estimer Pampleur de ces erreurs aléatoires par un intervalle de confiance. 1.2. Planification et analyse — Lobjectif Pune bonne planification d’expérience est: de rendre Pana- lyse et son interprétation la plus simple et claire que possible. Certains défauts dans une planification peuvent, parfois étre corrigés par une analyse plus élaborée; cependant, cela est souvent accompagné dune diminution de la confiance qu'on porte & Vinterprétation des résultats, — Les analyses considérées iei porteront sur des variables possédant une distribution continue A Paide de modles linéaires. Cela méne & Pana- lyse par la méthode des moindres carrés du modéle linéaire normal — Deux termes souvent rencontrés sont équilibré et orthogonalité. Equi- libré réfere & une symmeétric dans la structure combinatoire du plan. Orthogonalité réfere & une simplification dans analyse souvent ren- contrée dans les plans équilibrés. Dans un plan d’expérience ott les unités expérimentale sont arrangés en blocs, le plan est dit équilibré si chaque traitement se retrouve le méme nombre de fois dans chaque bloc. Dans analyse dun moddle linéaire, deux types d’effets sont or- thogonaux si les colomnes respectives de la matrice du moddle linéaire sont orthogonales au sens algébrique (vectems perpendiculaires). — Fisher, R.A. (1926). The arrangement of field experiments. J. Ministry 1.2, PLANIFICATION ET ANALYSE 3 of Agric., 33, 503-513. Premidre discussion systématique du réle des plans d'expérienee. — Fisher, R.A. (1935). Design of experiments. Edinburgh : Oliver & Boyd. Premier livre sur les plans d’expérience. — Piantadosi, . (1997). Clinical trials. New York : Wiley. Description Alaborée des plans et des analyses dans le contexte des essais cliniques. — Montgomery, D.C. (1997). Design and analysis of experiments, 4th edition, New York : Wiley. Emphase portée surtout sur l'analyse des modiles. CHAPITRE 1, INTRODUCTION Chapitre 2 Comparaison de deux traitements 2.1 Modéle linéaire — Toute variation autre que les différences entre traitements sont consi- dérées comme aléatoires. Ceci comprend les variations entre unités expérimentales et les erreurs de mesures. — On arr observations sur chacun des deux groupes Tet C. Vays ey ¥ini Yous +++ Yon ‘ive Qae BY) = +6, Be) = a Un modéle que Yo, = #45 4 ery, Yo, =n—S+ cy, ott les erreurs aléatoires sont centrées en 0 avec une variance com- anmune o?. C’est une paramétrisation qui assigne aux deux groupes des moyennes arbitraires. — Deux possibilités pour compléter la sp* 1. Moments d’ordre 2 : Les ¢; sont mutuellement non corrélés et ont la méme variance o?. ification du modele sont. 6 CHAPITRE 2. COMPARAISON DE DEUX TRAITEMENTS 2. Loi normale : Les ¢; sont indépendantes de loi wormale de variance constante 0. €) wv ii N@a® Notre intérét. porte sur la différence ce traitement A = 25 Lrestimateur des moindres carrés de A est: la différence des moyennes ‘x. Ye oi Yr. est la moyenne des observations recevant T et ¥c, est la moyenne des observations recevant C. — La somme de carrés résiduelle moyenne est 8 =D {(%, - Yr)? + (Vo, - Yo)*} /(2r — 2). a — Lrestimateur usuel de la variance de A est var (A) = ag evar(A) = 28?/r. — Sous I'hypothése des moments C’ordre 2 nous avons cles estimateurs: sans biais =4, var(A). = ee =4ge 2.2 Modéle basé sur la randomisation Ily a différentes facons, toutes équivalentes, de randomiser tes 2 traite- ents, Supposons ae Acs unités i oa ‘ujgntales sont numérotées Uj, . n=2r Oo) (a (Gal C 1. Tous les sous-ensembles de is 2r)\f(rir!) peuvent en prin- cipe étre énumérés et l'un d'eux est choisi au hasard pour recevoir a 2. Une premiére unité est choisie au hasard parmi U,,...,U, pour rece- voir T. Puis, une deuxitme unité est choisie parmi celles qui restent, et, ainsi de suite jusqu’é ce que r unités aient été choisies. 3. Une permutation au hasard des nombres 1,...,n est effectuée, los premiers nombres sont assignés au traitement T. 2.2. MODELE BASE SUR LA RANDOMISATION 7 — Ppest la probabilité induite sur les unités expérimentales par la rando- misation. On notera par Bp et var Pespérance et: la variance calculée avec la probabilité Pr. — Par exemple, Pala, Us) = eS “pe (2r—2)! _ Ppal¥n, € Un Yo, € U3 #0) ® Alors, ¥z, a la méme chance de venit de n’importe Inquelle des 2r unités Mod@le additif unité-traitement ; Il existe cles co 1,...)2, une pour chaque unité, et une constante antes, € pour 5 = telles que 1. si T’ est assigné a U, alors, observation est 5 + 5, 2. ot si C eat assigné & U, alors, Pobservation est £4 ~ 4. ‘Supposons qu’on estime encore A = 26 par les formules du modéle linéaire. On définit des indicatrices y= by Si Test assigné & Us, 10, si C est assigné & Us. La contribution de Punité ¢ au total ¥z, est T(E +8) et celle an total Yo, est (1 L)Es— 9) — Lestimatenr est done A = Sule) (1 LG—A}/r Fie ee = Le -G—Dhin Jo veer ee EUR) efye ee BES Oy) x 8 CHAPITRE 2. COMPARAISON DE DEUX TRAITEMENTS Les propriétés probabilistes de A découlent de celles de I, a 1 i Ens) vare(l.) = of 1 \ cour(Is ht) = En(lel) ~ at Pall Way h SB 1 ¢ - 1 Gy a 2Qr=1) 4 Neen : yzee) . ee anded So eer Bd) ~ = DYE ah Bint mA? Wa Jew SEK 2 : ifwro (1) ot A oF OL. era = 2{ee De iI} CV WKY i oe ae mz a{dee4(we Ze) 5} AED Ts boh Mls a ' 232 2% Seep vw 1 il =Lgs-038 & 7 Dy y ' 4 ( — Le dernier résultat Se rroAhONO gis YOUN LE 1 \ se démontre rapidement en utilisant Pestimation de la variance dune population finie (théorie de Péchantillonage). Notons dabord que Dever (A= a% Fa [overt] ' ate ne dépend_pas de J. Qu peut done supposer sans perte de généralité sts Me, ~ Tr ramns parte de généralité : Li emne et les valeurs ' + (Ye = Fe Lamoyente rep err 01 les valeurs £1... Y S : — Crepligd? ates in Par qoye> ' T2Cn-t ig de \A bea nye weds cirnansion Hey ay bee car : scalolere> eh salar & La poblactom Bp ( ( \ t ‘ ‘ ¢ ; a ( Bp [ewar(A)] = var(A) ie ‘ ‘ ¢ ¢ € ¢ ( ¢ ¢ ( € ( ( C ha wedia & & , latnanse ¥E ¢ ‘ « 22. MODELE BASE SUR LA RANDOMISATION 9 La moyenne et la variance d'un échantillon aléatoire S de taille r (sans as) = 1Ds mestm de la muha S ca us) = i peo) eam as et procurent des estimatems s Bey = & Flos) = Vv. De plus, Bi amd tid we var [é(S)] = ert ott (1—r/n) est le Facteur de conection pAAFRS TA Ape or pi Sori bed done Bp [evar(A)] = 28s? & dibs Gath tate daw - na AW + 2WVle yoy “(3b (22%4] ig \-n A TERRA & © 7Qr= Ten L& ey? = a tape i SFE Cee On peut recalculer plus simplement la vasianee exacte comme suit "iam WEB. om Ga = TES (7 bt velo de MA vare(A) = varr De a pea 1) ee = Te ye ey. Ee Fare la ranbwicadion, = 10 CHAPITRE 2. COMPARAISON DE DEUX TRAITEMENTS cept I+ Chapitre 3 Exemples de modéles linéaires 3.1 Le modéle linéaire Un modéle linéaire décrit, Ia relation entre une réponse y et des variables explicatives 1, ..,%m par une fonction linéaire de la forme La moyenne de la variable y, pour des valeurs données des variables expli- catives @;, s'exprime comme une forme linéaire de paramtres inconnus 9). Les variables explicatives ; peuvent prendre plusieurs formes selon que Pon aun modile de régression, d’analyse de variance ou analyse de covariance. On suppose toujours que les termes d'erreurs € du modele y= + > Oya; +e rt Ils décrivent: toutes les variations aléats sont centrés en 0, E(e) = expliquées par les variables explicatives considérées. Le modele décrivant observations s'éeri =O +S Byay + ey ja pour compléter la spécification du modéle sont cr 12 CHAPITRE 3. EXEMPLES DE MODELES LINEAIRES BLEe,) x07 0A 1, Moments d'ordre 2 : Les ¢; sont, mutuellement non corrélés’et ont Ia anéme vari Po Ble Ret 2. Loi normale : Les ¢; sn pan de loi normale de variance constante a”. gy yo NO) 2 Des méthodes d'inférence sur les paramiétres 8; peuvent alors étre élaborées : estimation de paramétres, tests d’hypothéses, région de confiance. 3.2 Notation matricielle On écrit les variables réponses y4, les paramétres 5, les erreurs ¢; et les variables explicatives «;; sous forme «le vecteurs ou de matrices & O Bm, / 6 n Lien. 2m a e yale +e Uw Lam. awm) \ 9 ew ‘ow plus simplement Y=Xbre Selon Phypothise faite sur les termes derreur, on supposera Pune des deux possibilités : 1. Moments d’ordre 2 : E(ee’) = o?Iy 2. Loi multinormale : e~ N(0,07Iy). Sous Phypothase de Ja loi multinormale pour les etreurs, le mod’le linéaire devient i Y ~ N(X0, oly). Exemple 1. Le déclin des aptitudes en mathématiques des étudiants (males) en premiére année universitaire entre 1967 et 1978. Les variables sont y, la moyenne des étudiants & examen de mathématiques, et «, année. Le moddle linéaire le plus simple s*6crit y= O12 +6, Pour V’écriture matricielle 1 67 bid 1 68 512 ave 6 ( % ) a 1 7 494 ey, we 7 eet 1 3.2, NOTATION MATRICIELLE 13 Exemple 2. Production objets fabriqnés A partir de feuilles dacier inoxy- dable, La production (nombre d’objets par fouille) est variable. L'ingénieur croit que la production (PROD), y, dépend de trois facteurs : largeur de la feuille (WID), «1, densité (DEN), 2, force de tension (STR), 13. Les obser- vations des 20 derniers jours sont, modélisées par le modléele linéaire Ely) = 60 + Ores + Ont + Oats. Pour Pécriture matrigielle 1 19.8 is eg 763 PROD % 1 2.9 110 72 7 650 _{ & cs eee eee 0 1 20.0 91 62 559 Os Interprétation di! Parbeuve 8, : Le paramétre 0, roprésonte le change- ment dans la réponse moyenne, c’est-A-dire E(y), lorsque la variable expli- cative «; est augmentée de 1 et que toutes les autres variables «;, 7 # i, demeurent fixes. En effet, par exemple, Eyles + 1, 22,23) — Eyles, x2, 23) = (04 O1(a + 1) + Baste + Osees} [00 + Or201 + Once + Ayers) = b Exemple 3. La qualité d'un produit est fonction de dewx variables : la température, 23, et la pression, a2, qui penvent varier lors de la production. its Suh 9 ontiaioone différentes de température et pres- sion, puis ln qualité du produit est mesurée. Un modéle linéaire décrivant la qualité moyenne du produit comme fonction des deux variables explicatives, température et pression, pourrait étre ajusté Ey) = 8 + O11 + Oaa%g + 04:27 + Ba00% + Oram aux données codées pipe 2fendo (neal Obeeration pia cece 2 nett 19 linecattelad oncl modelo Dn em batep sobre cogyrerene) sr degre le 3e4 nwel. atece nn Xe lh prt aa wad pod Ves lic. 4 CHAPITRE 3. EXEMPLES DE MODELES LINEAIRES La relation est non linéaire (quadratique) comme fonction des variables ex plicatives. Le mod@le wen demeure pas moins un modéle linéaire pnisque la relation est une forme linéaire ces parambtres 0;. Pour l’éeriture matricielle % 149 t-a-111 oy 141 t4a.i11 b fae Sete Ou 134 1 0 15 0 225 0 O29 Or Exemple 4. Comparaison de deux traitements. Deux traitements T ct C sont randomisés sur cleux groupes d’upités expérimentales, chacun de taille (nad. \of, La moyenne théorique du groupé T oD) it L.0 et celle du groupe C, u—6. ~~" définissant une indicatice de traitement sur chaque unité, { 1, si T est assigné & l'unité, —1, si C est assigné a I'unité le modéle s*éerit. oe BQ) = w+ dx Had Pour Vécriture matricielle es a ak, yng. aaognatl m™ we nen Cayhatirren : ee ‘ \g dxy =: (Xx)! x oo x a es AA‘ = T os Napavove nile) Yc, Ale he -4 i Ici, le plan étant équilibré, les deux colonnes de la matrice X sont orthogo- nales ce qui se traduit par une matrice ar 0 xix=( 0 y=? de structure diagonale. Exemple 5. Plan factoriel complet randomisé A deux facteurs. Il consiste en un nombre égal d’unités expérimentales (réplicats) pour toutes les com- binaisons possibles des modalités de ceux facteurs. Par exemple, dans une 3.2, NOTATION MATRICIELLE 15 expétience sur Peffet de la dite sur le poids de poussins de 24 semaines, on Gtudie V'effet de 2 facteurs : le niveau de protéines i deux modalités, | ou 2, et le type de protéines @ dex modalités, arachide ou soya. Cela donne 2x2=4 taitements possibles avec um nombre égal de 4 unités par traitement pour 1G unités en tout. Les réponses obtemues dle rexpérience sont dans le tableau suivant Feacterg ‘Type de proteines | Niveau de frotéines | Poids (e:) aradhi I 6504 6622 A ay 7528 856 X* ( ~! ) z 6738 GHA A eld a= | 7338 6361 ¥ (1) soya 1 6943 6249 a) m) 7359-7292 ¥! (1) 2 6748 6422 , 4 67646560 8 (+) Les traitements sont assignés au hasard aux unités. Par exemple, on énumdre dans un certain ordre les 4 traitements, puis on effectue une permutation au hasard des nombres 1 A 16. Les 4 premiers poussins recoivent le premier trai- tement, les 4 poussins suivants le deuxiéme traitement, et ainsi de suite. Les modalités des facteurs peuvent Age qualitative type de protéines) ou quan- titatives (niveau de protéines). Ur models linéaire pour ce plan d'expérience est Ey) = w+ 02x, + Beg + 7,22, ot Wheraces «A si type=soya, speeds a 4 Avec cotte paramétrisation, le tablean des moyennes théoriques des 4 traitements est done niveau=1 niveau=2 typessoya | wtatAty}uta—B—7 type=arachide | wa +8—7 | wa-f +7 sot 14 16 CHAPITRE 3. EXEMPLES DE MODELES LINEAIRES ‘Au facteur niveau=1, la différence de moyennes lorsque Von varie le facteur type est: de 20+ 27, alors qu’au facteur niveau—2 nce est de 2ar— 2y. On parle dans ce cas d'une présence (Pinteraetion entre les deux facteurs. Cette interaction est absente sous In condition y = 0. Cette condition peut atre confrontée sous Ia forme d’un test d’hypothése. Berivons finalement ta 1 1-1 1 1-1 Lael Tt -1 -1 -1 -1 -1 -1 KM a My 1x 1 3 1 7 Le plan étant équilibré, la matrice X'X = 16Z, et done les colonnes de X sont mutuellement orthogonales. On yerra plus loin les simplifications que procure cette orthogonalité. nvedo | be diyerance, -enaten = (Ares ety) -C Hr 4g -¥) Farrar nprle le Tee (pra p-e)~ (pr a — ptr) zaK_2N Ys n> inaction Xx = Ty were erkggoraen 7 indepenshedes xin bed — meq seet 14 Chapitre 4 Formes linéaire et quadratique L'exomple le plus simple est celui ePobservations indépendantes et identi- quoment distribuées (iid) yy,...,yy suivant la loi N(}6,02). La moyenne est: ume forme linéaire et la variance, une forme quadvatique i r + 1, L dns i =| 5 WY =AX i ctoed ‘sl. L (V0 s% = Ya =¥' [iy — away] Y= BY (Gre comdnctea) a Ne, x demptoal derank n-1 Grub idem Le vecteur Jy est un vected dont utes les composantes sont ogales 3 1 Cet exemple correspond an modéle linéaire le plus simple Y ~ N(Jiey07Iy)- 4.1 Concepts élémentaires et loi multinormale I’espérance d'une matrice aléatoire M = (mj) est la matrice On vetting de B(M) = (E(my, (i) = (Blom) Oe En particulier, la matrice de covariance d'un vecteur aléatoire Y UM vee de moyenne B(Y) = 11 est LO Ms co¥) = BUY — WY - 4] = = (Elvi = mus = os) ae ( CL, | wey aleato rw = aes ee pom fener ef Ye erin que sigue E mi) e 17 EMs= [7 = i Ee E Rupnee 3 14 sept ores ah we wy! vaor (9, tev A) ABU) hevlGXI Cov LAMB e A vravixe! 2 Vow 2 Bh aade Data! 4S CONC) = ce UTD et eae et ce oakery) = Cov Ce) A Cae he > : CHAPITRE 4, FORMES LINEAIRE ET QUADRATIQUE ‘ eetentlene Li aa a re 1a covariance entre deux vecteurs X ot Z est Reeder Ot) : igs cou(X, Z) CoV bx )= Cav (4) — SoibY de moyenne js et de Oe ee et) di dune transformation linéaire oe fo ecegnam teas 4 =H AEC] x= Anko. AK =A eee 4a) ‘ ao SoA OAD SAS” ve ONS : cou(BY +0, AY +a) = bya oF = Se 31) cou(BY +b, AZ = > KO -4 aint AZ +a) = BooY, Z) a" Baer a gem | Le vecteur ¥ suit la lot multi ok — ait In ok multinormale My V)y oi Yt ie = ELOCR Sy) = xy ; as re] . ) = en rAIv) exp [Hy —ntv "ey “at — Ta fonctic énél ‘ice ¢ es ibe ion génératrice des moments (fgm) de ¥ ~'N,(it, V) eat Oi de, ae my pantet las {twee ; I tik oe [>©%® My Preuve : Rappelons dabord : (6 fecha “ree: Bayada dst aque la fgin de la toi z ~ N(0,1) es /2). Ml découle que si Z ae (Me @)= Ele santes iid N(0,1) alors, Saal | =B(e*) Foal) = ot ( Ensuite, par la formule ae . “4d Ba Changement de vviable, si Z ~ Ny(Oyl), Ve Y= veg ~ Sete Pn . ae my ae my() = exple(V'?Z +4) “Ge Disa’ aude) ‘ vane = explti paw Ted Sane = exp tus deve cvC=D- 7 Vérifi ( 7 z i Y~ : eae oe ie 1g 75 AY a git I oi eet AV. te ace x J soins a 9 10, ) Po & PU). De pls si i aie f » YY ~ x°(p) : ] xe i a on tei ty Ve he ce 2c Q0C2 van tute aay oe: my 6 We! 7 "Ah zee? “A i ta (v 4) { 2 \ Yeu Nlot) Aut Vx wy [5 Seet a to Nelo DAy'y ~ fs 1) wade) awe BA) ary K “en mR He. 4.2. LOI DU KHI-DEUX ale CaN) VT pe) 4.2 Loi du khi-deux ee La loi du khi-deux décentré a p cegrés de liberté et paramétre de décentralité A = y’p/2, notée x*(p,d), est la loi de Y'Y, ob Y ~ Nel ) 1 we > Un argument géométrique simple utilisant "invariance orthogonale de la distribution Na 4 montre en effet que ROY, <2) (en) ) va vgletsoree to. =@ at Ve. ee “Cr : Ms (ti)= eX -2) est orthogonale, Alors, 2= Y/Y = X'X, ot 7 st) eo ee a X ~ Ny ((2d)"?,0,...,0)',)- poisson ram /peaK)., La variable z a la représentation comme une somme de deux variables indépendantes SVew Vo. Aedptte, sus y= fae AR 470) !ab% eee Hy = = } rast f ey hl xearmy (Ny) reve norm $a 7 ya sly =xlx L 2 + (X Bao. ¥ Ket) HSS = yt ve, LENT eor ewer ty 15 sephembre moe ee oe ty, © ee of di Rik YS DP chines? Sue M srved bee, homens Ae Aw eas UML So z 20 Sec prbns 4, fds sey tian bates 7 Ma BE 5 “ey NEV! ees vii PUN & Pp ~My v= en”, ay 4p — 1} En a dela saree ay \ Min) SNM, ae aN eoekp . NE = Chere raygoosel) ml =m 12) \ Tne reste a wa obtenir 1 2 7 “af — ee ‘Tee a —))| de 2d (1 —2t)? ex ("a ) denies w n oS if ) PLT 00 es 0 (= 27 oP »| y= * yg | aan then (2 AY al “3 A Deux conséquences directes de la fgm sont (l-2t) E[x2(p,d)] = p+ 2d, var [x*(p, d)] = 2p +8 de et si 2) ~ x2(pi, Ai), i= 1,...,k, sont indépendantes alors & Pind) ») a La fagon la plus simple d’obtenir les moments est «utiliser le mélange poissomnien. Barve de 4.3 Formes linéaire et quadratique MWe (24% — On éuonce maintenant tn fym une forme quadratique quel conque. Si ¥ ~ N,(11,V), od V est définie positive, alors q = Y'AY, 4 exel 24 Yon et) al ow A ext symétrique, a pour fgm Cte) (i) = Wm 2tave esp {Sul avy] eo wh = [= 2AV 4? exp [ey ACT 20v,a) tn] , Ye NUnl) définie si t < ty = min {t : [J — 2tAV| = 0}. Yanda) 3 dave un vorrimge te t=2 "egal reat hye 4.3. FORMES LINEAIRE ET QUADRATIQUE a Preuve : On fait d’abord la preuve pour V = I. On écrit Ja décompo- sition spectrale oe ea oS Dive mes vale Nees] LALDAIY, AL = Dy = ddiag( A) fe On pose 7 = IY dont la distribution est N,(6,1) avec 8 = Py. La forme quadratique devient ly’ yay =v fi me ¥ . ‘9 a= 2D2-4, fiat » Bus ot les 2? ~ x1, 92/2) sont indépendantes. La fgm est done :) o FB avdndgin (Sir u » ; fqn & 7 mid) = [[B (0?) Ba cy Tl 2) ex [rnazv(a 2td)| HAT = Dyer OO i apace |r 2p Po [ese Sos - 24). = 7 -atO uy développement algébrique simple > Oras FB potonpament ates TALI — 2tA)'P y TAU ~2tay'r = Cap schay the) = Dy, rer -24a re 2duy Ltr2 wot Ai/(1 — 21A,), ce qui permet d’écrire 38 & Oe =chag O/ce aun) \6F/(L— 244) = 9'D,S : tatoo & pe = aroe OH = = KTD Tp at = kay Oal-ztary ) Say Pact atay a Finalement, tA(I—2tay! = ~pr-20a =IN(i- 28a)! = +} [1-27] Se ea ata el bIA)< Ts be Uno tr Ling) 22 CHAPITRE 4. FORMES LINBAIRE ET QUADRATIQUE it {lio)= elon) : ‘ & (W Jeb ce qui prouve le résultat lorsque V = J. Lorsque Y ~ N,(j1,V), on i pose by (a= a tnd ; a av MY NV pt) : (AQ) = ae ct la forme quadratique devient q¢ = Y’AY = Z'V'?AV¥?Z, sur la- : La) = 7 a) quelle on applique le résultat, démontxé lorsque V = I. ( Gz y ag Concemant les moments de formes linéaire ot quadratique, si, ‘ 4 Y ~N,(ys,V), alors yl tel" ley) an ( SZ Way EWV'AY) = tr(AV) + e’Aye pave) IV QR var(Y/ALY) = 2tr(AiV AV) + 4y/ AV Apt i cou(Y' ALY, Y'AaY) 2tr(ALV A2V) + 4p! AV Aap He - yes cov, YAY) = 2V Ay 0 cor(BY,Y'ALY) = 2BVAyp. > 1 \ FeV Les deux premitres expressions peuvent étre obtenues en dérivant deux ° fois la fam m,(l) dune forme quadvatique. Pour ce faire on aura besoin ‘ \ Ay! B des régles de dérivation suivantes. Soit, A une matrice dont les éléments C 1 sont fonction d’une variable £. Alors, on définit a Care) =A tB ¢ aN dA _ (das ' (aizck : de ae q + = pt ( {apy =8°A On peut alors montrer ¢ dal _ (da ¢ / de 7 We (AVS ' a® dashed al Ay H dt ( 4 ‘La premitre expression Pv soa lus fagilement compre ‘ ty (Ay ai y(n 'A) ye & seogerasrd de. ONT ate la ‘ = DY EW'AY) = Btr(AYY!) = o[A BY] ‘ = tr[A(V + py')] = tr(ALV) + x Hu Ga « Condition pour qu'une forme quadratique suivk une Ikhi ‘ deux. Soi Y ~ N,(y4,V); V définie positive. Alors, COLO § = 2 n gry AY 9 = VAY ~ x (0A), 1 An/2) ° yep Ypres ZO Np oF, fi Elbe peal ‘ a WY; Bee yn oy tt 4 DO ue TY Ya pat ay deg OMY Veta) ye \: ened ZEON a a al . a ae a Ay) cor eLny EUNL &, +E LE ( 1 22 CHAPITRE 4. FORMES LINBAIRE ET QUZBRATIQUE ce qui prouve le résultat lorsque V = I. Lorsque ¥ AN,(j1, V), on pose ‘et la forme quadratique devient g = YIf¥ = Z'V?AV¥?Z sur la- forsque V =I. — Concernant les moments de for: inéaire et quadratique, si Y ~ N,(u,V), alors BY'AY) (AV) +H Ae = 2tr(A\VAV) + 4p AV Aye QW Ay = 2tr(A\VAgV) + 4p AV Agu = 2BV Ay. Les deux premijfes expressions peuvent étre obtenues en dérivant dew fois la fgm_ d'une forme quadratique. Pour ce faire on aura besoin dos ragles dy/Aérivation suivantes. Soit A une matrice dont les éléments sont fonct6n d’une variable ¢. Alors, on définit, dA _ (des dt dt peut alors montrer ala or lest cependant plus facile d’obtenir les moments directement comme suit. On pose ¥Y = p+V¥?Z, ot Z ~ N,(0, 7). Une forme quadratique q=Y'AY s’écrit alors q= (Au + 2WAVI?Z + ZVYP AVIA, Ensuite, on obtient E(q) = p!Au + Bir(Z’V?AV'?Z), ot Btr(Z'V?AV¥2Z) = tr[V? AV (ZZ')| = tr(AV). 4.3, FORMES LINEAIRE ET QUADRATIQUE 23 ne Pour te deuxitme moment, on pose T’= V7 AV" et on développe (HAM) + (ZTZ) + 4QiAV'PZy + +2(u'Ap)(Z'TZ) + 4(n Au) (uAV?Z) + 4(2'TZ)(u' AVY? 2). a Par symétrie, les moments mixtes @ordre 3 de Z étant tous nuls, les deux demiers termes ont une espérance nulle. On évalue & présent les cespérances des autres termes : BWAVP Ze E(w AV? Z2'V? Ap) = AVAL E(Z'T2Z) = tr(T) = #r(AV). Pour le terme restant, on écrit 2'TZ = ry tiy%Z, Pod ? 2 CSA) ATA) = titer im En utilisant les moments mixtes d’ordre 4 de Z, E(ZZj2,21) = pir = Subiy + bud + Subp, on obtient TAY) = YS" tester(Sudss + Sud + 5 oes im ez zi ‘) = Vita +208, : tu: eZ, 7 cE (22r5 t(D) + 26r(T2) = (AV) + 2tr(AVAY). On a tous les éléments pour obtenir £(q?) et var(q). De semblable fagon, on obtient cou(¥, YAY) = cov(V¥9Z, ZV V#AV PZ + QAVYAZ) = VIP BIA(ZV'PAVPZ + 22'V¥? Ay] = WAREZ VY Ap = QW Ap. La formule de la covariance entre deux formes quadratiques découle de Véquation suivante var[¥"(Ay + Ax)¥] = var(¥'A\Y) + var(¥/AaY) + 2cov(VALY, YAY) 2tr[(Ay + Aa)V (Ar + Aa)V] = 2tr(AiVALV) + 4p’ AyV Ay + 2tr(AgV AgV) F4yl(At + Aa)V(Ay + Aa) +4 AgV Agu + 2cov(Y'ALY, Y'AaY). 43. FORMES LINEAIRE ET QUADRATIQUE 23 si et seulement si AV est idempotente. cvr=Da Preuve : Supposons d'abord que AV est idempotente et éetivons V = C'G, o't C est inversible. Alors, B = CAC! est aussi idempotente de \~ THe méme rang que A. En effet, coe ot 1 BP = CAC'CAC' = CACICAC'CC™ = CAV AVC ar all = CAV = CAC'CR! = B. Vee ad Mexiste P orthogonale telle que fe C= pe c' PAT =b i on . rae =e r’ar= 5 oe 2 HON TINgUla ne] on reps di oar “RP on paw ¥ Peter ye hy ony YAY, = Z''CACTZ ~Np (rece c c cD = SUBS = (a1 8)(5 8)(B) WM perelecer ei aaa = AZ. 1») Done q ~ x(r,), 08 av oy i a q wena eo (4) Car oro nye : eats gl oe = open yy BS CAS Dead! oe geneous = HAW? oo: e(A)= tr ay) Pour la réciproque, considérons d’abord le cas V = I, Par hypothese, tmg(t) = |f— 2tA-Y? exp [tp A(T — 2A) yt] = (1 28)? exp ftp’ An /{1 ~ 24). Cette égalité implique nécessairement (= =[Ja-ay (41) 7 zone ov pe me - {Alict pee Unc ay : Nyinde re net 2 CHAPITRE 4, FORMES LINEAIRE ET QUADRATIQUE et HACE ~ 2A) "ye = Ap /(1 — 2), (4.2) olt les + sont les valeurs propres de A. Les deux polyndmes dle (4.1) sont égaux lorsque r des 7% = 1 et les autres sont nuls. Une matrice symétrique dont toutes les valeurs propres non nulles sont égales A 1 est nécessairement idempotent. La matrice A est done idempotente. Lorsque A est idempotente, on notera que (1.2) est satisfaite, Pour tune matics V générale, on pose Z = VARY, ~ NV *74 1). Si Y’AY ~ y2(p(A), n'Ae/2) alors, ys 2VMe PVP AVA ms x4 p(VYPAV') AEM VIRAV YR. VG /2), Ceci implique V'/?AV"/? est idempotente et done que AV est idem- potente. Un résultat sur la diagonalisation simultanée de deux matrices symétriques. Soient A et B deux matrices symétriques. Il existe I orthogonale telle [’AP ct PBT sont diagonales si ct seulement si AB est symétriqne (AB = BA) Prouve : Supposons que [YAM et IBY sont diagonales. Alors TABP = TAP -P'BE = TBE TAL = 1'BAP = ph ce qui implique AB = BA. Pov la réciproque on suppose AB = BA Il existe P orthogonale telle que PAP = diag(Malny--)Aslru) oft on a tom compte de la multiplicité. La matrice PB commute avec la matrice diagonale IYAT. On peut vérifier que si ume matrice X commute avec une matrice diagonale D dont les éléments diagonawx égaux sont regroupés alors, X est bloc diagonale. En effet, (XD);j = au ot (DX)y = diy ot done y(t ~ dj) = 0. Ceci impliqne que c1j = O lorsque d # dj, Poi la structure bloc diagonale de X. Done IBY = diag(Bi,..., Bs), ot By £7) X reat symétrique. Il existe des matrices orthogonales P, joer, belles que PBL = diag (tiny) On définit la matrice orthogonale I = diag(Py,...,P,) et on vérifie que P'f' est la matrice recherchée. Soe MO Cn Cd) alsest 4.3. FORMES LINEAIRE ET QUADRATIQUE, 25 Indépendance de deux formes quadratiques. On prend Y ~ Np ¥), ot V est définie positive et Ay, Az sont deux matrices symétriques. Les formes quadratiques Y'AY et ¥'A2Y. sont indépendantes si et seulement si A,V A, = 0. Supposons d’abord A,V Az = 0. Il existe C' inversible telle que V = C'C. On définit Q = CA,Ct et T = C'AgC" ot on vérifie que QT Done, Q et T peuvent étre dingonalisées simultanément. Il existe I orthogonale telle que D0) 0 0 var=(% 0) Prr=(5 b) \ On effectue le changement de variable, 7 Orly ww NC, 1) Y=CTZ, 2% z: Les formes quadratiques peuvent étre réécrites comme wie ) pol: VAY = ZPCACTZ ~ AVON — Zz — an YAY = 2D%Z, ott oe ae(” acr) Gaia 2irtc a deux composantes indépendantes. Supposons & présent que les deux formes quadratiques sont indépendantes, Alors, ott q = ¥"(t Ai + t2Az)¥. Supposons d’abord V = J et montrons que: A Ag = 0. De la fgm dime forme quadratique, on doit avoir ne |P— 2b Ay — tA] = | — 2t Ai] - [I — 2taAal. Si on dérive cette équation par rapport & f on aura tr [1 = 2t,Ay ~ 2tgAg)"' Ai] = tr [UE - 2A Al) Gn soustrait ensuite tr(Ay) de chaque cdté tr { [( = 2A, — 2tzAa)* — FAs} tr {[(I— 2A, - T] Ai} tr [(L— 2tyAt — Bt) (tA? + tededy)] = 2tstr ((0-2t,A1)" Al] t tr a — 2ty Ay — 2teAy)! (# + ea) tr (0 = 21) 149] Bove gpd: ee lthetat de codaprenk ed 26 Conta ate a eee alte CHAPITRE 4. FORMES LINEAIRE ET QUADRATIQUE Le membre de droite posside une limite lorsque ty — 0. Pour t fixe, Je membre de gauche posstde une limite lorsque f -» 0 si et seulement si ApAy = Dans le cas général, on pose Z = V-"Y, Alors, YAY = ZV AVIPZ YAY = ZV AVIPZ et si les denx formes quadratiqnes sont indépendantes, VP aviryiegyire— et done A,V Ay = 0. Indépendance de formes linéaire et quadratique. Le vectour Y ~ N,(qt,V) ot la matrice A ost symétrique. La forme quadratique YAY et la forme linéaire BY sont indlépendantes, si et seulement si BVA=0. Prewve : Tl existe C inversibletelle V = C'C. On définit Q@ = CAC". 11 existe [ orthogonale telle que rer—p-( 4 a) Soit ¥ =O'TZ, Z=P'C'Y ~ aro, 1). Alors, YAY = ZDiZ BY = BCT2=G7=(G G) ( 2 Jean + Gat a Done Y’AY est indépendante de BY ssi Gy = 0. Mais G, = 0 ssi GD =0 ssi BVA = 0 puisque BVA=GEC" oe Théoréme de Cochran Tore’ = Gb. Tc Propriété des matrices idempotentessSoient des matrices symé- triques By: p x p de rang r; et B= 5), B; de rang r. Si B est, 44. THEOREME DE COCHRAN, qT idempotente et r= 77; alors, les B; sont idempotentes et BiB; = Pau Rappetons dabord que pour toutes matrices C et D, AC + D) < pC) + pl). Rappelons aussi que pour toute matrice symétrique C : p x p, AC(I — C)) = p(C) + pI —C) ~p. En effet, soient 1,....rp les valeurs propres de C. On définit Ay = {i: A £0} et Ay = {i A; 4 1p. Alors, #AoU AL) = dtAa + #Ai — #(AoM At) Pp = AC) + pI —€)— ACU C)), Puisque B est idempotente de rang r, p(I — B) = p—r. D'une part, PU — Bj) = pl ~ B+ 3B) 0. De plus, si un élément. diagonal est 0 alors, en examinant les minus principaux dordre 2, tous les éléments de sa ligne et de sa colonne sont aussi 0. On pent done réécrire la dernidre équation comme (Tir o)=(0 a) *(0 8). En prémultipliant par "BT, (28)-(88)+(43) dot GH — Pour le théoréme de Cochran, on prend ¥ ~ N,(v1, V), m matrices symétriques A; de rang rj, A= 7, Ai. Si p(A) = DY, 7 eb AV est idempotente alors, 1. les Y’A,Y sont mutuellement indépendantes, 2. YAY ~ x2(ris nt! Aatt/2)- Ces ronama@plarst ( Preuve : Il existe C inversible telle que V = C’C. On définit 0. Ceci donne I” BT'T’B,T' = 0 et finalement B;B; = 0. B-CAC=S7GA -S 2, B= CAC" et évidemment p(B) = 32, (Bj). De plus B est idempotente puisque BY vit = CAC'CAC' = ‘Ayacac” = CAVAVC =CAVC = CAC’. BB; = 0 lorsque ¢ # j. Les matrices A\V sont done aussi idempo- tentes puisque (AC'CYAC'C) = C(CAC)(CACIC = CMCACIC = ACC. =A V (iN LAW) HACE ONCE wate le lemme précédent, toutes les B; sont idempotentes et satisfont | ( ' i ’ 4 ( i de Dice ane ee Cc ria 4.5. LOIF 29 Cette condition est suffisante pour que VAY ~ x7(ri, 4 Ant/2). L'indépendance par paire est aussi vérifiée puisque AWA; = C(CACYGAC)C '= 0 'B,BC™ Ag z Mais en fait, on a en pl épendance mutuelle. On peut le voir en posant Z = C' VAY =Z(CAGY, = 2'B,2 = 2'B1Z = BZIP. lex dengton tl L’indépendance mutuelle est satisfaite puisque GiZoOr meuamoude sloporels BL By ~( 8 ‘ 7 coo}: Jal: [tC By + Bw) =diag(Br,-+-, Br) ee Bm Bu Oo Be aN 4.5 Loi F Weird On définit la loi F décentrée. On prend q, ~ x2(p1,A) indépendante de? * ot 2 ~ X2(p2). Par définition, 1a loi de Ja variable Dd canrs _ alr e/a est Ia loi F a py degrés de liberté au numérateur, py dogrés de liberté au dénominateur ct parambtre de «écentralité 4 > 0. Dans ce eas, on écrit, Fw F(a). En particulier, on écrit. P(p1,p2) au lien de F(p1,p2,0) dans le eas contré, est d=0. 4.6 Exemples 1, Echantillon aléatoire yj,..., yx iid de la loi N(p, 07) T= ¥ ~ M(Jut0°Fn)- ue A @ au wa) Gann Wn] ve Nad ly) 30 INES SAIRE ET QUADRATIQUE la 2 chy URN dee we = te =H a rae 2 i o " ahYME Gr al “oP Dare 3s bo a a ed z : 7 GEORG 1 Vite xO 1 1 ny? x hoy y 7 Indy + [In — Se Inedy Gas Une] mnt LW axon x fig) = V LED. A Sin Les formes quadvatiques 41 AU, NP /(20%)) et a2 ~ 0?x2(N-1) sont indépendantes. N L aN \ 2, Plan équilibré & deux traitements T~1 et C = 2 et NV = 2r observa- A B tions, Avee les matrices w= neds < ! when Yne 1 ( IalegJnp me) (i Jeti) 2) : ail care ders} oe = Mea So helt vel Me] xel 7 } | on(4 ’ N ya 1-1 é ¢ wd) 2 HEN : wihensehy ay a de oo ie 1-1 fa a jlo ( a 72 © Cyan de Y devient whe Boe Re h : A _ {ete wwla &lyie Tel Ce oe BO) = xo= (MS Jon ae woe \y 2.6 mode linéaive serie Yow (( wre jou ott) La décomposition de la variance totale est ae ah ea ae xf = Me oa a" Sow a? Sv ~ Far, 7 = Y'X(X'X) 1x" 1 ven Get how Ie) " orca Whecae oe = \a luda 4 ~ to we iat |e) B)esue/ 2 te WSL: wl [ated F pUgy'e'> WA st] obs nito~ sede) \ 4.6. EXEMPLES 31 ie le(i roses [C4 test] q= bs at Heweat ier N = 141+(N-2). Les formes quadratiquies th ~ 0°x%(1, Nye /(20%)) te ~ 0? x(1, N6?/(20")) gy ~ 0 x"(N -2) ituellement indépendantes. tions équicorrélées de la loi_N(y1,0?). Le moddle linéaire dant est YON (Ivin¥ o°((1 — plu + pI Jl) - Considérons les formes quadratiques —- Nye = Y IvIRY l sot] ¥. i. Soient les matrices i fl A = aarcinami) 1 ates 4 = aap [1 x Judy] Alors, les formes quadratiques a = Y’A1Y et dz = Y'Aa¥ satisfont a ~ CL, NyE/(207[(1 — p) + oN) % ~ (N21) 32 CHAPITRE 4, FORMES LINEAIRE ET QUADRATIQUE sont indépendantes puisque lip AV = ade cst idempotente de rang 1 et Aw = In — Jd est idempotente de rang NV — 1 eb A\VAy = 0. En fait, la forme linéaire § ~ N(q,02[(1 =p) + pN]/N) est indépencante de la forme quadratique 72, (yi — 9)? puisque " a lay Teale = (Lp + Np)Iylly — yy dvd On aurait pu aussi appliquer le théroréme de Cochran avec la matrice 1 o iaiis asin Pate urine er) [fm (=p) ten IyJhy On vérifie alors A = AtA; N = 14+(V-1) et AV = Iry est ume matrice idempotente de rang NV. Chapitre 5 Estimation et test d’hypothése Le modéle linéaire oit Jes observations sont indépendantes de distribution eno ecko normale se résumne dans la distribution conjointe Se mrance A 2 Y ~ M(X0,07ly), ee? ex Hoa ott la matrice de constantes X : N x p est de rang colonne complet p(X) = p. : Pour l'estimation des paramétres on utilise la méthode pasée sur \ ygaisem vy-xXe) W -e)j 2 Dianog des paranBas fet 7 7 py)= ler? | 8K? oe E & In L(0, 7) = —(N/2) In(2n) — (N/2)In() — (¥ — X0)'(¥ ~ X0)/(27). On obtient les estimatenrs en maximisant cette fonction des paramétres. 5.1 Régles de dérivation On applique les régles de dérivation d’une fonction par rapport A un vecteur. Si f(é) est une fonction de t= (t,..tn)', on définit le vecteur gradient Of ft, Vy = 4 (O/at = : Of [tn et sa transposée df(t)/dl’ = (df (t)/dt)’. Aussi, on définit la matrice Hes- sienne (symétrique), ou la matrice des dérivées secondes, par 0 = aupcosanat = (525-110). 33 34 CHAPITRE 5. ESTIMATION ET TEST D'HYPOTHE En particulier si f(0) —tAt-+ Ut -+-6, A symétrique, alors, Vy = 2Ab+b Hy = 2A. 5.2 Modéle sans contrainte Appliquant ces régles, on trouve les équations satisfaites par les estima- tours X'x6 = xy Scorn reopeclo @ F = QDIN, 3 comvespetd — Waa. ott in WY (xa Q(0) =(Y - x0)(Y = x0). i oe Avec Phypothése que X est de rang complet on obtient HKG ty, A cbt "x! 6 = xy exes lee = \ EAE yey ot = Vy xox tan.) TL OK) dy yone ski ¥ X EOS= 6 Agere UE (AY). La matrice X(X'X)"1X' est idempotente de rang p et la matrice Iy — QUA) —X(XIX)-EX’ est idempotente de rang N — p. Les distributions des esti- vimatwrareY mateurs sont done ExY) at WOE HK 6 ~ N,(0,0%(X'X)") QO) /o ~ Np) + oit 6 et Q(4) sont indépendantes puisque (XX) EX" [ly — X(XX) 7X] = 0. Ceci suggéve utiliser plutdt Pestimateur sans biais # = QO) (N —p)- @optimalité des estimateurs découlent, du fait que ce moddle le exponentielle de distributions, e’est-d-dire que la dens 23 sept | 5.3. MODBLE AVEC CONTRAINTE 35 Drolet nw Htinemall) est de la forme H¥50,7) = Qn) esp | (y — xoy(y — xo)] ay 1 1 mf ‘X'XO Lary - oxy] xD. ex |-35 7 wK NAT ta bres osvty = a(0, Vol exp [= Siem] Y aes St ame 7 rae | mroppr HO = h 36 CHAPITRE 5. ESTIMATION ET TEST D'HYPOTHESE oil comme avant on a encore (0) = (W — oy ~ dno RS Bodh Finkt § Jang @)HS=h ween Ae Finalemént, 6 s’écrit +t en ferme de Save fe\P XQ. JR premitze équation = (XX) x'¥ 4H’). OM) On substitue cette expression de @ dans la tré 6 =(H(X’x) tH) TRI VaNIS om = H(X" " ng équation pour obtenir che, ¥I goot erdenrly & olen 2 ete eve ES 9 Ab Bh ott 6 = (X'X)1X’Y est Vestimateur sans contrainte et A = 1,-BH B= (XX) A(X'X) HY. Les propriétés suivantes des matrices sont maintenant démontrées. (a) A est idempotente de rang 7 (b) (XIX)! = A(KIX) % AUX) LA, (c) XA(X'X)"1X! eat idempotente (symétrique) de rang r, (A) Iy — XA(X'X)-1X" est idempotente de rang N — r, Remarquons dabord que HB = I, ce qui implique BHBH = BH, i.e. que BH, et par conséquent A= ,~ BH, sont idempotentes. Le rang de A est AA) = tr(A) Calculons maintenant (XX) TA = (XX) (XX) TB! (X1X)} = (XX) LX X) LL XX) = (X'X)"! — BH(X'X)* = Axtxy? A(X'XYA = ALAXX)! = AIX), =p-tr(HB) =p—q. 20ND e 5.4, MODELE REDUIT DU MODELE AVEC CONTRAINTE 37 et axy-tyt. 1 NXY VX! = XA XEXY EX! = XACATX)EN!, Wenn Og, 25 XAURIX) ANT: ACLU) AN = KAREN! = XA) ANY, Megraetd le, En ce qui concerne le rang, - ioe iean es ayy D=Tp-th La pattie (d) est ume conséquence immédiate de (c). = pa aye On obtient maintenant les distributions des estimateurs en commencant E ALLO x (xe +e PBN am y : 2 A HA HOWE +OM AB+ Bh EURO TAG OTK 2+OK OF AXXO qu lyr Xe Jair Tstensuit A Ontine B any (Or eA IHREN AY O~ N,(0,07A(X'X)'). A x' TA EA CRT Pour Q(0) on écrit, S Banele, rex’) yy z aces on x'e Y-XO = [ly-XA(X'X! Xe Yo RSA TKO au oe A ; Hx) =e = MAX QO = ely —XAXY Xe. Fy vin veo Je La matrice jy — XA(X'X)-1X" étant idempotent de rang N —r Zien pe psNo Hat ~ 2 Q()/0? ~ X(N 1). Hone On utilise plutét Pestimatenr sans bi # = QO") ‘L'indépendance entre @ et Q(6) est facilement établie par le produit, A(XIXY AX Ey — XA(XXY IX] = 0.0, - 5.4 Modéle réduit du modéle avec ¢ontrainte Une autre fagon équivalente de résoudre le modéle avec contrainte est de considérer le mode réduit. Supposons que H et 9 sont partifionnées de sorte que os OR) HO = Hy0, + Had, =h A o- | )8 gz [ea =u ve) nea Bin enlate © ~AS +h 38 CHAPITRE 5. ESTIMATION ET TEST D'HYPOTHESE oi Hy sq xq est de rang q. On peut exprimer q des parambtres en fonction des r autres paramétres 0, = Hy — Hy Hae. On utilise une partition conforme pour X = (X, Xz ) et on substitue dans Ie modele pour obtenir Yaxe te Ye Ki8h —KHth lee Ogre! QE 5 61 aXe Oehe Y—MHy"h = (X2—XHy A) +e Ya = Xno +e. Kiene L’estimation dans ce modéle est en tout point identique au cas sans contrainte 0, = Fret 58 = Qnlds)/(N 7) Qnl(02) = (Yr — X02) Ve ~ Xn2). Les statistique exhaustives et complates sont donc Op et Qr(b2) = Q(6). Les estimatenrs proposés sont done UMVUE pour les mémes raisons. 5.5 Estimateurs BLUE (Markov) On peut également obtenir une propriété d’optimalité plus faible sans supposer In normalité et en utilisant uniquement la méthode des moindres carrés. On s'en tiendra uniquement au modéle sans contrainte. Le probe optimisation minimise Q(0) a aussi pour solution 6 = (X'X)"IX'Y. Dans le modéle Y= X0+e, avec Elec’) = oly, 6 est encore sans biais et var(4) = 02(X'X)-. On monte maintenant que pour toute combinaison linéaire des parametres, a’8, Vestimateur a’8 posséde la plus petite variance parmi tous les estimateurs linéaires et sans biais (BLUE ou best linear unbiased estimator). Soit 6 = CY un estimateur linéaire et sans biais. Alors, 4 = E(CY) =CXO, pour tout 0, Q 6) = (y¥-x8)! Ye) ae) a vans ( 4 teat V a> Ge=Ql sere pr ned SB ) Mn-?) R 5.6. TEST D'HYPOTHESE LINBAIRE 39 C'est-i-dire CX = Ip. Le théoreme de Markov est satisfait, oA CUI-xxy x! ]eo20 Gen var(a’d) eo < puisque la matrice Jy — X(X'X)"!X" est définie semi-positive. 5.6 Test d’hypothése linéaire On confionte Phypothese linéaire ‘ 4 Ho: HO—h ted?) = ce) Eat ee LEO els) =N- x0) qe dans le modéte li Y ~ N(X6,07ly) Le test dut rapport de vraisemblance (TRY) consiste & rejeter Phypothese nulle Hy lorsque sass parle encore ay eB) oc nq MecallOe?) he 33 ete) ™*E(0,0%) est petit. Les calculs pour obtenir le TRV A ont - Gee 7-1 jw 2) _ [2 Q) Q0) _ ot 6 = (XX) XY 6 = Ad+Bh B= (X'X) A TH(X'X) ay ra A = I-BH Be U-onse, 20) — (—XoyY — x0) KO = xm Pour obtenir la statistique du test il est approprié d’écrire Ny = Q(0) — Q(8) = 0 comme une foungs quadratique. Dans ce but, on écrit ze okay ~ X64 XB(HO—h) = Y- XA 6 +x3h e 2 z3 a - \-* CE -64) 8 =xBH w= | Ware 6 ) = \y-x6)+x8u A (ydYX6 WS-) 2 Y-X* (ET - By )d-*By Wd WRATH) + oe)" eee Dep & WW ehexe, (y>6)'% = y! LT Hote x] ™* + 80-9 30 40 CHAPITRE 5. BSTIMATION ET TEST DiHYPOTHESE gla) =~ x8" (as ae ; et on observe Porthogonalité =y! yy a -~Ox \} i (v-xdx=0. TYy-XKO Jy ‘ La diffrence Ny s'exprime done sous la forme Qf 4 — yey xeks = (ONY BIX'XBEHO-I) (yy. xb) &nt = (HO — hy H(X'X) HHO a). ee xB.) (yk? La distribution de Nyy est une conséquence immédiate de \ (HO h) ~ N,(HO— ho? H(X'X) "Hy qui donne Nulo? ~ x2(q,X ait bk lufo” ~ xq.) Ror ley avec iv = (110 — ny LHX)" HHO ny /(202) it teate Baws (a — nya) \10 Ioan. ke Se On se rappellera aussi que e hes Q(O)/o? ~ 2(N — ») Il reste & montrer que N;, et Q(O) sont deux formes quadratiques indépen- dantes. Soit @* une solution quelconque de 1a contrainte H@ = h. On a les deux vecteurs ond Y—XO = [Uy—X(X'X) XY — x6") Hoh = H(X'X)1X"(Y — x0) qui sont des formes linéaires du méme vecteur Y — X0* ~ N(X0 — X0*,07Iy). Les formes quadratiquos s’expriment maintenant Q0) = (Y — XO [ly — X(X'XY XY — XO") Ny = (¥— X60"! XBH(X'X)"'H'B'X'(Y — X60") i Uy — X(XIX) XX BH(XIX)HHIBIX! = yz at independ. 5.7. PUISSANCE DU TEST F a mobls tekato ce qui établit leur indépendance. wmideko aprscal Un TRY est done équivalent au test F qui rejette Hp pour de grancles valeurs de ™ YWdoonrotet = ght —~ la. 2.2) © QOD ve da sen Le TRV de niveau a consiste donc & refeter Hg lorsque a ™ 3)- 968) Pag Fela Np). nye 408) La statistique Nj du numérateur est simplement augmentation dans la somme de carrés résiduelle qui se produit on passant du modéle complet au modéle réduit. Pour Vobtenir il suffit done d’ajuster les deux modéles, 5.7 Puissance du test F De manitre générale, soit Ta(PisP2 A) = PLF (Pi, P2, A) > Fo(Py,P2)] (Disb TP(ispy ) > Op la puissance dun test F de niveau a. Cette puissance satisfait les propriétés aby prek pe cont 1xed 9) HS eo gees (a) mopotone eroissante en d ¢ (b) monotone eroissante en a (c) monotone croissante en pz (d) monotone déeroissante en py. Pour chacun des énoneés on garde les antres valeurs fixes = SF soot + : No Po ah °5.8 Quotient de Rayleigh aap. ae i = = Rappelons d'abord Je quotient de Rayleigh. Soit IV une matrice définie 4 positive, Alors, ie : iste Ga, a (a'2)? — yl, Mee Qorhy. gh awa 2° 4 pour tout vecteur a # 0. En effet, avec b= Wa, (a'z)? _ a'ea'a UWP WP e wb = SAW ae) soe, dWa Wa vb 42 CHAPITRE 5. ESTIMATION ET TEST D'HYPOTHESE. Done si a’W-le < ¢ alors, (a'2)/(a'Wa) < ¢, Va # 0. La réciproque est aussi vraie en choisissant a = Wx. Ceci donne Péquivalence (way.

Vous aimerez peut-être aussi