0% ont trouvé ce document utile (0 vote)

65 vues21 pages

12 Anova

L'analyse de variance (ANOVA) est une méthode statistique utilisée pour comparer les moyennes de plusieurs populations afin de déterminer si elles sont significativement différentes. Le document présente les concepts fondamentaux de l'ANOVA, y compris les hypothèses, le modèle, la table d'analyse de variance, et les validations nécessaires pour assurer la normalité et l'homogénéité des variances. Des exemples pratiques illustrent l'application de l'ANOVA dans divers contextes, tels que la comparaison de la performance d'ordinateurs ou l'efficacité de médicaments.

Transféré par

Clara Bamouni

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

65 vues21 pages

12 Anova

Transféré par

Clara Bamouni

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Probabilités et statistique

Analyse de la variance
Module 12
Plan

• Introduction

• Comparaison de plusieurs moyennes

• Modèle

• Table d’analyse de la variance

• Validation du modèle

2
1. Introduction
L’analyse de variance permet de comparer simultanément les moyennes d’une
variable dans plusieurs populations, en général normales et de même variance.

Exemples :

Un informaticien a 7 modèles d’ordinateurs qu’il désire comparer du point de vue de la

performance.

Un médecin dispose de 3 médicaments servant à guérir une maladie. Il désire savoir

s’ils sont équivalents ou si l’un d’entre eux guérit plus rapidement que les autres.

Un directeur de magasin d’appareils électroniques est intéressé à comparer 4 méthodes

de publicité. Il veut savoir si ces méthodes sont équivalentes ou si l’une d’elles amène
plus de clients que les autres.

3
2. Comparaison de plusieurs moyennes
a) Yi ~ N(μi, σ2) avec i = 1, 2, …, a

On suppose a populations indépendantes.

Prenons a échantillons de même taille (cas balancé), un pour chaque population à

l’étude :
Population 1 : ( y11 , y12 , ... , y1n )
(
Population 2 : y21 , y22 , ... , y2 n )
...
Population a : (y a1
, ya 2 , ... , yan )

Voici la moyenne des observations pour le traitement i et la moyenne générale de

toutes les observations : n
yi. = ∑ yij ⇒ y i. = yi. / n
j =1
a n
y.. = ∑∑ yij ⇒ y .. = y.. / N
i =1 j =1

4
b) Hypothèses

Soit H0 : μ1 = μ2 = … = μa vs H1 : Au moins deux des moyennes μi ne sont pas égales.

Exemple :

On veut comparer 5 modèles de voitures par rapport à leur consommation d’essence.

Sont-elles équivalentes ? Laquelle est meilleure ?

Marque 1 2 3 4
A Chrysler 22 23 22 21
B Volkswagen 23 26 25 22
C Toyota 26 28 27 31
D Honda 25 23 20 24
E BMW 23 27 22 20

5
c) Vocabulaire :

Soit Y, la variable réponse

Exemple : la consommation d’essence

Facteur : Ce qui différencie les populations ou les traitements

Exemple : le modèle ou la marque

Unité expérimentale : Individu ou objet sur lequel la variable réponse est mesurée.

Exemple : automobile

Plan d’expérience : Procédure permettant d’attribuer les traitements aux unités

expérimentales.

6
d) Notation

Soit yij : j e observation du i e traitement

Exemple (à partir de la diapositive 5) : y21 = 23 , y34 = 31 etc …
.
Exemple :

y3• 112
y3• = 26 + 28 + 27 + 31 = 112 ⇒. y3 = = = 28
4 4
a
Nombre total d' observations : N = ∑ n = an
i =1

Variabilité totale : SCT = ∑ ∑ ( yij − y •• )

a n
2

i =1 j =1

7
3. Modèle

Soit le modèle suivant :

Yij = μ + τi + εij

où yij : jème observation prise lors du traitement i

μ : paramètre commun à tous les traitements, appelé moyenne générale
τi : paramètre associé au ième traitement
εij : composante (erreur) aléatoire

Ainsi, Yij ~ N(μ + τi, σ2), i = 1, 2, …, a, j = 1, 2, …, n.

Contrainte pour le cas balancé: ∑τ = 0

i =1
i

8
Exemple :
Soit 3 populations (toutes de loi Normale) : N(μ1, σ2), N(μ2, σ2), N(μ3, σ2).
n1 = n2 = n3 = 6
Y1 j ~ N( 7 , σ 2 )
Y2 j ~ N( 12 , σ 2 )
Y3 j ~ N( 5 , σ 2 ) j = 1,2 ,...,6

Yij = μ + τ i + εij i = 1,2 ,3

7 + 12 + 5
µ= =8
3
τ 1 = 7 − 8 = −1
τ = 12 − 8 = 4
2

τ = 5 − 8 = −3
3

∑τ = −1 + 4 − 3 = 0 ⇒ contrainte pour le cas balancé

i
i =1

9
Hypothèse nulle :

H 0 : µ1 = µ 2 = ... = µ a ⇔ H 0 : τ 1 = τ 2 = ... = τ a

Partition de la somme des carrés :

∑ ∑ (y − y ) = ∑ n( y i• − y •• ) + ∑ ∑ ( yij − y i )
a n 2 a 2 a n 2

ij ••
i =1 j =1 i =1 i =1 j =1

Variation totale de Y Variation de Y Variation de Y

expliquée par les inexpliquée par
traitements les traitements
(modèle)

SCT = SCM + SCE

SCT : Somme des carrés totale

SCM : Somme des carrés due au modèle
SCE : Somme des carrés des erreurs
10
4. Table d’analyse de la variance (ANOVA)

Source de Somme des Degrés de Carrés moyens Fobservé

variation carrés liberté

Modèle SCM a–1 MCM = SCM/(a – 1) MCM/MCE

Erreur SCE N–a MCE = SCE/(N – a)

Totale SCT N–1

Sous H0, nous avons :

MCM SCM /( a − 1)
F= = ~ Fa −1, N −a
MCE SCE /( N − a )

11
Exemple :

∑ (y − y )
n ni

∑y
2
Marque 1 2 3 4 n n ( y i • − y •• )
2
y i• 2
ij j =1
ij i•
j =1

A 22 23 22 21 4 22 16 1938 2
B 23 26 25 22 4 24 0 2314 10
C 26 28 27 31 4 28 64 3150 14
D 25 23 20 24 4 23 4 2130 14
E 23 27 22 20 4 23 4 2142 26
Total 20 88 11674 66

Regardons maintenant la diapositive suivante pour quelques détails sur ce tableau.

12
5
N = ∑ n = 20
i =1
5 4
y .. = ∑ ∑ yij / N = 480 / 20 = 24
i =1 j =1

yi2. y..2
5
SCM = ∑ − = 88
i =1 n N
5 4 y..2
SCT = ∑ ∑ yij − = 11674 − 480 2 / 20 = 154
2

i =1 j =1 N
SCE = SCT − SCM

À l’aide des résultats précédents, nous pouvons maintenant établir la table d’ANOVA
pour cet exemple (voir la diapositive suivante).

13
Table d’ANOVA

Source de Somme des Degrés de Carrés moyens Fobservé

variation carrés liberté
Modèle 88 4 22 5
Erreur 66 15 4.4

Total 154 19

Sous H 0 : τ 1 = τ 2 = ... = τ a = 0
SCT
~ χ N2 −1
σ 2

SCM
~ χ a2−1
σ 2

SCE
~ χ N2 −a
σ 2

SCM SCE
Les variables et étant indépendantes alors
σ 2
σ 2

SCM σ 2 × (a − 1) SCM (a − 1)
F= = ~ Fa −1, N −a
SCE σ 2 × ( N − a ) SCE ( N − a )
14
La loi de Fisher est tabulée aux pages 551 à 555 du livre de référence.

H0 : μ1 = μ2 = … = μa vs H1 : au moins deux des moyennes μi ne sont pas égales.

SCM ( a − 1)
Sous H 0 : Fobservé = ;
SCE ( N − a )
on rejette H 0 au seuil α si Fobservé ≥ Fα ,a −1, N −a .

Exemple : Consommation d’essence des modèles de voiture

Sous H 0 : Fobservé = 5 . F0.05 , 4 ,15 = 3.055

On rejette donc H 0 au seuil de 5 %, car Fobservé > F0.05 , 4 ,15 (5 > 3.055).

Ainsi, les modèles de voiture diffèrent quant à leur consommation d’essence.

15
Comparaisons multiples :

On calcule d’abord la plus petite différence significative.

PPDS = tα / 2 , N −a 2 × MCE n

On ordonne en croissance les moyennes des traitements.

On déclare significativement différentes les moyennes dont l’écart est supérieur à la
PPDS.

Exemple : La consommation d’essence

Pour α = 0.05, PPDS = t0.025,15 2 × 4.4 / 4 = 3.16
On écrit en ordre croissant les 5 moyennes :
y A yD yE yB yC
22 23 23 24 28
On déclare significativement différentes les moyennes dont l' écart est supérieur à la PPDS.

16
On constate que :
μA < μC
μD < μC
μE < μC
μB < μC

Seule la marque Toyota a une consommation d’essence différente des autres marques
d’automobiles.

Ainsi, nous avons les comparaisons multiples suivantes :

A D E B C
22 23 23 24 28

Notons qu’une ligne droite lie les moyennes qui ne sont pas significativement
différentes les unes des autres.
17
5. Validation du Modèle
2 hypothèses à vérifier :
• Normalité des erreurs
• Homogénéité des variances

Nous avons le modèle suivant :

Yij = µ + τ i + ε ij avec ε ij iid N (0 , σ 2 )

On vérifie ces hypothèses au moyen des résidus.
Résidu : eij = y ij − y i•

Exemple :

Marque 1 2 3 4 n y i• eij
A 22 23 22 21 4 22 0 1 0 -1
B 23 26 25 22 4 24 -1 2 1 -2
C 26 28 27 31 4 28 -2 0 -1 3
D 25 23 20 24 4 23 2 0 -3 1
E 23 27 22 20 4 23 0 4 -1 -3

18
Vérification de la normalité :
Cette vérification s’effectue par un diagramme en boîte ou par un histogramme des
résidus.

Histogramme
Valeurs -3 -2 -1 0 1 2 3 4
Fréquence 2 2 4 5 3 2 1 1

5
4
3 Il n’y a pas de problème avec la normalité
car la distribution des résidus est assez
2 symétrique et possède un seul maximum.
1

− 3 − 2 −1 0 1 2 3 4 5

19
Vérification de l’homogénéité des variances
eij
•
•
• •
1 • • •
0 • • •
22 23 28 y i•
−1 • • • •
• •
•

Étant donné que la distribution des points est assez symétrique autour de l’axe des x,
on peut conclure qu’il n’y a pas de problème d’homogénéité.

20
Cas où il y a hétérogénéité

Yi ~ N (µi , σ i2 ) avec i = 1, 2, ..., a

eij
eij •
•
• • • • •
• • • • • •
• •
• • • • • • • • • • • •
0
• •• • • • • y i• 0
• • • • • •• y i•
• • • • • •
• •• • •
La variance augmente avec la catégorie La variance est inégale
(tendance)

Transformations pour stabiliser la variance lorsque les points représentent une tendance
systématique :
Yij∗ = Yij ou Yij∗ = ln (Yij )
21

Vous aimerez peut-être aussi

Analyse de la variance et régression linéaire
Pas encore d'évaluation
Analyse de la variance et régression linéaire
10 pages
Introduction à l'ANOVA en Biostatistique
Pas encore d'évaluation
Introduction à l'ANOVA en Biostatistique
24 pages
Chapitre 2 ANOVA
Pas encore d'évaluation
Chapitre 2 ANOVA
25 pages
Analyse de La Variance - Pour Fusion
Pas encore d'évaluation
Analyse de La Variance - Pour Fusion
16 pages
Introduction aux modèles linéaires 1
0% (1)
Introduction aux modèles linéaires 1
60 pages
2024 MTH8302 ch12 ANOVA 2 UnFacteur
Pas encore d'évaluation
2024 MTH8302 ch12 ANOVA 2 UnFacteur
53 pages
Analyse de Variance (ANOVA) expliquée
Pas encore d'évaluation
Analyse de Variance (ANOVA) expliquée
34 pages
Econometrie 1-Doc 2 - FDSE
Pas encore d'évaluation
Econometrie 1-Doc 2 - FDSE
13 pages
Anova 1
Pas encore d'évaluation
Anova 1
49 pages
Modèles Linéaires Gaussiens S2 Master
Pas encore d'évaluation
Modèles Linéaires Gaussiens S2 Master
107 pages
Anova
Pas encore d'évaluation
Anova
54 pages
ANOVA : Comparaison de Moyennes en Psychologie
Pas encore d'évaluation
ANOVA : Comparaison de Moyennes en Psychologie
9 pages
Concepts Clés en Analyse de Données
Pas encore d'évaluation
Concepts Clés en Analyse de Données
30 pages
ANOVA à un facteur : Méthodes et exemples
Pas encore d'évaluation
ANOVA à un facteur : Méthodes et exemples
12 pages
Analyse statistique du stress et régression
Pas encore d'évaluation
Analyse statistique du stress et régression
4 pages
Tests d'hypothèses et ANOVA pour ingénieurs
Pas encore d'évaluation
Tests d'hypothèses et ANOVA pour ingénieurs
39 pages
Analyse de La Variance Et Test de Khi Deux
Pas encore d'évaluation
Analyse de La Variance Et Test de Khi Deux
31 pages
Chapitre 3
Pas encore d'évaluation
Chapitre 3
46 pages
Analyse de Variance en Biologie
Pas encore d'évaluation
Analyse de Variance en Biologie
11 pages
GR 47
Pas encore d'évaluation
GR 47
119 pages
Cours d'Économétrie : Régression Linéaire
Pas encore d'évaluation
Cours d'Économétrie : Régression Linéaire
42 pages
Modélisation et Régression Avancées
Pas encore d'évaluation
Modélisation et Régression Avancées
43 pages
Techniques Prédictives en Data Mining
Pas encore d'évaluation
Techniques Prédictives en Data Mining
151 pages
Introduction à l'Analyse de Variance
Pas encore d'évaluation
Introduction à l'Analyse de Variance
8 pages
Cours Stat 3ème Biologie ANOVA + Regression PDF
100% (1)
Cours Stat 3ème Biologie ANOVA + Regression PDF
36 pages
Modèles Linéaires et Moindres Carrés
Pas encore d'évaluation
Modèles Linéaires et Moindres Carrés
20 pages
Cours Anova
Pas encore d'évaluation
Cours Anova
9 pages
Variables Expliquées et Explicatives
Pas encore d'évaluation
Variables Expliquées et Explicatives
20 pages
Anova GC
Pas encore d'évaluation
Anova GC
5 pages
Analyse Statistique des Expériences
Pas encore d'évaluation
Analyse Statistique des Expériences
6 pages
ANOVA
Pas encore d'évaluation
ANOVA
15 pages
ANOVA et Régression Linéaire Générale
100% (1)
ANOVA et Régression Linéaire Générale
17 pages
Formulaire Statistique
Pas encore d'évaluation
Formulaire Statistique
15 pages
Analyse de la variance : Méthodes et Modèles
Pas encore d'évaluation
Analyse de la variance : Méthodes et Modèles
50 pages
ANOVA: Analyse de Variance et Tests Statistiques
Pas encore d'évaluation
ANOVA: Analyse de Variance et Tests Statistiques
14 pages
Tests et Validation Statistique
100% (1)
Tests et Validation Statistique
4 pages
Analyse de la variance simplifiée
Pas encore d'évaluation
Analyse de la variance simplifiée
19 pages
Statistique Descriptive Double : Concepts clés
Pas encore d'évaluation
Statistique Descriptive Double : Concepts clés
8 pages
Introduction à l'ANOVA unifactorielle
Pas encore d'évaluation
Introduction à l'ANOVA unifactorielle
13 pages
Loi Normale et Statistiques Essentielles
Pas encore d'évaluation
Loi Normale et Statistiques Essentielles
8 pages
Analyse de Variance : Concepts Clés
Pas encore d'évaluation
Analyse de Variance : Concepts Clés
17 pages
Statistique: Anne Gégout-Petit Master 1 IMOI Université de Lorraine 7 Mai 2019
Pas encore d'évaluation
Statistique: Anne Gégout-Petit Master 1 IMOI Université de Lorraine 7 Mai 2019
121 pages
Biostatistique Tous Les Cours s2
Pas encore d'évaluation
Biostatistique Tous Les Cours s2
65 pages
Cours de Biostatistiques : Statistiques Inférentielles
Pas encore d'évaluation
Cours de Biostatistiques : Statistiques Inférentielles
107 pages
Applications du modèle linéaire en statistiques
Pas encore d'évaluation
Applications du modèle linéaire en statistiques
124 pages
Stat Inférentielle-Cours PDF
Pas encore d'évaluation
Stat Inférentielle-Cours PDF
95 pages
Introduction à la régression multiple
Pas encore d'évaluation
Introduction à la régression multiple
83 pages
Guide pratique de R pour statistiques
Pas encore d'évaluation
Guide pratique de R pour statistiques
46 pages
Modèle Linéaire et Extensions Statistiques
Pas encore d'évaluation
Modèle Linéaire et Extensions Statistiques
328 pages
Calculatrices
Pas encore d'évaluation
Calculatrices
11 pages
Statistique Inférentielle Avancée
Pas encore d'évaluation
Statistique Inférentielle Avancée
63 pages
20-Ellipses Statistiques Appliquees Avec R
100% (2)
20-Ellipses Statistiques Appliquees Avec R
254 pages
Fsega-Td-Statistique Et Econometrie l3 - Hndame - Makembe
Pas encore d'évaluation
Fsega-Td-Statistique Et Econometrie l3 - Hndame - Makembe
4 pages
Tests d'hypothèses et analyse de variance
Pas encore d'évaluation
Tests d'hypothèses et analyse de variance
39 pages
Partie 2 Cours 1
Pas encore d'évaluation
Partie 2 Cours 1
3 pages
QCM Total
Pas encore d'évaluation
QCM Total
17 pages
Moyenne Variance3
Pas encore d'évaluation
Moyenne Variance3
31 pages
Exposé Sur Les Jumeaux
Pas encore d'évaluation
Exposé Sur Les Jumeaux
32 pages
Emploi Du Temps L1
Pas encore d'évaluation
Emploi Du Temps L1
1 page
Expose
Pas encore d'évaluation
Expose
3 pages
Document
Pas encore d'évaluation
Document
3 pages
3-Lois de Proba Discrètes
Pas encore d'évaluation
3-Lois de Proba Discrètes
22 pages
Emploi de Temps Du 16 Au 21 Decembre 2024
Pas encore d'évaluation
Emploi de Temps Du 16 Au 21 Decembre 2024
18 pages
Correction Des Exercices Mi 2
100% (1)
Correction Des Exercices Mi 2
3 pages
Rapport Projet 2
Pas encore d'évaluation
Rapport Projet 2
8 pages
13 Regression Linéaire
Pas encore d'évaluation
13 Regression Linéaire
25 pages
Autonomie et éthique des biobanques
Pas encore d'évaluation
Autonomie et éthique des biobanques
155 pages
Loi Leonetti L'euthanasie
Pas encore d'évaluation
Loi Leonetti L'euthanasie
1 page
Devoir de Droit Et Santé PH L1 2023-2024
100% (1)
Devoir de Droit Et Santé PH L1 2023-2024
1 page
Poirot Quitte La Scene by Christie, Agatha
100% (1)
Poirot Quitte La Scene by Christie, Agatha
199 pages
Calendrier Des Devoirs de T3
Pas encore d'évaluation
Calendrier Des Devoirs de T3
1 page
Anatomie et biomécanique du rachis
Pas encore d'évaluation
Anatomie et biomécanique du rachis
17 pages
Epreuve Bepc 2023
Pas encore d'évaluation
Epreuve Bepc 2023
2 pages
Liste Des Universités Publiques Du Burkina Ar
Pas encore d'évaluation
Liste Des Universités Publiques Du Burkina Ar
8 pages
Econometrie - S6 Converti Converti PDF
Pas encore d'évaluation
Econometrie - S6 Converti Converti PDF
44 pages
Exercices Estimation Ponctuelle
Pas encore d'évaluation
Exercices Estimation Ponctuelle
2 pages
Caractéristiques de Position et Dispersion Statistique
Pas encore d'évaluation
Caractéristiques de Position et Dispersion Statistique
14 pages
Analyse des Séries Temporelles ENEAM 2023
Pas encore d'évaluation
Analyse des Séries Temporelles ENEAM 2023
14 pages
Échantillonnage et démographie à Madagascar
Pas encore d'évaluation
Échantillonnage et démographie à Madagascar
13 pages
Devoir Stata PDF
Pas encore d'évaluation
Devoir Stata PDF
4 pages
Régression et Corrélation en Statistique
100% (1)
Régression et Corrélation en Statistique
2 pages
Analyse des résidus et hétéroscédasticité
Pas encore d'évaluation
Analyse des résidus et hétéroscédasticité
30 pages
TD Supervised L Reg Lin
Pas encore d'évaluation
TD Supervised L Reg Lin
3 pages
Fiches de Revisions Maths BTS Statistiques
Pas encore d'évaluation
Fiches de Revisions Maths BTS Statistiques
4 pages
2-Comparaison Des 2 Moyennes
Pas encore d'évaluation
2-Comparaison Des 2 Moyennes
39 pages
Exercices Corrigés de Biostatistique
Pas encore d'évaluation
Exercices Corrigés de Biostatistique
4 pages
Chapter 3 (4)
100% (1)
Chapter 3 (4)
33 pages
Évaluation par régression sur discontinuité
Pas encore d'évaluation
Évaluation par régression sur discontinuité
11 pages
Analyse factorielle des correspondances AFC
Pas encore d'évaluation
Analyse factorielle des correspondances AFC
16 pages
Statistiques descriptives en mathématiques
Pas encore d'évaluation
Statistiques descriptives en mathématiques
11 pages
Evaluation Impact
Pas encore d'évaluation
Evaluation Impact
19 pages
TP 1
Pas encore d'évaluation
TP 1
3 pages
Cours Effect Size
Pas encore d'évaluation
Cours Effect Size
44 pages
Économétrie : Analyse du Taux de Scolarisation
Pas encore d'évaluation
Économétrie : Analyse du Taux de Scolarisation
6 pages
Statistique 3e
Pas encore d'évaluation
Statistique 3e
4 pages
Table de la loi normale standard
Pas encore d'évaluation
Table de la loi normale standard
2 pages
TP5 Régression Logistique-1
Pas encore d'évaluation
TP5 Régression Logistique-1
13 pages
Statistiques M1/BTP : Lois et Tests
Pas encore d'évaluation
Statistiques M1/BTP : Lois et Tests
33 pages
Échantillonnage Seconde
Pas encore d'évaluation
Échantillonnage Seconde
5 pages
Méthode Driscoll-Kraay en économétrie
100% (1)
Méthode Driscoll-Kraay en économétrie
5 pages
Statm1 20231019 1
Pas encore d'évaluation
Statm1 20231019 1
65 pages
Analyse des données étudiants SPSS
Pas encore d'évaluation
Analyse des données étudiants SPSS
7 pages
Introduction à l'économétrie : Exercice 1-3
Pas encore d'évaluation
Introduction à l'économétrie : Exercice 1-3
1 page
Techniques de Sondage en Santé
100% (1)
Techniques de Sondage en Santé
35 pages