0% ont trouvé ce document utile (0 vote)
54 vues15 pages

ANOVA

Ce document présente une introduction à l'analyse de données, en se concentrant sur l'analyse de la variance (ANOVA) pour comparer les moyennes de plusieurs variables aléatoires indépendantes. Il décrit un exemple de test de différents types de carburateurs et fournit des définitions, des notations, ainsi que des formules pour les moyennes et variances. Les conditions fondamentales pour l'application de l'ANOVA et les résultats statistiques sont également abordés.

Transféré par

aslihaff
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
54 vues15 pages

ANOVA

Ce document présente une introduction à l'analyse de données, en se concentrant sur l'analyse de la variance (ANOVA) pour comparer les moyennes de plusieurs variables aléatoires indépendantes. Il décrit un exemple de test de différents types de carburateurs et fournit des définitions, des notations, ainsi que des formules pour les moyennes et variances. Les conditions fondamentales pour l'application de l'ANOVA et les résultats statistiques sont également abordés.

Transféré par

aslihaff
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Introduction à l’analyse de données

Prof. Y. FADIL

Ecole Supérieure de Téchnologie


Fqih Ben Saleh
Université Sultan Moulay Slimane

December 15, 2024

December 15, 2024 1 / 15


Introduction à l’analyse de données

Prof. Y. FADIL

Ecole Supérieure de Téchnologie


Fqih Ben Saleh
Université Sultan Moulay Slimane

December 15, 2024

December 15, 2024 2 / 15


Table des Matières

1 Modélisation statistique

2 Facteur à effet fixe

December 15, 2024 3 / 15


Objectif

Étudier un test statistique permettant de comparer les moyennes de plusieurs variables


aléatoires indépendantes Gaussiennes de même variance.
L’analyse de la variance est l’une des procédures les plus utilisées en statistique et en
analyse de données.

December 15, 2024 4 / 15


Exemple : Les carburateurs

On veut tester 4 types de carburateurs.


Chaque type est testé sur 6 pièces montées successivement sur 4 voitures identiques.
Les résultats sont présentés sous deux formes :
▶ Tableau désempilé : chaque type a ses données séparées.
▶ Tableau empilé : une colonne pour le type et une autre pour la consommation.

December 15, 2024 5 / 15


Remarques sur les données

Les logiciels de statistiques utilisent souvent le format empilé.


Les unités des mesures, bien que nécessaires, ne sont pas indiquées dans cet exemple pour
simplifier.
Lors de l’entrée des données dans un logiciel, le mot ”Carburateur” ne doit pas être inclus.

December 15, 2024 6 / 15


Définitions et notations

Sur chaque essai, deux variables sont observées :


▶ Le carburateur : une variable qualitative avec quatre modalités, appelée le facteur.
▶ La consommation : une variable quantitative, appelée la réponse.
Observations notées yij avec :
▶ i : numéro du groupe (carburateur).
▶ j : numéro de l’observation (essai).
Équilibre : si tous les groupes ont le même nombre d’observations (ni = n), l’expérience
est équilibrée.

December 15, 2024 7 / 15


Formules pour les moyennes et variances
Moyenne de chaque échantillon :
n
1X
ȳi = yij , i = 1, . . . , I .
n
j=1

Variance non corrigée :


n
1X
si2 (y ) = (yij − ȳi )2 , i = 1, . . . , I .
n
j=1

Variance corrigée :
n
2 1 X
si,c (y ) = (yij − ȳi )2 .
n−1
j=1

December 15, 2024 8 / 15


Retour à l’exemple

Moyennes des échantillons calculées :

ȳ1 = 23.5, ȳ2 = 24.67, ȳ3 = 20.33, ȳ4 = 19.83.

Variances corrigées :
2 2 2 2
s1,c (y ) = 5.89, s2,c (y ) = 6.47, s3,c (y ) = 4.93, s4,c (y ) = 7.11.

Nombre total d’observations : n = I · J = 4 · 6 = 24.

December 15, 2024 9 / 15


Modèle statistique

Modèle pour un plan équilibré :

Yij ∼ N(µi , σ 2 ), i = 1, . . . , I , j = 1, . . . , J.

Modèle équivalent :
I
X
Yij = µ + αi + εij , αi = 0, εij ∼ N(0, σ 2 ).
i=1

Les différences entre groupes se reflètent uniquement dans les moyennes µi .

December 15, 2024 10 / 15


Conditions fondamentales

Indépendance des résidus eij .


Homogénéité des variances σ 2 (homoscédasticité).
Normalité des résidus.
Remarque : Ces conditions peuvent être testées à l’aide des outils statistiques comme les
tests de Shapiro-Wilk ou de Bartlett.

December 15, 2024 11 / 15


Deux propriétés fondamentales

Propriété 1 : La moyenne de toutes les observations est la moyenne des moyennes des
groupes :
I
1X
ȳ = ȳi .
I
i=1

Propriété 2 : La variance totale est la somme de la variance des moyennes et de la


moyenne des variances :
I I
1X 1X 2
s 2 (y ) = (ȳi − ȳ )2 + si (y ).
I I
i=1 i=1

December 15, 2024 12 / 15


Retour à l’exemple

Variance totale : s 2 (y ) = 35.78.


Variance des moyennes : 4.22.
Moyenne des variances : 31.56.
Relation vérifiée : 35.78 = 4.22 + 31.56.

December 15, 2024 13 / 15


Résultat fondamental de l’ANOVA

Décomposition de la somme des carrés :

SCT = SCE + SCR.

Notations :
▶ SCT : Somme des carrés totale (dispersion autour de ȳ ).
▶ SCE : Somme des carrés expliquée (dispersion des moyennes autour de ȳ ).
▶ SCR : Somme des carrés résiduelle (dispersion intra-groupe).

December 15, 2024 14 / 15


Test de l’ANOVA

Statistiques :
sE2 SCE/(I − 1)
F = 2
= .
sR SCR/(n − I )
Décision :
▶ Si F < Fc , accepter H0 (moyennes égales).
▶ Si F ≥ Fc , rejeter H0 (moyennes différentes).
Exemple : Pour les carburateurs, F = 0.888, Fc = 3.10. Conclusion : H0 est acceptée.

December 15, 2024 15 / 15

Vous aimerez peut-être aussi