Introduction à l’analyse de données
Prof. Y. FADIL
Ecole Supérieure de Téchnologie
Fqih Ben Saleh
Université Sultan Moulay Slimane
December 15, 2024
December 15, 2024 1 / 15
Introduction à l’analyse de données
Prof. Y. FADIL
Ecole Supérieure de Téchnologie
Fqih Ben Saleh
Université Sultan Moulay Slimane
December 15, 2024
December 15, 2024 2 / 15
Table des Matières
1 Modélisation statistique
2 Facteur à effet fixe
December 15, 2024 3 / 15
Objectif
Étudier un test statistique permettant de comparer les moyennes de plusieurs variables
aléatoires indépendantes Gaussiennes de même variance.
L’analyse de la variance est l’une des procédures les plus utilisées en statistique et en
analyse de données.
December 15, 2024 4 / 15
Exemple : Les carburateurs
On veut tester 4 types de carburateurs.
Chaque type est testé sur 6 pièces montées successivement sur 4 voitures identiques.
Les résultats sont présentés sous deux formes :
▶ Tableau désempilé : chaque type a ses données séparées.
▶ Tableau empilé : une colonne pour le type et une autre pour la consommation.
December 15, 2024 5 / 15
Remarques sur les données
Les logiciels de statistiques utilisent souvent le format empilé.
Les unités des mesures, bien que nécessaires, ne sont pas indiquées dans cet exemple pour
simplifier.
Lors de l’entrée des données dans un logiciel, le mot ”Carburateur” ne doit pas être inclus.
December 15, 2024 6 / 15
Définitions et notations
Sur chaque essai, deux variables sont observées :
▶ Le carburateur : une variable qualitative avec quatre modalités, appelée le facteur.
▶ La consommation : une variable quantitative, appelée la réponse.
Observations notées yij avec :
▶ i : numéro du groupe (carburateur).
▶ j : numéro de l’observation (essai).
Équilibre : si tous les groupes ont le même nombre d’observations (ni = n), l’expérience
est équilibrée.
December 15, 2024 7 / 15
Formules pour les moyennes et variances
Moyenne de chaque échantillon :
n
1X
ȳi = yij , i = 1, . . . , I .
n
j=1
Variance non corrigée :
n
1X
si2 (y ) = (yij − ȳi )2 , i = 1, . . . , I .
n
j=1
Variance corrigée :
n
2 1 X
si,c (y ) = (yij − ȳi )2 .
n−1
j=1
December 15, 2024 8 / 15
Retour à l’exemple
Moyennes des échantillons calculées :
ȳ1 = 23.5, ȳ2 = 24.67, ȳ3 = 20.33, ȳ4 = 19.83.
Variances corrigées :
2 2 2 2
s1,c (y ) = 5.89, s2,c (y ) = 6.47, s3,c (y ) = 4.93, s4,c (y ) = 7.11.
Nombre total d’observations : n = I · J = 4 · 6 = 24.
December 15, 2024 9 / 15
Modèle statistique
Modèle pour un plan équilibré :
Yij ∼ N(µi , σ 2 ), i = 1, . . . , I , j = 1, . . . , J.
Modèle équivalent :
I
X
Yij = µ + αi + εij , αi = 0, εij ∼ N(0, σ 2 ).
i=1
Les différences entre groupes se reflètent uniquement dans les moyennes µi .
December 15, 2024 10 / 15
Conditions fondamentales
Indépendance des résidus eij .
Homogénéité des variances σ 2 (homoscédasticité).
Normalité des résidus.
Remarque : Ces conditions peuvent être testées à l’aide des outils statistiques comme les
tests de Shapiro-Wilk ou de Bartlett.
December 15, 2024 11 / 15
Deux propriétés fondamentales
Propriété 1 : La moyenne de toutes les observations est la moyenne des moyennes des
groupes :
I
1X
ȳ = ȳi .
I
i=1
Propriété 2 : La variance totale est la somme de la variance des moyennes et de la
moyenne des variances :
I I
1X 1X 2
s 2 (y ) = (ȳi − ȳ )2 + si (y ).
I I
i=1 i=1
December 15, 2024 12 / 15
Retour à l’exemple
Variance totale : s 2 (y ) = 35.78.
Variance des moyennes : 4.22.
Moyenne des variances : 31.56.
Relation vérifiée : 35.78 = 4.22 + 31.56.
December 15, 2024 13 / 15
Résultat fondamental de l’ANOVA
Décomposition de la somme des carrés :
SCT = SCE + SCR.
Notations :
▶ SCT : Somme des carrés totale (dispersion autour de ȳ ).
▶ SCE : Somme des carrés expliquée (dispersion des moyennes autour de ȳ ).
▶ SCR : Somme des carrés résiduelle (dispersion intra-groupe).
December 15, 2024 14 / 15
Test de l’ANOVA
Statistiques :
sE2 SCE/(I − 1)
F = 2
= .
sR SCR/(n − I )
Décision :
▶ Si F < Fc , accepter H0 (moyennes égales).
▶ Si F ≥ Fc , rejeter H0 (moyennes différentes).
Exemple : Pour les carburateurs, F = 0.888, Fc = 3.10. Conclusion : H0 est acceptée.
December 15, 2024 15 / 15