Partie 3 : Tests d’hypothèses:
I-Tests paramétriques
Très souvent, on est conduit à confronter une
estimation obtenue à partir d’un sondage aléatoire à une
norme fixé a priori, ou encore à comparer les résultats de
deux échantillons différents.
La résolution de ces problèmes de comparaison à
partir des échantillons aléatoires repose sur un mode de
raisonnement statistique désigné sous le nom de test
d’hypothèses.
1- Principe des tests
Un test consiste à :
Émettre une hypothèse, notée H0, appelée hypothèse
nulle, sur un paramètre de X,
Proposer une hypothèse alternative, notée H1
Choisir une grandeur calculée à partir de l’échantillon,
appelée statistique
Construire une règle de décision
Déterminer la zone de rejet de l’hypothèse H0 en
fonction du risque d’erreur a que l’on veut bien accepter
Prendre une décision
Les risques d’erreur dans un test
décision Accepter H0 Rejeter H0
réalité
H0 vraie Bonne décision Mauvaise
décision:
Erreur a
H0 fausse Mauvaise Bonne décision
décision:
Erreur b
a = P(Rejeter H0 sachant que H0 est vraie)
b = P(Accepter H0 sachant que H0 est fausse)
Remarque:
Le choix du risque α est lié aux conséquences
pratiques de la décision : si les conséquences
sont graves, on choisira α = 1% ou 1‰, mais si
le débat est plutôt académique, α = 5 % fera le
plus souvent l’affaire.
2. Tests de conformité
2.1 Test de comparaison d’une moyenne à une valeur
donnée
2.1.1 Principe du test
Soit X, une variable aléatoire observée sur
une population, X → N(μ,σ)
Population inconnue Population connue
X → N(μ,σ) X → N(μ0, σ0)
Echantillonnage aléatoire
Echantillon
n, X , s 2
Hypothèse
H0 : μ = μ0 H1: μ ≠ μ0 test bilatéral
μ < μ0 test unilatéral gauche
μ > μ0 test unilatéral droit
2.1.2 Méthode de résolution
Étape 1: H0 : m = m0 H1: m ≠ m0
Étape 2: Déterminer le risque d’erreur α
Étape 3: Déterminer le critère de rejet.
X → N(μ,σ) avec σ connu
X m0
Pour un test bilatéral Z obs
2
X m0
Pour un test unilatéral Z obs
2
Zobs suit une loi normale centrée réduite N(0, 1)
Étape 4 : Règle de décision
pour un test bilatéral
Si Zobs > Zseuil on rejette H0 au risque d’erreur α
Sinon on accepte H0 Zseuil = Z1-α/2
Test unilatéral droit H1: m > m0
Si Zobs >Zseuil on rejette H0 au risque d’erreur α.
Sinon on accepte H0 Zseuil = Z1-α
Test unilatéral gauche H1: m < m0
Si Zobs< Zseuil on rejette H0 au risque d’erreur α.
Sinon on accepte H0 Zseuil = Z1-α
2.1.3 Remarque
Généralement on ignore à la fois la valeur de m et de de
la population. On remplace alors, par son estimation s n
déduite des observations:
X m0
Z
Si n 30 ou X suit une loi normale, on a sn / n
suit la loi normale centrée réduite.
Si n < 30 et X suit une loi normale, Z est remplacé par T,
T suit une loi de Student à n-1 degrés de liberté.
Exemple :
Une bibliothèque universitaire se demande si le
nombre moyen d’ouvrages consultés par les
étudiants au cours d’une visite a augmenté. Dans le
passé une étude avait montré que cette moyenne
s’établissait à 3 livres.
Un échantillon aléatoire de 10 étudiants (on
suppose qu’il est normalement distribué) a permis
de mesurer une moyenne de 4,2 livres consultés
avec un écart type de 1,8. Que peut-on conclure ?
2.2 Test relatif à une proportion
Test bilatéral Test unilatéral droit Test unilatéral gauche
H 0 : p = p0 H0 : p = p0 H0 : p = p0
H1 : p p0 H1 : p > p0 H1 : p < p0
2.2.1 Méthode de résolution
Étape 1: H0 : p = p0 H1: p ≠ p0
Étape 2: Déterminer le risque d’erreur α
Étape 3: Déterminer le critère de rejet.
p p0
Z obs
p 0 (1 p 0 )
n
suit une loi normale N(0, 1) si n >30, np0 ≥ 5 et nq0 ≥ 5
Étape 4 : Règle de décision
pour un test bilatéral
Si Zobs > Zseuil on rejette H0 au risque d’erreur α
Sinon on accepte H0 Zseuil = Z1-α/2
Test unilatéral droit H1: m > m0
Si Zobs >Zseuil on rejette H0 au risque d’erreur α.
Sinon on accepte H0 Zseuil = Z1-α
Test unilatéral gauche H1: m < m0
Si Zobs< Zseuil on rejette H0 au risque d’erreur α.
Sinon on accepte H0 Zseuil = Z1-α
Exemple
Au vu d’un échantillon de 40 000 naissances, on veut tester
qu’il y a autant de chances qu’un nouveau-né soit un garçon que
de chances qu’il soit une fille. En désignant par p la probabilité
qu’un nouveau-né soit un garçon.
Le nombre des nouveau-nés garçons dans l’échantillon est
20436
3. Tests d’homogénéité
Les tests d’homogénéité, destinés à comparer deux
populations à l’aide d’un nombre équivalent
d’échantillons (tests d’égalité ou d’homogénéité),
sont les plus couramment utilisés. Dans ce cas la loi
théorique du paramètre étudié (par exemple p, μ ,σ2)
est inconnue au niveau des populations étudiées.
3.1 Comparaison de deux variances
3.1.1 Principe du test
Population 1 Population 2
X → N(μ1, σ1) X → N(μ2, σ2)
Echantillonnage aléatoire
Echantillon Echantillon
2 2
n1 , X 1 , s1 n2 , X 2 , s2
Hypothèses
H0 : σ12= σ22 H1: σ12 > σ22
3.1.2 Méthode de résolution
Étape 1: H0 : σ12= σ22 H1: σ12 > σ22
Étape 2: Déterminer le risque d’erreur α
Étape 3: Déterminer le critère de rejet.
n1
^ s12
12 n1 1
Fobs ^
n2
22 s22
n2 1
suit une loi de Fisher à (n1 -1, n2 -1) degrés de
liberté
Étape 4 : Règle de décision
Il faut maintenant trouver dans la table de Fisher
la valeur critique Fseuil .
La règle de décision s’énoncera alors ainsi :
Si Fobs ≥ Fseuil alors on rejette H0.
Si Fobs ≤ Fseuil alors on accepte H0
Exemple :
Méthode A Méthode B
1,30 1,30
1,32 1,40
1,40 1,48
1,45 1,48
1,50 1,50
1,51 1,60
1,55 1,76
1,56 1,88
1,92
2,20
Réaliser le test d’égalité de deux variances avec un
risque d’erreur de 5%
3.2 Comparaison de deux moyennes
a- Principe du test
Soit X un caractère quantitatif continu observé sur deux
populations suivant une loi normale et deux échantillons
indépendants extraits de ces deux populations.
Hypothèses
H0 : m1= m2 H1: m1 ≠ m2
b- Méthode de résolution
Étape 1: H0 : m1= m2 H1: m1 ≠ m2
Étape 2: Déterminer le risque d’erreur α
Étape 3: Déterminer le critère de rejet.
b-1 Si les variances des 2 populations sont connues
X1 → N(m1,1) , X2 → N(m2,2) avec 1 , 2 connus
1
X 1 N m1 , et X 2 N m 2 , 2
n1 n2
12 22
donc X1 X 2 N m1 m 2 ,
n1 n2
ou Z
X 1
X 2 m1 m 2
N (0,1)
2
2
1
2
n1 n2
Sous H0 : m1= m2
X 1 X 2
Z obs
12 22
n1 n2
Étape 4 : Règle de décision
Si Zobs > Zseuil on rejette H0 au risque d’erreur α
Sinon on accepte H0 Zseuil = Z1-α/2
Exemple
On a effectué une étude, en milieu urbain et en
milieu rural, sur le rythme cardiaque humain :
Effectif de l’échantillon 300(urbain) 240(rural)
Moyenne de l’échantillon 80 77
Variance de la population 150 120
La v. a X « rythme cardiaque » suit une loi normale
Peut-on affirmer qu’il existe une différence
significative entre les rythmes cardiaques moyens des
deux populations ?
b-2 si les variances des 2 populations sont
inconnues
Si les variances des deux populations sont inconnues, on
fait le test de comparaison variances (test de Fisher).
Si les deux variances sont différentes on remplace
σ12 et σ22 par leurs estimateurs,n1>30 ou n2>30
X1 X 2 X1 X 2
zobs
^2 ^
2 s12 s2
2
1 2
n1 1 n2 1
n1 n2
Exemple
On veut comparer la production de deux machines
artisanales. Le volume de parfum déposé par ces
machines dans des flacons destinés à la vente a été
mesuré en ml. Les statistiques figurent ci-dessous.
Le responsable soupçonne une production
dépendante de la machine.
Machine 1 47 53 49 50 46
Machine 2 54 50 51 51 49
Qu’en pensez-vous?
3.3 Comparaison de deux proportions
3.3.1 Principe du test
Soit X une variable qualitative prenant deux modalités
(succès X=1, échec X=0) observée sur 2 populations et
deux échantillons indépendants extraits de ces deux
populations. On fait l’hypothèse que les deux
échantillons proviennent de 2 populations dont les
probabilités de succès sont identiques.
Hypothèses
H0 : p1= p2 H 1: p 1 ≠ p 2
Conditions d’application:
échantillons indépendants
n1 > 30 , n2 > 30,
n1p1 > 5, n1(1-p1)> 5,
n2p2 >5, n2(1-p2) > 5.
3.3.2 - Méthode de résolution
Étape 1: H0 : p1= p2 H1: p1 ≠ p2
Étape 2: Déterminer le risque d’erreur α
Étape 3: Déterminer le critère de [Link] H0 : p1= p2
p1 p 2 n1 p1 n2 p 2
Z obs avec p
1 1 n1 n2
p q
n1 n2
suit une loi normale centrée réduite N(0, 1)
Étape 4 : Règle de décision
Si Zobs > Zseuil on rejette H0 au risque d’erreur α
Sinon on accepte H0 Zseuil = Z1-α/2
Exemple
On veut tester l’impact des travaux dirigés
dans la réussite à l’examen de statistique.
Groupe 1 Groupe 2
Nombre
d’heures de TD 20 h 30 h
Nombre
d’étudiants 180 150
Nombre
d’étudiants ayant 126 129
réussi à l’examen
Qu’en concluez-vous ?
II- Test non paramétrique:
Test d’indépendance de deux variables
1- EXEMPLE
Soit un tableau de contingence d'effectifs observés avec
deux variables qualitatives qui se distribuent ainsi :
1.1- Effectifs observés :
Y Fumeurs Non fumeurs
X
Hommes 17 8
Femmes 9 14
Y a-t-il un lien entre X et Y?
1.2- Effectifs marginaux:
Totaux des lignes et des colonnes (marges)
Fumeurs Non Total
fumeurs
Hommes 17 8 25
Femmes 9 14 23
Total 26 22 48
1.3- Effectifs théoriques
Si les 2 variables X et Y sont indépendantes on a:
Fumeurs Non Total
fumeurs
Hommes 13,54 11,46 25
Femmes 12,46 10,54 23
Total 26 22 48
25 26
n11 13,54
48
1.4 Comparaison
Effectifs théoriques
Fumeurs Non Total
fumeurs
Hommes 13,54 11,46 25
Femmes 12,46 10,54 23
Total 26 22 48
Fumeurs Non Total
fumeurs
Hommes 17 8 25
Femmes 9 14 23
Effectifs Total 26 22 48
observés
2- Test d’indépendance: Test de c²
2.1 Principe du test
Soient X et Y deux variables qualitatives
Tableau lorsque X et Y sont
Tableau initial indépendantes
… yj … Total … yj … Total
… … … … … … … … … …
n i .n. j
xi … nij … ni. xi … … ni.
n
… … … … … … … … … …
Total … n.j … n Total … n.j … n
Si X et Y sont indépendantes, les 2 tableaux doivent
contenir des valeurs très proches:
n i .n. j
nij ≈ , pour tout i et j
n
2.2 Méthode de résolution
Étape 1: H0 : X et Y sont indépendantes
H1 : X et Y sont dépendantes
Étape 2: Déterminer le risque d’erreur α
Étape 3: Déterminer le critère de rejet.
(eff oij eff t ij ) 2
Sous H 0 c obs
2
i, j efft ij
suit une loi de c² à n = (l-1)(c-1) degrés de
liberté
l = Nombre de c = Nombre de
modalités de la modalités de la
variable en ligne variable en colonne
L’utilisation de la loi du c² n’est justifiée que si les
effectifs théoriques de chacune des cellules est supérieur
ou égal à 5.
Étape 4 : Règle de décision
c²obs > c²seuil : on rejette H0.
c²obs < c²seuil : on accepte H0.
c²seuil = c²((l-1)(c-1); α)
Dans notre exemple:
(17 - 13,54)² (14 - 10,54)²
c 2
obs ........
13,54 10,54
4.02
2.3 Conditions d’application:
Tous les effectifs théoriques doivent être
supérieurs ou égaux à 5.
Dans notre exemple , d.d.l. = (2 - 1) x (2 - 1) = 1,
avec un risque de 5% de se tromper, la valeur
lue est 3.841.
c²obs = 4,02 > c²seuil = 3,841
Nous pouvons conclure qu'il existe une liaison
statistiquement significative entre ces deux
variables.