Module 8 - Tests d’hypothèses
MQT-1102 Probabilités et statistique
Julien Miron
Opérations et systèmes de décision
Introduction
2 / 31
Des hypothèses de recherche
Une question de recherche est souvent liée à un paramètre d’une population
d’intérêt :
∙ La crue printanière moyenne d’une rivière est supérieure à 8 m.
∙ L’écart-type de l’épaisseur des pistons produits par une usine est inférieur à
0,01 cm.
∙ Le taux moyen de contaminants diminue après la filtration.
3 / 31
Hypothèse statistique
Hypothèse statistique
Énoncé sur la loi de probabilité que suit une variable aléatoire (ou sur ses
paramètres).
Exemples :
Une population Plusieurs populations
∙ μ ≠ 10 ∙ μ1 > μ2
∙ μ>3 ∙ σ21 ≠ σ22
∙ σ2 = 4 ∙ μ1 = μ2 = μ3 = μ4
4 / 31
Test d’hypothèses
Dans un test d’hypothèses, on confronte deux hypothèses. Par exemple,
H0 ∶ μ ≤ 10 contre H𝑎 ∶ μ > 10.
H0 : l’hypothèse nulle. Considérée comme vraie a priori.
H𝑎 : l’hypothèse alternative. Celle que l’on cherche à démontrer avec preuves à l’appui.
On suppose que H0 est vraie jusqu’à ce qu’une preuve suffisante que H0 n’est pas vraie
ait été amassée. La preuve provient des données qui sont observées (données probantes).
5 / 31
Remarques
∙ H0 et H𝑎 sont toujours incompatibles (les événements des deux hypothèses
sont mutuellement exclusifs).
Trois formes de H0 et H𝑎 :
∙ H0 ∶ μ ≥ μ0 versus H𝑎 ∶ μ < μ0 , test unilatéral à gauche (inférieur) ;
∙ H0 ∶ μ ≤ μ0 versus H𝑎 ∶ μ > μ0 , test unilatéral à droite (supérieur) ;
∙ H0 ∶ μ = μ0 versus H𝑎 ∶ μ ≠ μ0 , test bilatéral.
6 / 31
Vous devez valider qu’une structure de béton a une résistance moyenne
supérieure à 80 MPa. Vous prélèverez 10 carottes à analyser.
1. Quelles sont vos hypothèses statistiques ?
2. Vous obtenez une moyenne échantillonnale de
𝑥 = 81, 6 MPa. Pouvez-vous conclure que votre hypothèse est vérifiée ?
7 / 31
Règle de décision
Issue d’un test : Rejeter ou non H0 .
Une règle de décision est formulée avant d’observer les données. Elle prend la
forme d’une région critique qui définit pour quels échantillons H0 sera rejetée.
Par exemple, pour
H0 ∶ μ ≤ 10 contre H𝑎 ∶ μ > 10.
on pourrait choisir de
rejeter H0 si 𝑥 > 11.
Comment choisir cette valeur critique ?
7 / 31
Deux erreurs possibles à l’issue d’un test d’hypothèses
Idéalement, on aimerait ne pas rejeter H0 quand elle est vraie et la rejeter quand
elle est fausse.
Réalité (inconnue !)
Décision H0 est vraie H0 est fausse
On rejette H0 Erreur de type I
On ne rejette pas H0 Erreur de type II
8 / 31
Deux erreurs possibles à l’issue d’un test d’hypothèses
Idéalement, on aimerait ne pas rejeter H0 quand elle est vraie et la rejeter quand
elle est fausse.
Réalité (inconnue !)
Décision H0 est vraie H0 est fausse
On rejette H0 Erreur de type I
On ne rejette pas H0 Erreur de type II
On aimerait contrôler les quantités suivantes :
α = P(erreur de type I) 1 − β = P(rejeter H0 |H0 fausse)
= P(rejeter H0 |H0 vraie) = P(rejeter H0 |H𝑎 vraie)
= seuil du test = puissance du test
β = P(erreur de type II)
= P(ne pas rejeter H0 |H0 fausse)
8 / 31
Quelques remarques
∙ L’erreur de type I est la plus grave, donc α est fixé par le chercheur à une
faible valeur (souvent α = 0, 05 ou 0, 01).
∙ Plus α est petit, plus β est grand...
on contrôlera souvent β avec la taille d’échantillon.
9 / 31
Exemple 1
Une usine affirme qu’elle ne pollue pas le lac avoisinant et que la concentration
moyenne de mercure dans le sol au fond du lac ne dépasse pas 0,1 ppm.
Un biologiste souhaite démontrer le contraire.
Il prévoit tirer 10 prélèvements du sol au fond du lac et en mesurer la concentration de
mercure. Il suppose que les concentrations sont i.i.d. N(μ, 0, 022 ). Les hypothèses sont :
H0 ∶
H𝑎 ∶
10 / 31
Exemple 1 (suite)
Quelle serait la règle de décision si le chercheur fixe α = 0, 05 ? Il faut trouver une
valeur critique / région critique, en supposant H0 vraie.
11 / 31
Exemple 1 (suite)
12 / 31
Retour sur l’exemple
∙ Dans cet exemple, 1, 645 est la valeur critique du test ;
∙ L’intervalle [1, 645; ∞[ est la zone de rejet ou région critique ;
∙ On rejettera H0 pour les valeurs de Z0 ≥ 1, 645 ;
∙ Sinon, on ne rejette pas H0 .
13 / 31
Tests d’hypothèses sur la moyenne d’une
distribution normale de variance connue
14 / 31
Cas 1 : Test sur μ, loi normale, σ2 connue
Supposons un échantillon aléatoire X1 , … , X𝑛 issu d’une population N(μ, σ2 ) où μ
est inconnue mais σ2 est connue.
Nous connaissons des résultats pour la loi de X.
15 / 31
Contre-hypothèses
H𝑎 bilatérale :
Si on veut tester H0 ∶ μ = μ0 vs H𝑎 ∶ μ ≠ μ0 alors on rejette H0 si 𝑥 est suffisamment loin
de μ0 .
Pour obtenir un test de seuil α, on rejette H0 si 𝑧0 > 𝑧α/2 ou 𝑧0 < −𝑧α/2 .
Ceci revient à rejeter si |𝑧0 | > 𝑧α/2
H𝑎 unilatérale à droite :
Si on veut tester H0 ∶ μ ≤ μ0 vs H𝑎 ∶ μ > μ0 alors on rejette H0 si 𝑥 est suffisamment plus
élevée que μ0 .
Pour obtenir un test de seuil α, on rejette H0 si 𝑧0 > 𝑧α .
H𝑎 unilatérale à gauche :
De même, si on veut tester H0 ∶ μ ≥ μ0 vs H𝑎 ∶ μ < μ0 alors on rejette H0 pour de faibles
valeurs de 𝑥, soit lorsque 𝑧0 < −𝑧α .
16 / 31
Exemple 2
Une compagnie affirme que le remboursement d’impôt moyen aux étudiants qui ont
utilisé son service est d’au moins 1100 $.
Un échantillon aléatoire de 20 étudiants ayant utilisé le service ont obtenu un
remboursement moyen de 1060 $.
En supposant une distribution normale d’écart-type 100 $ pour le remboursement d’un
étudiant, peut-on conclure que la compagnie fait de la fausse publicité, au seuil
α = 0, 05 ?
1. Hypothèses :
2. Règle de décision :
17 / 31
Exemple 2 (suite)
3. Calcul de la statistique observée :
4. Décision :
L’hypothèse nulle...
5. Conclusion : (dans les termes de l’étude)
Au seuil de 5%, le remboursement moyen ...
18 / 31
Tests d’hypothèses sur la moyenne d’une
distribution normale de variance inconnue
19 / 31
Cas 2 : Tests sur μ, loi normale, σ2 inconnue
Comment faire un test sur μ si la variance est inconnue ?
Le test basé sur Z0 est inapproprié puisque l’erreur de type I qui serait commise
serait supérieure à α.
Si la variance est inconnue, on utilise la statistique
X − μ0
T0 = √ .
S/ 𝑛
Sous H0 , on sait que T0 ∼ 𝑡𝑛−1 .
20 / 31
Règles de décision
Au seuil α, on rejette H0 ...
∙ Test bilatéral (H𝑎 ∶ μ ≠ μ0 ) :
◦ on rejette H0 si |𝑡0 | > 𝑡α/2,𝑛−1
∙ Test unilatéral à droite (H𝑎 ∶ μ > μ0 ) :
◦ on rejette H0 ∶ μ ≤ μ0 si 𝑡0 > 𝑡α,𝑛−1
∙ Test unilatéral à gauche (H𝑎 ∶ μ < μ0 ) :
◦ on rejette H0 ∶ μ ≥ μ0 si 𝑡0 < −𝑡α,𝑛−1 .
21 / 31
Exemple 4
Une fabrique achète régulièrement des transistors à un fournisseur. Les données
passées montrent que le coefficient d’amplification de ces transistors avait une
distribution normale de moyenne 155. On aimerait faire un test d’hypothèses
pour vérifier si celui-ci a changé.
Lors d’un nouveau contrôle sur 20 transistors, on observe un coefficient
d’amplification moyen de 152 et un écart-type de 10. Peut-on admettre, au seuil
de 1%, que le coefficient moyen a changé ?
1. Hypothèses :
2. Règle de décision :
22 / 31
Exemple 4 (suite)
3. Calcul de la statistique observée :
4. Décision :
L’hypothèse nulle...
5. Conclusion : (dans les termes de l’étude)
Au seuil de 1%, le coefficient d’amplification moyen ...
23 / 31
Tests d’hypothèses sur la moyenne d’une loi
inconnue et/ou variance inconnue
24 / 31
Cas 3 : Tests sur μ, 𝑛 grand
Si la loi théorique des observations en cause est inconnue, comment faire un test
sur la moyenne ?
Si 𝑛 est grand (au moins 30), le test présenté au cas 1 peut être utilisé en
remplaçant σ par l’écart-type échantillonnal S dans la définition de Z0 .
Les probabilités d’erreur de type I et II (α et β) seront alors approximatives (car la
loi normale est un modèle approximatif pour X lorsque 𝑛 est grand).
25 / 31
Résumé pour les tests sur μ
Cas Statistique Loi
X − μ0
X ∼ (μ, σ2 ), σ2 connue Z0 = √ Z0 ∼ (0, 1)
σ/ 𝑛
X − μ0
X ∼ (μ, σ2 ), σ2 inconnue T0 = √ T0 ∼ 𝑡𝑛−1
S/ 𝑛
X − μ0
X est de loi inconnue avec 𝑛 ≥ 30 Z0 = √ Z0 ∼ (0, 1)
S/ 𝑛
26 / 31
Tests d’hypothèses sur une proportion
27 / 31
Cas 4 : Tests sur 𝑝, loi de Bernoulli
On suppose que X1 , … , X𝑛 i.i.d. loi Bernoulli(𝑝), où 𝑝 inconnue et où 𝑛 ≥ 30.
Les hypothèses du test bilatéral seront :
H0 ∶ 𝑝 = 𝑝0
H𝑎 ∶ 𝑝 ≠ 𝑝0
Par le TCL, nous savons que sous H0 , 𝑝̂ ≈ (𝑝0 , 𝑝0 (1−𝑝
𝑛
0)
) et donc
𝑝̂ − 𝑝0
Z0 = √ ≈ (0, 1)
𝑝0 (1−𝑝0 )
𝑛
et nous rejetons H0 si |𝑧0 | > 𝑧α/2 .
Les tests unilatéraux se construisent de façon similaire.
28 / 31
Lien entre intervalles de confiance et tests
d’hypothèses bilatéraux
29 / 31
Intervalles de confiance et tests bilatéraux
Il existe une forte relation entre les intervalles de confiance et les tests bilatéraux.
L’examen des régions critiques des tests pour H0 ∶ μ = μ0 vs H𝑎 ∶ μ ≠ μ0 montre
que
On rejette H0 ∶ μ = μ0 L’intervalle de confiance pour μ
au seuil α ⇔ de niveau 1 − α
ne contient pas la valeur μ0 .
Ce résultat est valide pour 𝑝 aussi.
30 / 31
À la suite d’une étude, on a calculé un intervalle de confiance à 99% pour μ :
[2, 26; 3, 41].
Vrai, faux ou manque d’information ?
1. Au seuil de 1%, on rejette H0 ∶ μ = 3 pour H𝑎 ∶ μ ≠ 3.
2. Au seuil de 1%, on rejette H0 ∶ μ = 4 pour H𝑎 ∶ μ ≠ 4.
3. Au seuil de 5%, on rejette H0 ∶ μ = 3 pour H𝑎 ∶ μ ≠ 3.
4. Au seuil de 5%, on rejette H0 ∶ μ = 4 pour H𝑎 ∶ μ ≠ 4.
31 / 31
Bibliographie
Ce document est rédigé avec Beamer ainsi qu’une classe .cls fourni par Jérôme
Soucy. Les diapositives sont adaptées des diapositives créées par Thierry
Duchesne et Emmanuelle Reny-Nolin pour le cours STT-1900. Les graphiques
proviennent de ces mêmes diapositives.
Pour signaler une erreur dans ce document, veuillez écrire à
l’adresse : [Link]@[Link].
31 / 31