100% ont trouvé ce document utile (2 votes)
550 vues3 pages

Test D Hypothese

Transféré par

Cheikh Talla
Copyright
© Attribution Non-Commercial (BY-NC)
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
100% ont trouvé ce document utile (2 votes)
550 vues3 pages

Test D Hypothese

Transféré par

Cheikh Talla
Copyright
© Attribution Non-Commercial (BY-NC)
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

1

Intervalle de confiance & Test d’Hypothèse


Pablo CROTTI, Université de Fribourg, SP 2010

Rappel de Probabilité
Soient Xi des variables aléatoires i.i.d (indépendantes, identiquement distribuées) avec
les propriétés suivantes :
– E(Xi ) = µ , ∀i
– V ar(Xi ) = σ 2 , ∀i
On définit une nouvelle variable aléatoire
n
X
Sn = Xi .
i=1

Lorsque n est suffisamment grand (i.e, n > 30), on a

Sn ∼ N (E(Sn ), V ar(Sn )).

Avec
Pn Pn
– E(Sn ) = E( i=1 Xi ) = i=1 E(Xi ) = nE(X1 ) = nµ
Pn Xi i.i.d Pn 2
– V ar(Sn ) = V ar( i=1 X i ) = i=1 V ar(Xi ) = nV ar(X1 ) = nσ

Nous centrons et réduisons notre variable Sn de sorte à avoir une nouvelle variable
aléatoire Z qui suit une loi normale N (0, 1).
Sn − E(Sn ) Sn − nµ
Z= p = √ ∼ N (0, 1) (0.0.1)
V ar(Sn ) σ n

Intervalle de confiance
Lorsque nous devons traiter un problème réel de manière mathématique, nous sommes
souvent amenés à devoir créer un modèle mathématique contenant des variables
aléatoires pour lesquelles nous ne connaissons pas toutes les informations (paramètres).
Pour estimer ces paramètres, nous créons des intervalles de confiance garantissant que le
paramètre cherché se trouve effectivement dans l’intervalle.
En utilisant l’équation (0.0.1), on sait que la variable aléatoire Z suit une loi normale
centrée réduite.
Le but est de trouver un intervalle de confiance de niveau α pour lequel, la variable
aléatoire Z est à (1 − α)% sûre d’être dedans. Mathématiquement cela revient à
chercher un z tel que
P (−z ≤ Z ≤ z) = 1 − α . (0.0.2)
Une simple utilisation de la fonction de répartition de la loi normale nous donne que
α
2Φ(z) − 1 = 1 − α ⇐⇒ z = Φ−1 (1 − ).
2
2

Sur la Figure ci dessus, la variable aléatoire Z a (1 − α)% de chance de se trouver dans


l’intervalle [−z, z] (en rouge sur la figure).
En effet, si l’aire de la zone A est égale à l’aire de la zone C qui est égale à α2 , sachant
que l’aire totale sous la courbe vaut 1, on a que l’aire de la zone B vaut
α α
1 − − = 1 − α.
2 2

On modifie l’équation (0.0.2) pour isoler les paramètres Sn ou µ.


Rappelez-vous :
Sn − nµ
P (−z ≤ Z ≤ z) = 1 − α ⇐⇒ P (−z ≤ √ ≤ z) = 1 − α.
σ n
On détermine un intervalle de confiance pour Sn de niveau α : IC1−α (Sn ), en modifiant
l’évènement suivant :
√ √
{−z ≤ Sσn√
−nµ
≤ z} = {−zσ n ≤ S n − nµ ≤ zσ n}
n √ √
= {−zσ n + nµ ≤ Sn ≤ zσ n + nµ}
En appliquant la probabilité des deux côtés de l’égalité, on obtient
Sn − nµ √ √
1 − α = P (−z ≤ √ ≤ z) = P (−zσ n + nµ ≤ Sn ≤ zσ n + nµ)
σ n
L’intervalle de confiance est définit en prenant les deux valeurs bornant Sn , i.e,

√ √ α
IC1−α (Sn ) = [−zσ n + nµ , zσ n + nµ] , z = Φ−1 (1 − ) (0.0.3)
2
On effectue le même type de transformation pour déterminer un intervalle de confiance
pour µ et on a
√ √
n Sn n Sn α
IC1−α (µ) = [−zσ + , zσ + ] , z = Φ−1 (1 − ) (0.0.4)
n n n n 2
Dans le cas où σ n’est pas connu, nous devons utiliser une approximation différente
ainsi que la loi de Student. Ceci fera l’objet d’un autre rappel.
3

Test d’Hypothèse
Lorsque l’on modélise une expérience, nous devons faire des hypothèses sur la possibilité
ou non qu’un des paramètres aient une valeur ou une autre.
Le test se base sur le principe des hypothèses. L’hypothèse nulle H0 et la contre
hypothèse H1 (aussi notée K). L’hypothèse nulle est, dans la plupart des cas, utilisée en
première car c’est celle qui nous donne le plus d’informations sur le modèle que nous
traitons.
Exemple. On jette une pièce de monnaie 64 fois. On cherche à savoir si la pièce est
équilibrée.
Nous devons d’abord créer les variables aléatoires suivantes :
 64
1, si le jet i est pile, probabilité de sortie : p X
Xi = , S64 = Xi
0, si le jet i est face, probabilité de sortie : 1 − p
i=1

La variable S64 nous donne le nombre de fois que l’on a obtenu pile parmi les 64 jets.
On a
– µ = E(Xi ) = 1p + 0(1 − p) = p , ∀i
– σ 2 = V ar(Xi ) = E(Xi2 ) − E(Xi )2 = [12 p + 02 (1 − p)] − p2 = p(1 − p) , ∀i
On fait maintenant les hypothèses suivantes :
1 1
H0 : la pièce est équilibrée, i.e, p = , H1 : la pièce n’est pas équilibrée, i.e, p 6= .
2 2
Nous allons travailler avec l’hypothèse H0 car c’est la seule où nous connaissons la
valeur du paramètre p. Nous avons alors :
– µ = E(Xi ) = 21
– σ 2 = V ar(Xi ) = 41 ⇒ σ = 12
En utilisant la formule (0.0.3) on crée un intervalle de confiance de niveau α = 5%.
Pour résumé,
α z µ σ n
0.05 1 1
0.05 Φ−1 (1 − 2
) = 1.96 2 2
64
donc
1√ 1 1√ 1
IC95% (Sn ) = [−1.96 64 + 64 , 1.96 64 + 64 ] ≈ [24, 40].
2 2 2 2
On peut donc dire :
L’hypothèse H0 est acceptée si S64 se trouve dans l’intervalle que nous venons de calculer.

Nous ne connaissons pas la valeur de S64 . Nous savons que la pièce a été jetée 64
fois mais ceci ne nous donne pas le nombre de fois que le "pile" est apparu.
Bien que S64 suive une loi Binomiale(64, p) nous n’utilisons pas sa densité ici.
L’exercice ne fait que donner un intervalle de confiance à 95% qui nous informe en
fonction du résultat réel de S64 , (i.e, après avoir réellement jeté la pièce) si celle-ci est
symétrique ou non.

Vous aimerez peut-être aussi