0% ont trouvé ce document utile (0 vote)
306 vues6 pages

Estimation en Probabilité et Statistique

Transféré par

dakir
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
306 vues6 pages

Estimation en Probabilité et Statistique

Transféré par

dakir
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Introduction

Cours: Probabilité et Statistique


Chapitre 6 L’objectif de cette partie est de répondre à la problématique suivante : comment,
à partir d’informations (couple moyenne/écart-type ou proportion) calculées sur
Estimation un échantillon, retrouver ou plutôt estimer celles d’une population entière ?
L’estimation est le problème réciproque de l’échantillonnage.
Nous distinguerons deux cas : celui où l’on cherche à estimer la moyenne µ d’une
BAIZ Othmane variable aléatoire définie sur une population et celui où l’on cherche à estimer la
proportion d’individus p ayant tel caractère dans la population.
F. P. de Ouarzazate

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 1 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 2 / 22

Estimation d’une moyenne

1. Estimation d’une moyenne


1.1. Estimation ponctuelle
Contexte : on considère une variable aléatoire X sur une population de moyenne
(ou espérance) µ inconnue et d’écart-type σ inconnu (ou connu). On suppose que
l’on a prélevé un échantillon de taille n (tirage avec remise ou assimilé) sur lequel
on a calculé la moyenne µe et l’écart-type σe .

q
n
Le coefficient n−1 s’appelle correction de biais. Lorsque n est assez grand (en
pratique n ≥ 30), ce coefficient est très voisin de 1, si bien que, dans ce cas, on
peut estimer σe ≈ σ.

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 3 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 4 / 22
Exemple Estimation par intervalle de confiance

1.2. Estimation par intervalle de confiance


Le contexte est le même que le précédent, sauf que nous allons raisonner en deux
temps, une phase a priori (ou prévisionnelle) dans lequelle on suppose que
Une université comporte 1500 étudiants. On mesure la taille de 20 d’entre eux. La l’échantillon n’est pas encore prélevé et une phase a posteriori dans laquelle on
moyenne µe et l’écart-type σe calculés à partir de cet échantillon sont : suppose connue la moyenne µe et l’écart-type σe de l’échantillon et donc la
moyenne estimée µ̂ et l’écart-type estimé σ̂ de la population.
µe = 176 cm, σe = 6 cm
PHASE A PRIORI - Mise en place du modèle prévisionnel -
Nous pouvons donc estimer les paramètres de la population :
r Nous avons vu, dans la théorie sur l’échantillonnage, que si X est la variable
20 aléatoire correspondant à la moyenne d’un échantillon de taille n pris au hasard,
µ̂ = µe = 176 cm, σ̂ = × 6 cm = 6.16 cm
19 alors le Théorème Central Limite permet d’affirmer que X suit approximativement
une loi normale :
σ 
X ,→ N µ; √
n
Nous allons chercher un intervalle qui contient µ avec une confiance arbitraire de
95% (cela pourrait aussi être 99% ou un autre coefficient de confiance).

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 5 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 6 / 22

Nous cherchons donc un rayon r tel que :


p(X − r ≤ µ ≤ X + r ) = 0.95.
Nous sommes ainsi ramenés à calculer :
p(µ − r ≤ X ≤ µ + r ) = 0.95. PHASE A POSTERIORI - Utilisation des valeurs estimées ponctuellement
On sait que la variable aléatoire T = X −µ
σ suit la loi normale centrée-réduite -

n
N(0; 1). Nous obtenons donc, par centrage et réduction : Nous supposons maintenant que l’échantillon a été tiré, nous obtenons donc une
représentation µe de la variable
h aléatoire X . Nous pouvons affirmer que l’intervalle
µ−r −µ X −µ µ+r −µ i
p(µ − r ≤ X ≤ µ + r ) = p( σ

≤ σ

≤ σ

) obtenu pour cet échantillon : µe − t √σn ; µe + t √σn fait partie d’une famille dans
n n n
laquelle 95% contiennent la vraie moyenne µ de la population. On l’appelle
−r r
= p( σ ≤T ≤ σ ) intervalle de confiance à 95% (ou autre selon le coefficient de confiance décidé
√ √
n n préalablement).
r
= 2F( σ ) − 1.

n

r r
donc 2 F ( σ ) − 1 = 0.95 ⇒ F( σ ) = F (t) = 0.9754
√ √
n n

par lecture inverse de la table de la loi normale centrée réduite une borne
t = 1, 96. Et le rayon r de l’intervalle cherché est :r = t √σn .
Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 7 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 8 / 22
Exemple
Pour calculer les bornes de cet intervalle, deux cas de figure se présentent selon
que nous connaissons ou pas l’écart-type σ de la population. S’il est connu, il n’y
a rien à faire :  
σ σ Une université comporte 1500 étudiants. On mesure la taille de 20 d’entre eux. La
IC = µe − t √ ; µe + t √
n n moyenne µe et l’écart-type σe calculés à partir de cet échantillon sont :
Si l’écart-type σ de la population n’est pas connu, on le remplace par son
q
n µe = 176 cm σe = 6 cm
estimation ponctuelle σ̂ = n−1 σe .
Dans ce cas, Nous pouvons donc estimer avec une confiance de 95% (ou 99% Nous avons déjà estimé ponctuellement les paramètres de la population :
selon le cas) que la moyenne µ de la population appartient à l’intervalle : r
20

σe σe
 µ̂ = 176 cm σ̂ = × 6 cm = 6, 16 cm.
IC = µe − t √ ; µe + t √ 19
n−1 n−1
Déterminons maintenant une estimation de µ par intervalle de confiance à 95%
Remarque : On ne retiendra pas cette formule. Dans la pratique, on refait les (ou au risque de 5%).
calculs.

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 9 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 10 / 22

Solution de l’exemple Solution de l’exemple

Notons X la variable aléatoire correspondant à la moyenne d’un échantillon de


taille 20 pris au hasard. Nous savons que : √ ! √
20 20
σ donc F r = 0.975 ⇒ r = 1.96
X ,→ N(µ; √ ). σ σ
n
Ainsi, notre réel r recherché est tel que r = 1.96 √σ20 .
On calcule un rayon r tel que :
Mais une fois l’échantillon tiré, nous avons obtenu un écart-type estimé
p(µ − r ≤ X ≤ µ + r ) = 0.95 σ̂ = 6, 16 cm. D’où r = 2, 7. La réalisation de l’intervalle de confiance à 95% sur
cet échantillon est :
X −µ
On pose T = σ

, ainsi T suit la loi normale centrée-réduite N(0; 1). Nous avons
n
donc : IC = [176 − 2.7; 176 + 2.7] = [173, 3; 178.7] .
√ √ √ !
20 20 20 Nous pouvons donc estimer, avec une confiance de 95 % que la taille moyenne de
p(−r ≤T ≤r ) = 0.95 ⇒ 2F r − 1 = 0.95 la population est comprise entre 173, 3 cm et 178, 7 cm.
σ σ σ

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 11 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 12 / 22
Estimation d’une proportion

2. Estimation d’une proportion


2.1. Estimation ponctuelle
Contexte : on considère un caractère (ou attribut) A sur une population dont la
proportion p est inconnue. On suppose que l’on a prélevé un échantillon de taille n
(tirage avec remise ou assimilé) sur lequel on a calculé la proportion pe d’individus
ayant le caractère A.
Notons F la variable aléatoire correspondant à la proportion du caractère A dans
un échantillon de taille n pris au hasard. On rappelle qu’alors F suit
approximativement une loi normale :
r
p(1 − p)
F ,→ N(p, σp ) où σp =
n

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 13 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 14 / 22

Exemple
2.2. Estimation par intervalle de confiance
Le contexte est le même que le précédent. Nous avons vu, dans la théorie sur
Exemple : À quelques jours d’une élection, un candidat fait effectuer un sondage. l’échantillonnage, que si F est la variable aléatoire correspondant à la proportion
Sur les 150 personnes interrogées, 45 se disent prêtes à voter pour lui aux d’un caractère dans un échantillon de taille n pris au hasard, alors F suit
prochaines élections. approximativement une loi normale :
Solution : La proportion d’individus prête à voter pour ce candidat dans r
45 p(1 − p)
l’échantillon est ici de : pe = 150 = 0, 3. F ,→ N(p, σp ) où σp =
n
On estime donc qu’il en est de même dans la population (comment pourrait-on
faire autrement ?) : Nous avons déjà remarqué que le fait que p soit inconnu n’est pas gênant dans les
p̂ = pe = 0, 3. calculs a priori. Le problème ici, c’est que nous ne connaissons pas l’écart-type
q
p(1−p)
Quand à l’indication σp , on peut ici l’estimer par : n .Nous le remplaçerons, dans la phase a posteriori, par son estimation
q q
r r ponctuelle (qui est pe (1−p
n−1
e)
en général ou p(1−p)
n si la correction de biais n’est
pe (1 − pe ) 1, 3 × 0, 7
σ̂ = = = 0, 037.
q
1
n 150 pas proposée ou encore 4n si nous voulons une hypothèse pessimiste).

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 15 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 16 / 22
Supposons maintenant l’échantillon prélevé. Nous avons donc une estimation
Cherchons un intervalle qui contient p avec une confiance arbitraire de 90% (cela pontuelle de p et σp . Ainsi, la réalisation de l’intervalle de confiance dans
pourrait être un autre coefficient de confiance). Nous cherchons donc un rayon r l’échantillon est :
tel que :
P(F − r ≤ p ≤ F + r ) = 0, 90.  Si on n’effectue la correction de biais, l’intervalle de confiance est :
" r r #
Alors pe (1 − pe ) pe (1 − pe )
P(p − r ≤ F ≤ p + r ) = 0, 90. IC = pe − t , pe + t .
n−1 n−1
F −P
On sait que la variable aléatoire T = σp suit la loi normale centrée réduite
 Si on n’effectue pas la correction de biais, l’intervalle de confiance
N(0; 1).
est : " r r #
Nous obtenons donc, par centrage et réduction : pe (1 − pe ) pe (1 − pe )
IC = pe − t , pe + t
n n
−r r r
P( ≤T ≤ ) = 0, 90 ⇒ 2 Floi centré reduite ( ) − 1 = 0, 90
σp σp σp  On peut également se placer dans une hypothèse pessimiste, dans
ce cas, la réalisation de l’intervalle de confiance dans l’échantillon
Donc Floi centré reduite (t) = Floi centré reduite ( σrp ) = 0, 95. Par lecture inverse de la est : " r r #
table de la loi normale centrée réduite N(0; 1) : t = 1, 645. 1 1
Ce qui nous permet de calculer r : r = t σp . IC = pe − t , pe + t
4n 4n

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 17 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 18 / 22

Exemple Solution de l’exemple


Notons F la variable aléatoire correspondant à la proportion d’individus prêts à
voter pour ce candidat dans un échantillon de taille 150 pris au hasard. Nous
avons vu qu’approximativement :
r
p(1 − p)
A quelques jours d’une élection, un candidat fait faire un sondage. Sur les 150 F ,→ N(p, σp ) où σp = .
n
personnes interrogées, 45 se disent prêtes à voter pour lui aux prochaines élections.
On cherche un rayon r tel que :
La proportion d’individus prête à voter pour ce candidat dans l’échantillon est ici
45
de pe = 150 = 0, 3. P(p − r ≤ F ≤ p + r ) = 0, 8
On a déjà estimé ponctuellement : p̂ = pe = 0, 3 et σp = 0, 037.
on refait les mêmes étapes pour trouver :
Déterminons maintenant une estimation de p par intervalle de confiance à 80%.
r r
2 2 Floi centré reduite ( ) − 1 = 0, 8 ⇒ Floi centré reduite ( ) = 0, 9.
σp σp

Par lecture inverse de la table de la loi normale centrée-réduite, on trouve :


r
= 1, 28.
σp

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 19 / 22 Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 20 / 22
Supposons maintenant l’échantillon prélevé. Une estimation ponctuelle de σp est
σ̂p = 0, 037.

D’ou r = 0, 047.
La réalisation de l’intervalle de confiance dans cet échantillon est alors

IC = [0, 3 − 0, 047; 0, 3 + 0, 047] = [0, 253; 0, 347]

Nous pouvons estimer, avec une confiance de 80%, que la proportion d’individus
dans la population prêts à voter pour le candidat en question est comprise entre
25, 3% et 34, 7%.

Othmane Baiz (F. P. O) Cours: Probabilité et Statistique[2mm] Chapitre 6[1mm] Estimation 21 / 22

Vous aimerez peut-être aussi