0% ont trouvé ce document utile (0 vote)
29 vues69 pages

Mathématique Échantillonnage

Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
29 vues69 pages

Mathématique Échantillonnage

Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Échantillonnage et Estimation

Théorème de Moivre-Laplace

2/18 ,
Théorème de Moivre-Laplace

Exemple
La prévalence de la dyslexie est de l’ordre de 5%. Dans un centre aéré de 120
enfants, on note S le nombre de dyslexiques. Quelle est la probabilité d’avoir
de 5 à 10 dyslexiques dans le groupe ?

2/18 ,
Théorème de Moivre-Laplace

Exemple
La prévalence de la dyslexie est de l’ordre de 5%. Dans un centre aéré de 120
enfants, on note S le nombre de dyslexiques. Quelle est la probabilité d’avoir
de 5 à 10 dyslexiques dans le groupe ?

2/18 ,
Théorème de Moivre-Laplace

Exemple
La prévalence de la dyslexie est de l’ordre de 5%. Dans un centre aéré de 120
enfants, on note S le nombre de dyslexiques. Quelle est la probabilité d’avoir
de 5 à 10 dyslexiques dans le groupe ?

On peut faire comme ceci :

S ∼ B (120; 0.05)
10
X
p(5 ≤ S ≤ 10) = p(S = i )
i =5
10
i
0.05i 0.95120−i
X
= C 120
i =5
= 0.1634 + . . . + 0.0402 = 0.6834

2/18 ,
Théorème de Moivre-Laplace

Exemple
La prévalence de la dyslexie est de l’ordre de 5%. Dans un centre aéré de 120
enfants, on note S le nombre de dyslexiques. Quelle est la probabilité d’avoir
de 5 à 10 dyslexiques dans le groupe ?

On peut faire comme ceci :

S ∼ B (120; 0.05)
10
X
p(5 ≤ S ≤ 10) = p(S = i )
i =5
10
i
0.05i 0.95120−i
X
= C 120
i =5
= 0.1634 + . . . + 0.0402 = 0.6834

Inconvéniants
→ Calculs pénibles
Théorème de Moivre-Laplace

Exemple
La prévalence de la dyslexie est de l’ordre de 5%. Dans un centre aéré de 120
enfants, on note S le nombre de dyslexiques. Quelle est la probabilité d’avoir
de 5 à 10 dyslexiques dans le groupe ?

On peut faire comme ceci :

S ∼ B (120; 0.05)
10
X
p(5 ≤ S ≤ 10) = p(S = i )
i =5
10
i
0.05i 0.95120−i
X
= C 120
i =5
= 0.1634 + . . . + 0.0402 = 0.6834

Inconvéniants
→ Calculs pénibles
→ Précision ?
2/18 ,
Approximation de la loi binomiale par la loi normale

3/18 ,
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.

3/18 ,
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
C’est encore plus le cas de la loi normale, car, dans certains cas, la loi
binomiale (discrète) peut être approchée par une loi normale
(continue).

3/18 ,
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
C’est encore plus le cas de la loi normale, car, dans certains cas, la loi
binomiale (discrète) peut être approchée par une loi normale
(continue).

Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))

3/18 ,
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
C’est encore plus le cas de la loi normale, car, dans certains cas, la loi
binomiale (discrète) peut être approchée par une loi normale
(continue).

Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))

Attention
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
C’est encore plus le cas de la loi normale, car, dans certains cas, la loi
binomiale (discrète) peut être approchée par une loi normale
(continue).

Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))

Attention
S ∼ B (n, p) alors S ne prend que des valeurs entières entre 0 et n
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
C’est encore plus le cas de la loi normale, car, dans certains cas, la loi
binomiale (discrète) peut être approchée par une loi normale
(continue).

Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))

Attention
S ∼ B (n, p) alors S ne prend que des valeurs entières entre 0 et n
¡ p ¢
X ∼ N np; np(1 − p) alors X ne prend presque jamais des valeurs
entières
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
C’est encore plus le cas de la loi normale, car, dans certains cas, la loi
binomiale (discrète) peut être approchée par une loi normale
(continue).

Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))

Attention
S ∼ B (n, p) alors S ne prend que des valeurs entières entre 0 et n
¡ p ¢
X ∼ N np; np(1 − p) alors X ne prend presque jamais des valeurs
entières
→ On va utiliser la correction de continuité

3/18 ,
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))

4/18 ,
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))

Règles de continuité
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))

Règles de continuité
p(S = k) ≈ p(k − 0.5 ≤ X ≤ k + 0.5)
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))

Règles de continuité
p(S = k) ≈ p(k − 0.5 ≤ X ≤ k + 0.5)
p(S ≤ k) ≈ p(X ≤ k + 0.5)
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))

Règles de continuité
p(S = k) ≈ p(k − 0.5 ≤ X ≤ k + 0.5)
p(S ≤ k) ≈ p(X ≤ k + 0.5)
p(S < k) ≈ p(X ≤ k − 0.5)

5/18 ,
Exemple d’approximation par une loi normale
La probabilité d’avoir de 5 à 10 dyslexiques dans le groupe de 120
enfants est environ 0.6834

6/18 ,
Exemple d’approximation par une loi normale
La probabilité d’avoir de 5 à 10 dyslexiques dans le groupe de 120
enfants est environ 0.6834

Comme S ∼ B (120; 0, 05) avec n = 120 ≥ 30, np = 6 > 5 et n(1 − p) = 114 > 5,
la binomiale peut être approchée par X ∼ N (6; 2.39)

6/18 ,
Exemple d’approximation par une loi normale
La probabilité d’avoir de 5 à 10 dyslexiques dans le groupe de 120
enfants est environ 0.6834

Comme S ∼ B (120; 0, 05) avec n = 120 ≥ 30, np = 6 > 5 et n(1 − p) = 114 > 5,
la binomiale peut être approchée par X ∼ N (6; 2.39)

p(5 ≤ S ≤ 10) ≈ p(4.5 ≤ X ≤ 10.5)


= p(−0.63 ≤ X ′ ≤ 1.88)
= p(X ′ ≤ 1.88) − (1 − p(X ′ ≤ 0.63))
≈ 0.7056

6/18 ,
Théorème de la limite centrée

7/18 ,
Théorème de la limite centrée

Exemple introductif
Si on relève la distri-
bution des salaires dans
1000 entreprises, il serait
surprenant que certaines
d’entre-elles présentent
une courbe gaussienne
(les salaires élevés étirent
la courbe vers la droite)
→ salaire médian
Par contre, si on trace la
courbe relative aux 1000
salaires moyens → gaus-
sienne

7/18 ,
Théorème de la limite centrée

• liste de 100000 nombres de


moyenne 2520
Exemple introductif • 1000 échantillons de 300
Si on relève la distri- nombres
bution des salaires dans • répartition des 1000 moyennes
1000 entreprises, il serait
surprenant que certaines
d’entre-elles présentent
une courbe gaussienne
(les salaires élevés étirent
la courbe vers la droite)
→ salaire médian
Par contre, si on trace la
courbe relative aux 1000
salaires moyens → gaus-
sienne

7/18 ,
Théorème de la limite centrée

• liste de 100000 nombres de


moyenne 2520
Exemple introductif • 1000 échantillons de 300
Si on relève la distri- nombres
bution des salaires dans • répartition des 1000 moyennes
1000 entreprises, il serait
surprenant que certaines
d’entre-elles présentent
une courbe gaussienne
(les salaires élevés étirent
la courbe vers la droite)
→ salaire médian
Par contre, si on trace la
courbe relative aux 1000
salaires moyens → gaus-
sienne

7/18 ,
Théorème de la limite centrée

8/18 ,
Théorème de la limite centrée

Propriété
Soit X 1 , X 2 , . . ., X n n variables aléatoires indépendantes ayant même
X1 + X2 + · · · + Xn
espérance m et même écart-type σ et soit X n = ,
n
alors :
Pour n suffisamment grand, X n suit approximativement la loi nor-
σ
µ ¶
male N m, p
n

8/18 ,
Théorème de la limite centrée

Propriété
Soit X 1 , X 2 , . . ., X n n variables aléatoires indépendantes ayant même
X1 + X2 + · · · + Xn
espérance m et même écart-type σ et soit X n = ,
n
alors :
Pour n suffisamment grand, X n suit approximativement la loi nor-
σ
µ ¶
male N m, p
n

Remarque
Dans la plupart des cas, on considère que n est « suffisamment grand »
lorsque n atteint quelques dizaines, par exemple lorsque n ≥ 30, mais
cela dépend de la nature, de la population et du contexte de l’étude

8/18 ,
Échantillonnage et Estimation

9/18 ,
Échantillonnage et Estimation

Vocabulaire utilisé
Échantillonnage et Estimation

Vocabulaire utilisé
population : totalité des unités de n’importe quel genre prises en
considération par le statisticien. Elle peut être finie ou infinie
Échantillonnage et Estimation

Vocabulaire utilisé
population : totalité des unités de n’importe quel genre prises en
considération par le statisticien. Elle peut être finie ou infinie
échantillon est un sous-ensemble de la population étudiée, dé-
crit à l’aide de mesures (nombre d’unités, la moyenne, l’écart-
type, pourcentage)
Échantillonnage et Estimation

Vocabulaire utilisé
population : totalité des unités de n’importe quel genre prises en
considération par le statisticien. Elle peut être finie ou infinie
échantillon est un sous-ensemble de la population étudiée, dé-
crit à l’aide de mesures (nombre d’unités, la moyenne, l’écart-
type, pourcentage)
paramètres : caractéristiques de la population
Échantillonnage et Estimation

Vocabulaire utilisé
population : totalité des unités de n’importe quel genre prises en
considération par le statisticien. Elle peut être finie ou infinie
échantillon est un sous-ensemble de la population étudiée, dé-
crit à l’aide de mesures (nombre d’unités, la moyenne, l’écart-
type, pourcentage)
paramètres : caractéristiques de la population
statistiques : mesures utilisées pour décrire un échantillon

9/18 ,
Fluctuation d’échantillonnage

10/18 ,
Fluctuation d’échantillonnage

Lorsque l’on étudie un caractère sur plusieurs échantillons de même taille


d’une même population, on peut observer que les résultats ne sont pas
identiques selon les échantillons → Fluctuation d’échantillonnage

10/18 ,
Fluctuation d’échantillonnage

Lorsque l’on étudie un caractère sur plusieurs échantillons de même taille


d’une même population, on peut observer que les résultats ne sont pas
identiques selon les échantillons → Fluctuation d’échantillonnage

10/18 ,
Propriété
F n : variable aléatoire qui, à tout échantillon de taille n associe la
fréquence d’apparition du caractère dans cet échantillon
Intervalle de fluctuation au seuil de 1 − α :
" p p #
p(1 − p) p(1 − p)
p − uα p ; p + uα p
n n

seuil 10% 5% 1%
uα 1.64 1.96 2.58

11/18 ,
Exemple
Dans un slogan publicitaire, une banque affirme que 75% des de-
mandes de prêts immobiliers sont acceptées.
Soit F la variable aléatoire qui, à tout échantillon de 1000 demandes
choisies au hasard et de façon indépendante, associe la fréquence de
demandes de prêts immobiliers acceptées.
Donner un intervalle de fluctuation asymptotique au seuil 95% de F

12/18 ,
Exemple
Dans un slogan publicitaire, une banque affirme que 75% des de-
mandes de prêts immobiliers sont acceptées.
Soit F la variable aléatoire qui, à tout échantillon de 1000 demandes
choisies au hasard et de façon indépendante, associe la fréquence de
demandes de prêts immobiliers acceptées.
Donner un intervalle de fluctuation asymptotique au seuil 95% de F

p = 0.75 et n = 1000
h n ≥ 30, npp= 750 ≥ 5 et n(1 − p)p= 250 ≥ 5i
donc
I = 0.75 − 1.96 0.75×0.25
p ; 0.75 + 1.96 0.75×0.25
p
1000 1000

12/18 ,
Estimation

• Estimation → problème inverse de l’échantillonnage

13/18 ,
Estimation

• Estimation → problème inverse de l’échantillonnage


• Comment utiliser les résultats obtenus sur un échantillon pour
obtenir des estimations des paramètres de la population ?

13/18 ,
Estimation

• Estimation → problème inverse de l’échantillonnage


• Comment utiliser les résultats obtenus sur un échantillon pour
obtenir des estimations des paramètres de la population ?
• On peut utiliser des estimations ponctuelles

13/18 ,
Estimation

• Estimation → problème inverse de l’échantillonnage


• Comment utiliser les résultats obtenus sur un échantillon pour
obtenir des estimations des paramètres de la population ?
• On peut utiliser des estimations ponctuelles
• Une autre idée est de chercher un intervalle dans lequel on est sûr, à
une certaine probabilité près, que le paramètre estimé se situe.

13/18 ,
Estimation

• Estimation → problème inverse de l’échantillonnage


• Comment utiliser les résultats obtenus sur un échantillon pour
obtenir des estimations des paramètres de la population ?
• On peut utiliser des estimations ponctuelles
• Une autre idée est de chercher un intervalle dans lequel on est sûr, à
une certaine probabilité près, que le paramètre estimé se situe.
• Intervalle de confiance

13/18 ,
Estimations ponctuelles

14/18 ,
Estimations ponctuelles

Propriétés
L’estimation ponctuelle de la moyenne m de la population est donnée par la
moyenne observée x dans l’échantillon

m = x = me
Estimations ponctuelles

Propriétés
L’estimation ponctuelle de la moyenne m de la population est donnée par la
moyenne observée x dans l’échantillon

m = x = me

L’estimation ponctuelle de l’écart-type σ de la population est donnée par l’écart-


type corrigé dans l’échantillon
r
n
σ = σe ×
n −1
Estimations ponctuelles

Propriétés
L’estimation ponctuelle de la moyenne m de la population est donnée par la
moyenne observée x dans l’échantillon

m = x = me

L’estimation ponctuelle de l’écart-type σ de la population est donnée par l’écart-


type corrigé dans l’échantillon
r
n
σ = σe ×
n −1

L’estimation ponctuelle de la fréquence f de la population est donnée par la


fréquence observée f e dans l’échantillon

m = fe

14/18 ,
Estimations ponctuelles

Propriétés
L’estimation ponctuelle de la moyenne m de la population est donnée par la
moyenne observée x dans l’échantillon

m = x = me

L’estimation ponctuelle de l’écart-type σ de la population est donnée par l’écart-


type corrigé dans l’échantillon
r
n
σ = σe ×
n −1

L’estimation ponctuelle de la fréquence f de la population est donnée par la


fréquence observée f e dans l’échantillon

m = fe

Remarque
Que doit-on penser d’une estimation de la moyenne des notes d’un groupe
d’étudiants par la moyenne des 5 meilleurs d’entre-eux ?
14/18 ,
Estimation de la moyenne par une intervalle de confiance
σ connu

15/18 ,
Estimation de la moyenne par une intervalle de confiance
σ connu
On sait que X ∼ N m, pσ où m et σ sont la moyenne et l’écart-type dans la
³ ´
n
population

15/18 ,
Estimation de la moyenne par une intervalle de confiance
σ connu
On sait que X ∼ N m, pσ où m et σ sont la moyenne et l’écart-type dans la
³ ´
n
population
Intervalle de la population dans lequel se trouve la moyenne avec 95% de chance ?

15/18 ,
Estimation de la moyenne par une intervalle de confiance
σ connu
On sait que X ∼ N m, pσ où m et σ sont la moyenne et l’écart-type dans la
³ ´
n
population
Intervalle de la population dans lequel se trouve la moyenne avec 95% de chance ?

 
X −m
p (−1.96 ≤ Y ≤ 1.96) = p −1.96 ≤ ≤ 1.96

n
σ σ
µ ¶
= p −1.96 p ≤ X − m ≤ 1.96 p
n n
σ σ
µ ¶
= p X − 1.96 p ≤ m ≤ X + 1.96 p
n n
= 0.95

15/18 ,
Estimation de la moyenne par une intervalle de confiance
σ connu
On sait que X ∼ N m, pσ où m et σ sont la moyenne et l’écart-type dans la
³ ´
n
population
Intervalle de la population dans lequel se trouve la moyenne avec 95% de chance ?

 
X −m
p (−1.96 ≤ Y ≤ 1.96) = p −1.96 ≤ ≤ 1.96

n
σ σ
µ ¶
= p −1.96 p ≤ X − m ≤ 1.96 p
n n
σ σ
µ ¶
= p X − 1.96 p ≤ m ≤ X + 1.96 p
n n
= 0.95

On connait X , σ et n, donc on connait l’intervalle

15/18 ,
Estimation de la moyenne par une intervalle de confiance
σ connu
On sait que X ∼ N m, pσ où m et σ sont la moyenne et l’écart-type dans la
³ ´
n
population
Intervalle de la population dans lequel se trouve la moyenne avec 95% de chance ?

 
X −m
p (−1.96 ≤ Y ≤ 1.96) = p −1.96 ≤ ≤ 1.96

n
σ σ
µ ¶
= p −1.96 p ≤ X − m ≤ 1.96 p
n n
σ σ
µ ¶
= p X − 1.96 p ≤ m ≤ X + 1.96 p
n n
= 0.95

On connait X , σ et n, donc on connait l’intervalle

Exemple
Une machine fabrique des rondelles de diamètre moyen inconnu avec σ = 2mm. On
veut estimer la moyenne de la production par un intervalle de confiance au seuil de
risque de 5%. Pour cela, on
h prélève un échantillon de i100 rondelles dont le diamètre
2 2
moyen est 19.3 mm. IC = 19.3 − 1.96 10 ; 19.3 + 1.96 10 = [18.908; 19.692]

15/18 ,
Estimation de la moyenne par une intervalle de confiance

σ inconnu

16/18 ,
Estimation de la moyenne par une intervalle de confiance

σ inconnu
On fait la même chose en remplaçant l’écart-type de la population
par son estimation à partir de l’échantillon

16/18 ,
Estimation de la moyenne par une intervalle de confiance

σ inconnu
On fait la même chose en remplaçant l’écart-type de la population
par son estimation à partir de l’échantillon
q
n
L’estimation de σ est σe × n−1

16/18 ,
Estimation de la moyenne par une intervalle de confiance

σ inconnu
On fait la même chose en remplaçant l’écart-type de la population
par son estimation à partir de l’échantillon
q
n
L’estimation de σ est σe × n−1
σ σ
h i
IC = X − 1.96 p e ≤ m ≤ X + 1.96 p e
n−1 n−1

16/18 ,
Estimation de la moyenne par une intervalle de confiance

σ inconnu
On fait la même chose en remplaçant l’écart-type de la population
par son estimation à partir de l’échantillon
q
n
L’estimation de σ est σe × n−1
σ σ
h i
IC = X − 1.96 p e ≤ m ≤ X + 1.96 p e
n−1 n−1

Exemple
Une machine fabrique des rondelles de diamètre moyen et d’écart-type inconnus. On
veut estimer la moyenne de la production par un intervalle de confiance au seuil de
risque de 5%. Pour cela, on prélève un échantillon de 100 rondelles dont le diamètre
moyenh est 19.3 mm. L’écart-type mesuré
i sur l’échantillon est 1.98 mm.
1.98 1.98
IC = 19.3 − 1.96 p ; 19.3 + 1.96 p = [18.91; 19.69]
99 99

16/18 ,
Estimation d’une proportion par une intervalle de confiance

17/18 ,
Estimation d’une proportion par une intervalle de confiance

Le raisonnement est identique

17/18 ,
Estimation d’une proportion par une intervalle de confiance

Le raisonnement est identique


µ p ¶
f e (1− f e )
fréquence moyenne des échantillons F ∼ N f e ; p
n

17/18 ,
Estimation d’une proportion par une intervalle de confiance

Le raisonnement est identique


µ p ¶
f e (1− f e )
fréquence moyenne des échantillons F ∼ N f e ; p
n
· p p ¸
f e (1− f e ) f e (1− f e )
IC = f e − 1.96 p ; f e + 1.96 p
n−1 n−1

17/18 ,
Estimation d’une proportion par une intervalle de confiance

Le raisonnement est identique


µ p ¶
f e (1− f e )
fréquence moyenne des échantillons F ∼ N f e ; p
n
· p p ¸
f e (1− f e ) f e (1− f e )
IC = f e − 1.96 p ; f e + 1.96 p
n−1 n−1

Exemple
On dispose d’une urne contenant un très grand nombre de boules rouges et bleues.
On veut estimer le nombre de boules rouges par un intervalle de confiance au seuil de
risque de 5%. Pour cela, on prélève un échantillon de 100 boules dans lequel 59 sont
rouges.
· ¸
q q
IC = 0.59 − 1.96 0.59∗0.41
99 ; 0.59 + 1.96 0.59∗0.41
99 = [0.4931; 0.6869]

17/18 ,
Param. de la Valeur Estim. ponct. Estim. par IC
pop. totale param. pour la au niveau de conf. 2Π(t ) − 1
à estimer échant. pop. totale · pour la pop. totale ¸
σ σ
Moyenne me m = me me − t p ; me + t p
n n
σe σe
r
n
· ¸
Écart-type σe σ = σe me − t p ; me + t p
n −1 n −1 n −1
" r r #
f e (1 − f e ) f e (1 − f e )
Fréquence fe f = fe fe − t ; fe + t
n −1 n −1

18/18 ,

Vous aimerez peut-être aussi