Mathématique Échantillonnage
Mathématique Échantillonnage
Théorème de Moivre-Laplace
2/18 ,
Théorème de Moivre-Laplace
Exemple
La prévalence de la dyslexie est de l’ordre de 5%. Dans un centre aéré de 120
enfants, on note S le nombre de dyslexiques. Quelle est la probabilité d’avoir
de 5 à 10 dyslexiques dans le groupe ?
2/18 ,
Théorème de Moivre-Laplace
Exemple
La prévalence de la dyslexie est de l’ordre de 5%. Dans un centre aéré de 120
enfants, on note S le nombre de dyslexiques. Quelle est la probabilité d’avoir
de 5 à 10 dyslexiques dans le groupe ?
2/18 ,
Théorème de Moivre-Laplace
Exemple
La prévalence de la dyslexie est de l’ordre de 5%. Dans un centre aéré de 120
enfants, on note S le nombre de dyslexiques. Quelle est la probabilité d’avoir
de 5 à 10 dyslexiques dans le groupe ?
S ∼ B (120; 0.05)
10
X
p(5 ≤ S ≤ 10) = p(S = i )
i =5
10
i
0.05i 0.95120−i
X
= C 120
i =5
= 0.1634 + . . . + 0.0402 = 0.6834
2/18 ,
Théorème de Moivre-Laplace
Exemple
La prévalence de la dyslexie est de l’ordre de 5%. Dans un centre aéré de 120
enfants, on note S le nombre de dyslexiques. Quelle est la probabilité d’avoir
de 5 à 10 dyslexiques dans le groupe ?
S ∼ B (120; 0.05)
10
X
p(5 ≤ S ≤ 10) = p(S = i )
i =5
10
i
0.05i 0.95120−i
X
= C 120
i =5
= 0.1634 + . . . + 0.0402 = 0.6834
Inconvéniants
→ Calculs pénibles
Théorème de Moivre-Laplace
Exemple
La prévalence de la dyslexie est de l’ordre de 5%. Dans un centre aéré de 120
enfants, on note S le nombre de dyslexiques. Quelle est la probabilité d’avoir
de 5 à 10 dyslexiques dans le groupe ?
S ∼ B (120; 0.05)
10
X
p(5 ≤ S ≤ 10) = p(S = i )
i =5
10
i
0.05i 0.95120−i
X
= C 120
i =5
= 0.1634 + . . . + 0.0402 = 0.6834
Inconvéniants
→ Calculs pénibles
→ Précision ?
2/18 ,
Approximation de la loi binomiale par la loi normale
3/18 ,
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
3/18 ,
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
C’est encore plus le cas de la loi normale, car, dans certains cas, la loi
binomiale (discrète) peut être approchée par une loi normale
(continue).
3/18 ,
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
C’est encore plus le cas de la loi normale, car, dans certains cas, la loi
binomiale (discrète) peut être approchée par une loi normale
(continue).
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))
3/18 ,
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
C’est encore plus le cas de la loi normale, car, dans certains cas, la loi
binomiale (discrète) peut être approchée par une loi normale
(continue).
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))
Attention
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
C’est encore plus le cas de la loi normale, car, dans certains cas, la loi
binomiale (discrète) peut être approchée par une loi normale
(continue).
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))
Attention
S ∼ B (n, p) alors S ne prend que des valeurs entières entre 0 et n
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
C’est encore plus le cas de la loi normale, car, dans certains cas, la loi
binomiale (discrète) peut être approchée par une loi normale
(continue).
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))
Attention
S ∼ B (n, p) alors S ne prend que des valeurs entières entre 0 et n
¡ p ¢
X ∼ N np; np(1 − p) alors X ne prend presque jamais des valeurs
entières
Approximation de la loi binomiale par la loi normale
La loi binomiale apparaît dans de nombreuses situations.
C’est encore plus le cas de la loi normale, car, dans certains cas, la loi
binomiale (discrète) peut être approchée par une loi normale
(continue).
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))
Attention
S ∼ B (n, p) alors S ne prend que des valeurs entières entre 0 et n
¡ p ¢
X ∼ N np; np(1 − p) alors X ne prend presque jamais des valeurs
entières
→ On va utiliser la correction de continuité
3/18 ,
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))
4/18 ,
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))
Règles de continuité
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))
Règles de continuité
p(S = k) ≈ p(k − 0.5 ≤ X ≤ k + 0.5)
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))
Règles de continuité
p(S = k) ≈ p(k − 0.5 ≤ X ≤ k + 0.5)
p(S ≤ k) ≈ p(X ≤ k + 0.5)
Propriété
p
Si n ≥ 30, np > 5 et n(1 − p) > 5 alors B (n; p) ≈ N (np, np(1 − p))
Règles de continuité
p(S = k) ≈ p(k − 0.5 ≤ X ≤ k + 0.5)
p(S ≤ k) ≈ p(X ≤ k + 0.5)
p(S < k) ≈ p(X ≤ k − 0.5)
5/18 ,
Exemple d’approximation par une loi normale
La probabilité d’avoir de 5 à 10 dyslexiques dans le groupe de 120
enfants est environ 0.6834
6/18 ,
Exemple d’approximation par une loi normale
La probabilité d’avoir de 5 à 10 dyslexiques dans le groupe de 120
enfants est environ 0.6834
Comme S ∼ B (120; 0, 05) avec n = 120 ≥ 30, np = 6 > 5 et n(1 − p) = 114 > 5,
la binomiale peut être approchée par X ∼ N (6; 2.39)
6/18 ,
Exemple d’approximation par une loi normale
La probabilité d’avoir de 5 à 10 dyslexiques dans le groupe de 120
enfants est environ 0.6834
Comme S ∼ B (120; 0, 05) avec n = 120 ≥ 30, np = 6 > 5 et n(1 − p) = 114 > 5,
la binomiale peut être approchée par X ∼ N (6; 2.39)
6/18 ,
Théorème de la limite centrée
7/18 ,
Théorème de la limite centrée
Exemple introductif
Si on relève la distri-
bution des salaires dans
1000 entreprises, il serait
surprenant que certaines
d’entre-elles présentent
une courbe gaussienne
(les salaires élevés étirent
la courbe vers la droite)
→ salaire médian
Par contre, si on trace la
courbe relative aux 1000
salaires moyens → gaus-
sienne
7/18 ,
Théorème de la limite centrée
7/18 ,
Théorème de la limite centrée
7/18 ,
Théorème de la limite centrée
8/18 ,
Théorème de la limite centrée
Propriété
Soit X 1 , X 2 , . . ., X n n variables aléatoires indépendantes ayant même
X1 + X2 + · · · + Xn
espérance m et même écart-type σ et soit X n = ,
n
alors :
Pour n suffisamment grand, X n suit approximativement la loi nor-
σ
µ ¶
male N m, p
n
8/18 ,
Théorème de la limite centrée
Propriété
Soit X 1 , X 2 , . . ., X n n variables aléatoires indépendantes ayant même
X1 + X2 + · · · + Xn
espérance m et même écart-type σ et soit X n = ,
n
alors :
Pour n suffisamment grand, X n suit approximativement la loi nor-
σ
µ ¶
male N m, p
n
Remarque
Dans la plupart des cas, on considère que n est « suffisamment grand »
lorsque n atteint quelques dizaines, par exemple lorsque n ≥ 30, mais
cela dépend de la nature, de la population et du contexte de l’étude
8/18 ,
Échantillonnage et Estimation
9/18 ,
Échantillonnage et Estimation
Vocabulaire utilisé
Échantillonnage et Estimation
Vocabulaire utilisé
population : totalité des unités de n’importe quel genre prises en
considération par le statisticien. Elle peut être finie ou infinie
Échantillonnage et Estimation
Vocabulaire utilisé
population : totalité des unités de n’importe quel genre prises en
considération par le statisticien. Elle peut être finie ou infinie
échantillon est un sous-ensemble de la population étudiée, dé-
crit à l’aide de mesures (nombre d’unités, la moyenne, l’écart-
type, pourcentage)
Échantillonnage et Estimation
Vocabulaire utilisé
population : totalité des unités de n’importe quel genre prises en
considération par le statisticien. Elle peut être finie ou infinie
échantillon est un sous-ensemble de la population étudiée, dé-
crit à l’aide de mesures (nombre d’unités, la moyenne, l’écart-
type, pourcentage)
paramètres : caractéristiques de la population
Échantillonnage et Estimation
Vocabulaire utilisé
population : totalité des unités de n’importe quel genre prises en
considération par le statisticien. Elle peut être finie ou infinie
échantillon est un sous-ensemble de la population étudiée, dé-
crit à l’aide de mesures (nombre d’unités, la moyenne, l’écart-
type, pourcentage)
paramètres : caractéristiques de la population
statistiques : mesures utilisées pour décrire un échantillon
9/18 ,
Fluctuation d’échantillonnage
10/18 ,
Fluctuation d’échantillonnage
10/18 ,
Fluctuation d’échantillonnage
10/18 ,
Propriété
F n : variable aléatoire qui, à tout échantillon de taille n associe la
fréquence d’apparition du caractère dans cet échantillon
Intervalle de fluctuation au seuil de 1 − α :
" p p #
p(1 − p) p(1 − p)
p − uα p ; p + uα p
n n
seuil 10% 5% 1%
uα 1.64 1.96 2.58
11/18 ,
Exemple
Dans un slogan publicitaire, une banque affirme que 75% des de-
mandes de prêts immobiliers sont acceptées.
Soit F la variable aléatoire qui, à tout échantillon de 1000 demandes
choisies au hasard et de façon indépendante, associe la fréquence de
demandes de prêts immobiliers acceptées.
Donner un intervalle de fluctuation asymptotique au seuil 95% de F
12/18 ,
Exemple
Dans un slogan publicitaire, une banque affirme que 75% des de-
mandes de prêts immobiliers sont acceptées.
Soit F la variable aléatoire qui, à tout échantillon de 1000 demandes
choisies au hasard et de façon indépendante, associe la fréquence de
demandes de prêts immobiliers acceptées.
Donner un intervalle de fluctuation asymptotique au seuil 95% de F
p = 0.75 et n = 1000
h n ≥ 30, npp= 750 ≥ 5 et n(1 − p)p= 250 ≥ 5i
donc
I = 0.75 − 1.96 0.75×0.25
p ; 0.75 + 1.96 0.75×0.25
p
1000 1000
12/18 ,
Estimation
13/18 ,
Estimation
13/18 ,
Estimation
13/18 ,
Estimation
13/18 ,
Estimation
13/18 ,
Estimations ponctuelles
14/18 ,
Estimations ponctuelles
Propriétés
L’estimation ponctuelle de la moyenne m de la population est donnée par la
moyenne observée x dans l’échantillon
m = x = me
Estimations ponctuelles
Propriétés
L’estimation ponctuelle de la moyenne m de la population est donnée par la
moyenne observée x dans l’échantillon
m = x = me
Propriétés
L’estimation ponctuelle de la moyenne m de la population est donnée par la
moyenne observée x dans l’échantillon
m = x = me
m = fe
14/18 ,
Estimations ponctuelles
Propriétés
L’estimation ponctuelle de la moyenne m de la population est donnée par la
moyenne observée x dans l’échantillon
m = x = me
m = fe
Remarque
Que doit-on penser d’une estimation de la moyenne des notes d’un groupe
d’étudiants par la moyenne des 5 meilleurs d’entre-eux ?
14/18 ,
Estimation de la moyenne par une intervalle de confiance
σ connu
15/18 ,
Estimation de la moyenne par une intervalle de confiance
σ connu
On sait que X ∼ N m, pσ où m et σ sont la moyenne et l’écart-type dans la
³ ´
n
population
15/18 ,
Estimation de la moyenne par une intervalle de confiance
σ connu
On sait que X ∼ N m, pσ où m et σ sont la moyenne et l’écart-type dans la
³ ´
n
population
Intervalle de la population dans lequel se trouve la moyenne avec 95% de chance ?
15/18 ,
Estimation de la moyenne par une intervalle de confiance
σ connu
On sait que X ∼ N m, pσ où m et σ sont la moyenne et l’écart-type dans la
³ ´
n
population
Intervalle de la population dans lequel se trouve la moyenne avec 95% de chance ?
X −m
p (−1.96 ≤ Y ≤ 1.96) = p −1.96 ≤ ≤ 1.96
pσ
n
σ σ
µ ¶
= p −1.96 p ≤ X − m ≤ 1.96 p
n n
σ σ
µ ¶
= p X − 1.96 p ≤ m ≤ X + 1.96 p
n n
= 0.95
15/18 ,
Estimation de la moyenne par une intervalle de confiance
σ connu
On sait que X ∼ N m, pσ où m et σ sont la moyenne et l’écart-type dans la
³ ´
n
population
Intervalle de la population dans lequel se trouve la moyenne avec 95% de chance ?
X −m
p (−1.96 ≤ Y ≤ 1.96) = p −1.96 ≤ ≤ 1.96
pσ
n
σ σ
µ ¶
= p −1.96 p ≤ X − m ≤ 1.96 p
n n
σ σ
µ ¶
= p X − 1.96 p ≤ m ≤ X + 1.96 p
n n
= 0.95
15/18 ,
Estimation de la moyenne par une intervalle de confiance
σ connu
On sait que X ∼ N m, pσ où m et σ sont la moyenne et l’écart-type dans la
³ ´
n
population
Intervalle de la population dans lequel se trouve la moyenne avec 95% de chance ?
X −m
p (−1.96 ≤ Y ≤ 1.96) = p −1.96 ≤ ≤ 1.96
pσ
n
σ σ
µ ¶
= p −1.96 p ≤ X − m ≤ 1.96 p
n n
σ σ
µ ¶
= p X − 1.96 p ≤ m ≤ X + 1.96 p
n n
= 0.95
Exemple
Une machine fabrique des rondelles de diamètre moyen inconnu avec σ = 2mm. On
veut estimer la moyenne de la production par un intervalle de confiance au seuil de
risque de 5%. Pour cela, on
h prélève un échantillon de i100 rondelles dont le diamètre
2 2
moyen est 19.3 mm. IC = 19.3 − 1.96 10 ; 19.3 + 1.96 10 = [18.908; 19.692]
15/18 ,
Estimation de la moyenne par une intervalle de confiance
σ inconnu
16/18 ,
Estimation de la moyenne par une intervalle de confiance
σ inconnu
On fait la même chose en remplaçant l’écart-type de la population
par son estimation à partir de l’échantillon
16/18 ,
Estimation de la moyenne par une intervalle de confiance
σ inconnu
On fait la même chose en remplaçant l’écart-type de la population
par son estimation à partir de l’échantillon
q
n
L’estimation de σ est σe × n−1
16/18 ,
Estimation de la moyenne par une intervalle de confiance
σ inconnu
On fait la même chose en remplaçant l’écart-type de la population
par son estimation à partir de l’échantillon
q
n
L’estimation de σ est σe × n−1
σ σ
h i
IC = X − 1.96 p e ≤ m ≤ X + 1.96 p e
n−1 n−1
16/18 ,
Estimation de la moyenne par une intervalle de confiance
σ inconnu
On fait la même chose en remplaçant l’écart-type de la population
par son estimation à partir de l’échantillon
q
n
L’estimation de σ est σe × n−1
σ σ
h i
IC = X − 1.96 p e ≤ m ≤ X + 1.96 p e
n−1 n−1
Exemple
Une machine fabrique des rondelles de diamètre moyen et d’écart-type inconnus. On
veut estimer la moyenne de la production par un intervalle de confiance au seuil de
risque de 5%. Pour cela, on prélève un échantillon de 100 rondelles dont le diamètre
moyenh est 19.3 mm. L’écart-type mesuré
i sur l’échantillon est 1.98 mm.
1.98 1.98
IC = 19.3 − 1.96 p ; 19.3 + 1.96 p = [18.91; 19.69]
99 99
16/18 ,
Estimation d’une proportion par une intervalle de confiance
17/18 ,
Estimation d’une proportion par une intervalle de confiance
17/18 ,
Estimation d’une proportion par une intervalle de confiance
17/18 ,
Estimation d’une proportion par une intervalle de confiance
17/18 ,
Estimation d’une proportion par une intervalle de confiance
Exemple
On dispose d’une urne contenant un très grand nombre de boules rouges et bleues.
On veut estimer le nombre de boules rouges par un intervalle de confiance au seuil de
risque de 5%. Pour cela, on prélève un échantillon de 100 boules dans lequel 59 sont
rouges.
· ¸
q q
IC = 0.59 − 1.96 0.59∗0.41
99 ; 0.59 + 1.96 0.59∗0.41
99 = [0.4931; 0.6869]
17/18 ,
Param. de la Valeur Estim. ponct. Estim. par IC
pop. totale param. pour la au niveau de conf. 2Π(t ) − 1
à estimer échant. pop. totale · pour la pop. totale ¸
σ σ
Moyenne me m = me me − t p ; me + t p
n n
σe σe
r
n
· ¸
Écart-type σe σ = σe me − t p ; me + t p
n −1 n −1 n −1
" r r #
f e (1 − f e ) f e (1 − f e )
Fréquence fe f = fe fe − t ; fe + t
n −1 n −1
18/18 ,