UE 501 - EC Probabilités et Statistiques – L3 SPI – S5 – 2024/2025 N.
Gillot
Feuille 4 : Introduction aux statistiques + Loi Normale
Données : En notant ϕ la fonction de répartition de la loi N (0; 1), on donne les approximations
suivantes :
— Le quantile d’ordre 0, 975 de la loi N (0; 1) vaut q0,975 = ϕ−1 (0, 975) = 1, 96 ;
— Le quantile d’ordre 0, 95 de la loi N (0; 1) vaut q0,95 = ϕ−1 (0, 95) = 1, 64 ;
— ϕ(0, 7) = 0, 7580 ; ϕ(0.36) = 0, 6406 ; ϕ(1.672) = 0.9525
Exercice 1
Pour détecter le diabète, on dose le taux de glucose en gramme par litre de sang. On appelle
glycémie ce taux de glucose. La glycémie des non-diabétiques suit une loi normale N (0; 0, 22 ) et
celle des diabétiques une loi normale N (2; 1).
1. Trouver le seuil g0 tel que la probabilité qu’un non-diabétique ait une glycémie supérieure à
g0 soit de 0,05.
2. On décide alors que le test de dépistage du diabète sera positif si la glycémie est supérieure
à g0 et négatif si elle est inférieure à g0 . Quelle est alors la probabilité qu’un diabétique ait
un test positif ?
3. Il y a un diabétique sur 100 parmi les patients d’un médecin. Ce médecin dose le glucose
d’un patient. Si le test est positif, quelle est la probabilité que ce patient soit diabétique ? Si
le test est négatif, quelle est la probabilité que ce patient ne soit pas diabétique ?
Correction.
1. On note N la variable aléatoire taux de glycémie des non-diabétiques. On sait que N suit
une loi normale de paramètres 0 et 0, 22 . Il s’agit d’une loi normale centrée, mais non
réduite. On veut déterminer g0 , tel que
P (N > g0 ) = 0, 05.
On commence donc par réduire :
N g0
P > = 0, 05.
0, 2 0, 2
Par passage au complémentaire :
N g0
P ⩽ = 0, 95.
0, 2 0, 2
Par lecture inversée de la table de la fonction de répartition de la loi normale centrée réduite,
g0
≃ 1, 64,
0, 2
donc g0 ≃ 1, 64 × 0, 2 = 0, 328.
2. On note D la variable aléatoire taux de glycémie des diabétiques. On sait que D suit une
loi normale de paramètres 2 et 1. Il s’agit d’une loi non centrée, mais réduite. On cherche
à connaître P (D > g0 ). On effectue le raisonnement suivant :
P (D > g0 ) = P (D − 2 > g0 − 2) = P (D − 2 > −1, 672).
On effectue ensuite un passage au complémentaire :
P (D − 2 > −1, 672) = 1 − P (D − 2 ⩽ −1, 672) = 1 − 0, 0475 = 0, 9525%.
1
UE 501 - EC Probabilités et Statistiques – L3 SPI – S5 – 2024/2025 [Link]
3. Il s’agit d’une question classique de conditionnement. Notons T l’événement « le test est
positif »(et donc T : « le test est négatif »), D l’événement « être diabétique »(et donc D
l’événement « ne pas être diabétique »). On sait que P (D) = 0, 01 et P (D) = 0, 99. D’après
la question 1, P (T |D) = 0, 05 et d’parès la question 2, P (T |D) = 0, 9525.
On veut calculer P (D|T ). Il s’agit d’une inversion de conditionnement, donc on applique
la formule de Bayes.
P (T |D) × P (D)
P (D|T ) = .
P (T )
Il faut calculer P (T ). On utilise la formule des probabilités totales, avec le système complet
d’événements D et D :
P (T ) = P (T |D) × P (D) + P (T |N ) × P (N ) ≃ 0, 9515 × 0, 01 + 0, 05 × 0, 99 ≃ 0, 059.
Donc
0, 9525 × 0, 01
P (D|T ) ≃ ≃ 0, 159.
0, 059
La deuxième probabilité cherchée est P (D|T ). D’après la formule de Bayes, on a :
P (T |D) × P (D) (1 − P (T |D) × P (D)
P (D|T ) = = ,
P (T ) (1 − P (T ))
donc
0, 95 × 0, 99
P (D|T ) ≃ ≃ 0, 999.
0, 941
Exercice 2
Le staff médical d’une grande entreprise fait des statistiques sur le taux de cholestérol de ses em-
ployés.
Les observations sur 100 employés tirés au sort sont les suivantes :
Taux de cholestérol (en cg) Effectif d’employés
120 9
160 22
200 25
240 21
280 16
320 7
1. Calculer la moyenne µe et l’écart-type σe sur l’échantillon.
2. Donner une estimation ponctuelle µ̂ de la moyenne et σ̂ de l’écart-type pour le taux de
cholestérol dans toute l’entreprise.
Correction.
√
1. On applique les formules vues en cours pour obtenir µe = 213, 6 et σe = 3111, 04.
2. Une estimation ponctuelle est donc donnée par les valeurs trouvées en question 1.
2
UE 501 - EC Probabilités et Statistiques – L3 SPI – S5 – 2024/2025 [Link]
Exercice 3
On suppose que le poids (en kg) d’un nouveau-né suit une loi normale N (µ, σ 2 ) où l’écart-type
σ = 0, 5 mais où la moyenne µ est inconnue.
Le poids moyen des 49 enfants nés au mois de juillet 2021 à l’hôpital de Nancy était de 3, 6 kg.
1. Déterminer un intervalle de confiance à 95% pour le poids d’un nouveau-né dans cet hôpital.
2. Quel serait le niveau de confiance d’un intervalle de longueur 0, 1 centré en 3, 6 pour ce
poids ?
Correction.
1. On est dans le cas Gaussien avec moyenne inconnue et variance connue. L’énoncé nous
donne une estimation de la moyenne par la moyenne empirique X n = 3.6 kg. À partir de
cela, on applique l’intervalle de confiance vu en cours :
σ σ
X n − q1− 2 √ ; X n + q1− 2 √
α α
n n
α
avec q1− α2 le quantile d’ordre 1 − 2 de la loi normale N (0, 1).
2. Dans cette question, il s’agit de déterminer le quantile q1− α2 tel que la longueur de l’intervalle
de confiance soit de 0, 1 centré en 3.6. Ainsi, on résout l’équation
σ
2q1− α2 √ = 0.1
n
On en déduit donc que √
n
q1− α2 = 0.05 ×
σ
Exercice 4
Le patron d’un garage automobile effectue un contrôle de fabrication sur des pièces de moteur.
On note p la proportion de pièces défectueuses parmi toutes celles de l’entreprise.
On contrôle un lot de 200 pièces prises au hasard et on y trouve 24 pièces défectueuses.
Donner un intervalle de confiance pour l’estimation de p au niveau de confiance 95%.
Correction. Cette fois-ci, il s’agit de déterminer un intervalle de confiance pour p. Ici p représente
24
la proportion de pièces défectueuses parmi 200 pièces prises au hasard. Ainsi pn = 200 = 12% =
X n . On est donc dans le cas d’une loi de Bernoulli de paramètre pn : lorsqu’on tire une pièce au
hasard parmi ces 200, celle-ci à 12% de chance d’être défectueuse. Ainsi, un intervalle de confiance
pour l’estimation de p au niveau de confiance 95% est donné par
" r r #
pn (1 − pn ) pn (1 − pn )
pn − q1− α2 ; pn + q1− α2
n n
3
UE 501 - EC Probabilités et Statistiques – L3 SPI – S5 – 2024/2025 [Link]
Exercice 5
On effectue un contrôle sur des pièces de un euro dont une proportion p = 0, 05 est fausse et sur
des pièces de 2 euros dont une proportion p′ = 0, 02 est fausse. Il y a dans un lot 500 pièces dont
150 pièces de un euro et 350 pièces de 2 euros.
1. On prend une pièce au hasard dans ce lot : quelle est la probabilité qu’elle soit fausse ?
2. Sachant que cette pièce est fausse, quelle est la probabilité qu’elle soit de un euro ?
3. On contrôle à présent un lot de 1000 pièces de un euro. Soit X la variable aléatoire : « nombre
de pièces fausses ». Montrer que cette variable suit une loi binomiale, dont on précisera les
paramètres, avant de calculer son espérance, sa variance et son écart-type.
4. En utilisant le théorème Central-Limite, calculer la probabilité pour que X prenne des valeurs
entre 48 et 52.
Attention, comme on approxime par une loi continue, on utilisera que P (48 ⩽ X ⩽ 52) =
P (47, 5 ⩽ X ⩽ 52, 5).
Correction.
1. Soient F l’événement « la pièce est fausse », A l’événement « la pièce est de un euro » ;
A correspond ici à l’événement « la pièce est de deux euros ». D’après l’énoncé, P (A) =
150
500 = 0, 3 (et donc P (A) = 1 − P (A) = 0, 7), P (F |A) = 0, 05 et P (F |A) = 0, 02. D’après
la formule des probabilités totales avec le système complet d’événements (A, A) :
P (F ) = P (F |A) × P (A) + P (F |A) × P (A) = 0, 05 × 0, 3 + 0, 02 × 0, 7 = 0, 029.
Donc, il y a environ 2, 9% de pièces fausses.
2. On veut calculer P (A|F ). On utilise la formule de Bayes (inversion du conditionnement) :
P (F |A) × P (A) 0, 05 × 0, 3
P (A|F ) = = ≃ 0, 517.
P (F ) 0, 029
3. On répète n = 1000 fois de manière indépendante la même expérience de Bernoulli (à deux
issues) : « obtenir une pièce fausse », « ne pas obtenir une pièce fausse ». Pour chacune de
ces expériences de Bernoulli, la probabilité d’obtenir une pièce fausse est p = 0, 05. Donc,
la variable aléatoire X suit une loi binomiale de paramètres n = 1000 et p = 0, 05, ce que
l’on peut noter X ∼ B(1000; 0, 05).
D’après les propriétés d’une loi binomiale,
E(X) = n × p = 1000 × 0, 05 = 50 et V (X) = n × p × (1 − p) = 50 × 0, 95 = 47, 5
p √
et on en déduit l’écart-type σ(X) = V (X) = 47, 5.
X − E(X) X − 50
4. D’après le théorème de Central Limite, la variable aléatoire Z = = √
σ(X) 47, 5
peut être approchée en loi par la loi normale centrée réduite N (0, 1) :
47, 5 − 50 52, 5 − 50
P (48 ⩽ X ⩽ 52) = P (47, 5 ⩽ X ⩽ 52, 5) = P √ ⩽Z⩽ √
47, 5 47, 5
= P (−0, 36 ⩽ Z ⩽ 0, 36) ≃ 0, 28
4
UE 501 - EC Probabilités et Statistiques – L3 SPI – S5 – 2024/2025 [Link]
Exercice 6
Lors d’une élection opposant 2 candidats, un sondage, d’opinion réalisé sur un échantillon de 1000
personnes donne 52% des voix au candidat A, et 48% au candidat B.
1. Donner un intervalle de confiance au niveau 0.95 des intentions de vote pour le candidat A.
2. Combien suffirait-il interroger de personnes pour qu’il y ait moins de 5% de chances que
B l’emporte, si A a recueilli 52% des intentions de votes dans le sondage ? Autrement dit,
combien faudrait-il interroger de personnes pour qu’il y ait
Correction.
1. On se retrouve à nouveau dans le cas d’une loi de Bernoulli de paramètre p que l’on va
estimer par la moyenne empirique X n = pn = 0.52 pour le candidat A. Comme dans
l’exercice 4, on trouve
" r r #
pn (1 − pn ) pn (1 − pn )
pn − q1− α2 ; pn + q1− α2
n n
avec pn = 0.52 et n = 1000.
q n de personnes sondées tel que la borne inférieure
2. Dans cette question, on cherche le nombre
pn (1−pn )
de l’intervalle de confiance, pn −q1− α2 n , soit au moins égale à 50%. On trouve donc
n = 2401.