Probabilités et statistique
Théorème central limite
Module 6
Plan
• Introduction
• Théorème central limite
• Correction pour la continuité
• Approximation de la loi binomiale
• Approximation de la loi de Poisson
• Approximation de la loi de Pascal
2
1. Introduction
Soient X1 et X2 des variables aléatoires indépendantes de même loi normale :
X 1 ~ N( μ , σ 2 ) et X 2 ~ N( μ , σ 2 ) X 1 X 2 ~ N(2 μ , 2σ 2 )
f ( xi )
f ( x1 x2 ) f ( x1 x2 ..... xn )
0 μ 2μ nμ
Soient X1 et X2 des variables aléatoires indépendantes qui ont la même loi uniforme :
X 1 ~ U0, 1 et X 2 ~ U0, 1 X 1 X 2 ~ loi triangulaire
f ( xi ) f ( x1 x2 )
1 f ( x1 x2 ..... xn )
0 1 2 n2
3
Soient X1 et X2 des variables aléatoires indépendantes qui ont la même loi exponentielle :
X 1 ~ Exp ( ) et X 2 ~ Exp ( ) X 1 X 2 ~ Gamma (2 , )
f ( xi )
f ( x1 x2 )
f ( x1 x2 ..... xn )
C’est aussi valable pour toutes les variables aléatoires indépendantes qui suivent
la même loi discrète ou continue. Cependant le nombre de variables considérées
doit être très élevé, soit de l’ordre de la centaine pour certaines variables notamment
discrètes.
4
2. Théorème
Si X1 , X2 , X3 , ... , Xn sont des variables aléatoires indépendantes et identiquement
distribuées (i.i.d.) suivant une loi quelconque telle que :
E ( X i ) μ et V ( X i ) σ 2 pour tout i 1 , 2 , 3 , ..... , n ,
alors :
n approx.
( Somme) Y X i ~ N(nμ , nσ 2 )
i 1
1 approx
σ2
( Moyenne) X ( X 1 X 2 ...... X n ) ~ N( μ , )
n n
Note : n doit être assez grand (n > 30).
5
Cas général du théorème central limite :
Soient X1, X2, …, Xn des variables aléatoires indépendantes avec :
E X i i et V X i i2
Si n est assez grand :
Y X 1 X 2 ... X n
Y N1 2 ... n , 12 22 ... n2
n
Y i
n
i 1
N0,1
2
i
i 1
6
Exemples :
a) Une montre avance de X secondes par jour. Quelle est la probabilité que la montre
ait plus de 3 minutes d’avance à la fin de l’année ?
Soit Xi : « avance prise au jour i ».
Supposons que Xi ~ U [0, 1] pour i = 1 , 2 , 3 , … , 365 et que ces variables soient
indépendantes.
1 1
μ E( X i ) et σ2 V (Xi )
2 12
Par le théorème central limite, on obtient :
Y X i ~ N 365
365 approx
2 ,
365
12
i 1
Y (365 / 2) 180 (365 / 2)
PY 180 P
365 / 12 365 / 12
PZ 0.45 PZ 0.45
0.67364
7
b) Le temps d’attente en minutes lors d’un appel à une compagnie de service
informatique suit une loi exponentielle de paramètre λ = 0.04.
Question : Si 120 personnes appellent en une journée, quelle est la probabilité que
leur temps moyen d’attente soit supérieur à ½ heure ?
Ti : « temps d’attente en heures du client i »
Ti ~ Exp(0.04×60) pour i =1, 2, 3,…120
1 1
E Ti 0.416 , V Ti (0.416) 2 0.173
0.04 60 0.04 602
T ; E T 0.416 ; V T 0.173/120 0.0014
120
T 1
120 i
i 1
Par le théorème central limite, on obtient :
T ~ N0.416 , 0.0014
approx
PT 1
2 P T 0.00014
.416 0.5 0.416
P Z
0.5 0.416
PZ 2.24 Z ~ N(0 , 1)
0.0014 0.0014
1 PZ 2.24 1 0.9874 0.0126
8
3. Correction pour la continuité
Approximation de la loi binomiale par la loi normale
Une loi binomiale est une somme de n variables de Bernoulli(p) indépendantes :
X 1 , X 2 ,..., X n ~ Bernoulli p Y X i ~ Binn, p
n
i 1
D’après le théorème central limite et pour n grand :
Y X i ~ Nnp , np(1 p )
n approx.
i 1
Y np
N0, 1
np1 p
Correction de continuité : quand on approxime une loi discrète par une loi continue, il
faut ajouter une correction qui améliore l’approximation.
9
Exemple :
On suppose que la proportion de gens dans la population accédant à Internet est
de 15%. Si on choisit 200 personnes au hasard, quelle est la probabilité que plus
de 35 y accèdent ?
X : « nombre de personnes qui accèdent à Internet parmi les 200 »
X ~ Bin(200, 0.15)
P( X 35) P( X 36) P( X 37) ... P( X 200)
1 P( X 35) 1 P( X 0) P( X 1) ... P( X 35) 0.1387
Étant donné la longueur du calcul, on utilisera le théorème central limite :
E X 200 0.15 30
V ( X ) 200 0.15 (1 0.15) 25.5
X ~ N30, 25.5
approx.
X 30 35 30
P X 35 P PZ 0.99
25.5 25.5
1 PZ 0.99 1 0.8389 0.161
Ceci n’est pas la meilleure approximation, la vraie valeur étant 0.1387. Une amélioration
à cette approximation sera apportée plus loin.
10
Cette différence est due à l’approximation d’une loi discrète par une loi continue.
• Pour la variable continue Z , PZ z P(Z z ) PZ z P(Z z ) où P(Z = z) = 0
L’égalité n’a pas d’incidence dans le calcul des probabilités.
• Par contre pour la variable discrète X , P X x P X x P X x
L’égalité est importante dans le calcul des probabilités.
Par conséquent, l’approximation de la loi discrète par la loi continue doit amener à corriger
cette différence d’où l’utilisation de la correction de continuité.
Si X est une variable discrète dont la loi est approchée par celle d’une variable continue U
alors la correction de continuité s’obtient par (avec a, b et c des nombres réels) :
P X a Pa 12 U a 12
P X b PU b 12
P X b PU b 12
P X c PU c 12
P X c PU c 12
11
Exemple : L’accès à Internet
U 30
X U ~ N30, 25.5 Z ~ N0, 1
25.5
U 30 35.5 30
P X 35 PU 35.5 P PZ 1.09
25 .5 25 .5
1 PZ 1.09 1 0.8621
0.1379
Cette valeur est plus proche de la vraie valeur (0.1387) par rapport à celle obtenue
précédemment (sans correction de continuité, soit 0.161).
Approximation de la loi de Poisson
Une variable aléatoire Poisson(λ) peut être vue comme une somme de n variables
aléatoires Poisson(λ/n):
n
Si X1, X2, …, Xn ~ Poisson(λ/n) indépendantes. Alors : Y X i ~ Poisson( )
i 1
Ainsi, pour λ ≥ 10, le théorème central limite devient :
Y
Y N , ou N0,1
12
Exemple
On suppose que le nombre de pannes du réseau informatique d’une entreprise dans
l’année suit une loi de Poisson de moyenne 76.
Quelle est la probabilité qu’il y ait moins de 65 pannes cette année ?
X : « Nombre de pannes cette année »
X ~ Poisson(76)
P X 65 P X 0 P X 1 ... P X 64 0.0909
Ce calcul est long à effectuer.
λ = 76 > 10, on utilisera l’approximation par la loi normale :
U 76
X U ~ N76 , 76 Z ~ N(0 , 1)
76
U 76 64.5 76
P X 65 PU 64.5 P (avec la correctionde continuité)
76 76
64.5 76
P Z PZ 1.32
76
1 PZ 1.32 1 0.9066
0.0934
13
Approximation de la loi de Pascal
Soient X1 , X2 , X3 , … , Xn des variables aléatoires indépendantes et identiquement
distribuées (i.i.d.) suivant la loi géométrique de paramètre p.
1 1 p
X i ~ Géo( p) ; E X i ; V X i ; i 1 , 2 , 3 , ... , n
p p2
n n(1 p)
Y X i ~ Pascaln , p ; E X ; V X
n
i 1 p p2
D’après le théorème central limite et pour n ≥ 30 ,
n n(1 p)
approx.
X ~ N ,
p
2
p
14
Exemple
Un virus terrible menace tout le système informatique d’une grande banque privée. La
seule façon de le neutraliser est de réussir à l’atteindre de 32 signaux spécifiques qui
peuvent l’identifier. Or, le service informatique de la banque ne dispose à sa connaissance
que de 60 de ces signaux.
Si la probabilité de réussir avec un signal est de 0.4 , quelle est la probabilité de le
neutraliser ?
X : « le nombre d’essais nécessaires pour réussir à neutraliser le virus »
X ~ Pascal32 , 0.4
P32 X 60 P( X 32) P( X 33) ... P( X 60)
Ce calcul est long.
Comme n = 32 > 30, on utilisera l’approximation par la loi normale.
15
Approximation par la loi normale :
32
E X 80
0.4
32 1 0.4
V X 120
0.4 2
U 80
X U ~ N80 , 120 Z ~ N0 , 1
approx.
120
31.5 80 U 80 60.5 80
P32 X 60 P31.5 U 60.5 P
120 120 120
P 4.42 Z 1.78 PZ 1.78 PZ 4.42
0.0375 0 0.0375
16