Introduction aux Variables Aléatoires
Introduction aux Variables Aléatoires
1 Généralités
Définition 1.1. Un espace probabilisé (Ω, F, P ) étant donné, on appelle variable aléatoire réelle
(v.a.r.) une application mesurable X de (Ω, F) dans (R, B(R)). On appelle vecteur aléatoire une
application mesurable X de (Ω, F) dans (Rd , B(Rd )), d > 1.
Un vecteur aléatoire à valeurs dans (R2 , B(R2 )) est également appelé couple aléatoire. On
conviendra dans la suite qu’une v.a de dimension n est une application mesurable de (Ω, F, P )
dans (Rn , B(Rn )).
La tribu B(R) de la définition 1.1 est la tribu borélienne sur R. C’est la tribu engendrée par
les ouverts de R. On montre que (voir le cours de mesure et intégration) la tribu B(R) peut
être engendrée par plusieurs autres familles de sous-ensembles. C’est par exemple le cas des
sous-ensembles suivants :
C1 = {]a, b[, a, b ∈ R, a < b}, C2 = {[a, b[, a, b ∈ R, a < b},
C3 = {]a, b], a, b ∈ R, a < b}, C4 = {[a, +∞[, a ∈ R},
C5 = {]a, +∞[, a ∈ R}, C6 = {] − ∞, a[, a ∈ R},
C7 = {] − ∞, a], a ∈ R}, etc
Lorsque d > 1, La tribu B(Rd ) est la tribu engendrée par les ouverts de Rd .
Proposition 1.1. Soient
P1 = {A1 × . . . × Ad , A1 , . . . , Ad ∈ B(R)}
et
P2 = {] − ∞, a1 ] × . . . ×] − ∞, ad ], a1 , . . . , ad ∈ R}
σ(P1 ) = σ(P2 ) = B(Rd ).
Preuve : Comme P2 ⊂ P1 ⊂ σ(P1 ), on a σ(P2 ) ⊂ σ(P1 ). Montrons que σ(P1 ) ⊂ σ(P2 ).
Pour tout i ∈ {1, . . . , d} fixé soit
Soit C = {] − ∞, x], x ∈ R}. On a montré que C ⊂ Li qui est une tribu. On en déduit que
σ(C) = B(R) ⊂ Li . Ceci montre que Li = B(R). Ainsi pour tout A ∈ B(R),
1
Donc pour tout A1 , . . . , Ad ∈ B(R),
∩
d
A1 × . . . × Ad = Ri−1 × Ai × Rd−i ∈ σ(P2 )
i=1
On en déduit que P1 ⊂ σ(P2 ) il s’ensuit que σ(P1 ) ⊂ σ(P2 ). On a ainsi montré que
σ(P1 ) = σ(P2 ).
Comme B(Rd ) est la tribu engendrée par les fermés de Rd et que les éléments de P2 sont des
fermés, on a
σ(P2 ) ⊂ B(Rd ).
Il suffit pour achever la démonstration de montrer que B(Rd ) ⊂ σ(P1 ).
Soit A un ouvert de Rd . Montrons que A est réunion au plus dénombrable d’intervalles ouverts
de Rd .
Soit D = {((rx1 , . . . , rxd ), (s1x , . . . , sdx )), x ∈ A}. D est au plus dénombrable car D ⊂ Qd × Qd et
∪
A= ]r1 , s1 [× . . . ×]rd , sd [.
((r1 ,...,rd ),(s1 ,...,sd ))∈D
Proposition 1.2. La tribu borélienne sur R est engendrée par chacun des ensembles suivants :
I1 = {[−∞, x[, x ∈ R}
I2 = {[−∞, x], x ∈ R}
I3 = {[x, +∞], x ∈ R}
I4 = {]x, +∞], x ∈ R}
Preuve : (Pour I4 )
Pout tout x ∈ R, ]x, +∞] =]x, +∞[∪{+∞} ∈ B(R) car ]x, +∞[∈ B(R). On en déduit que
I4 ⊂ B(R). Donc σ(I4 ) ⊂ B(R).
Montrons que B(R) ⊂ σ(I ∩4 ).
On vérifie que {+∞} = ]n, +∞]. Donc {+∞} ∈ σ(I4 ).
n∈N
2
∩
{−∞} = [−∞, −n]. Donc {−∞} ∈ σ(I4 ).
n∈N
Ainsi si C ⊂ {−∞, +∞} on a C ∈ σ(I4 ).
Pour tout x ∈ R,
]x, +∞[=]x, +∞] − {+∞} ∈ σ(I4 ).
Soit J4 = {]x, +∞[, x ∈ R}.
On a montré que J4 ⊂ σ(I4 ).
Soit
D = {A ∈ B(R) : A ∈ σ(I4 )}
J4 ⊂ D. On vérifie que D ∪
est une tribu sur R.
En effet, R ∈ D car R = ] − n, +∞[∈ σ(I4 ).
n∈N
Soit A ∈ D. L’ensemble R − A ∈ σ(I4 ) car R ∈ σ(I4 ) et ∪
A ∈ σ(I4 ). Ceci montre que R − A ∈ D.
De même si (An )n est une suite d’éléments de D alors An ∈ D.
n
Comme J4 ⊂ D qui est une tribu sur R, D contient la tribu de R engendrée par J4 qui est
B(R). Donc D = B(R). Ceci montre que si B = A ∪ C avec A ∈ B(R) et C ⊂ {−∞, +∞} on a
B ∈ σ(I4 ).
Preuve : On vérifie que f −1 (σ(S)) est une tribu sur E. Comme f −1 (S) ⊂ f −1 (σ(S)) on a
σ(f −1 (S)) ⊂ f −1 (σ(S)).
Montrons que f −1 (σ(S)) ⊂ σ(f −1 (S)).
Soit
G = {A ⊂ F : f −1 (A) ∈ σ(f −1 (S))}.
−1 −1 −1 −1
( E ∈)σ(f (S)), que f (F ) = E, que f (A ) = (f (A)) et que
c c
Comme
∪ ∪
f −1 An = f −1 (An ), G est une tribu sur F . On vérifie que S ⊂ G. En effet pour
n n
tout A ∈ S on a f −1 (A) ∈ f −1 (S) ⊂ σ(f −1 (S)). Il en résulte σ(S) ⊂ G. Ceci entraîne que
f −1 (σ(S)) ⊂ σ(f −1 (S))
Corollaire 1.1. Soient (E, E) et (F, F) deux espaces mesurables, C un sous-ensemble de P(F )
tel que σ(C) = F et f une application de E dans F . Les propriétés suivantes sont équivalentes :
1) L’application f est mesurable
2) f −1 (C) ⊂ E.
Remarque 1.2. Pour montrer qu’une application X de (Ω, F) dans (R, B(R)) resp (R, B(R))
est mesurable il suffit de vérifier l’une des propriétés suivantes :
- ∀a ∈ R, {X ≥ a} ∈ F où {X ≥ a} = X − 1([a, +∞[) si X est à valeurs dans R et
3
X − 1([a, +∞]) si X est à valeurs dans R.
- ∀a ∈ R, {X > a} ∈ F
- ∀a ∈ R, {X ≤ a} ∈ F
- ∀a ∈ R, {X < a} ∈ F
Lemme 1.1. Soient f et g deux applications mesurables de (Ω, F) dans (R, B(R)). Alors
1. {f < g} ∈ F
2. {f ≤ g} ∈ F
3. {f = g} ∈ F
Preuve : 1)
∪
{f < g} = {ω ∈ Ω : f (ω) < g(ω)} = ({f < r} ∩ {r < g}) ∈ F
r∈Q
4
Il est clair que sup Xn , inf Xn , lim sup Xn , lim inf n Xn sont à valeurs dans R.
n n n
Montrons que sup Xn est une application mesurale.
n
∩
{sup Xn ≤ a} = {Xn ≤ a} ∈ F.
n
n
Remarque 1.3. Soit (Xn )n≥1 une suite d’application mesurables de (Ω, F) dans (R, B(R)).
Si pour tout ω ∈ Ω lim Xn (ω) existe alors X = lim Xn est une application mesurable de
n→+∞ n→+∞
(Ω, F) dans (R, B(R)).
En effet X = lim inf Xn = lim sup Xn .
n n
Proposition 1.5. Soit (Ω, F) un espace mesurable. Soit X = (X1 , . . . , Xn ) une application de
Ω dans Rn . Les propriétés suivantes sont équivalentes :
1) L’application X est mesurable
2) Pour tout i ∈ {1, . . . , n}, Xi est une application mesurable de Ω dans R.
5
Proposition 1.6. Soit X une v.a. de dimension n définie sur (Ω, F, P ). Alors l’application
PX : B(Rn ) −→ [0, 1]
A −→ PX (A) = P (X −1 (A))
Remarque 1.4. La probabilité P est définie sur (Ω, F) tandis que la probabilité PX est définie
sur (Rn , B(Rn )).
Pour tout A ∈ B(Rn ), X −1 (A) = {ω ∈ Ω : X(ω) ∈ A} se note aussi {X ∈ A} et pour tout
x ∈ Rn X −1 ({x}) se note {X = x}.
Théorème 1.7. Toute probabilité µ sur (Rn , B(Rn )) peut être considérée comme la loi de pro-
babilité d’une v.a. X.
Preuve : Il suffit de poser Ω = Rn , F = B(Rn ), P = µ et X = id.
2 Fonction de répartition
Définition 2.1. Soit X une v.a.r. définie sur (Ω, F, P ). On appelle fonction de répartition
(f.d.r.)de X l’application notée FX ou F s’il n’y a pas de confusion possible définie par :
FX : R −→ [0, 1]
x −→ FX (x) = P ({X ≤ x}).
Théorème 2.1. La fonction de répartition FX d’une v.a.r. X vérifie les propriétés suivantes :
1. FX est croissante
Preuve :
1) Soient s et t deux réels quelconques tels que s ≤ t. Tout ω vérifiant X(ω) ≤ s vérifie à
fortiori X(ω) ≤ t. Donc {X ≤ s} ⊂ {X ≤ t} d’où FX (s) = P {X ≤ s} ≤ P {X ≤ t} = FX (t).
Avant de démontrer 2 et 3, il convient de rappeler que toute fonction réelle croissante admet
en tout point de R une limite à droite et une limite à gauche (voir cours d’analyse).
6
2) Soit x ∈ R fixé. Comme on est assuré de l’existence de la limite à droite de FX en ce point,
pour montrer que cette limite vaut FX (x) et établir la continuité à droite de FX en x, il suffit
de vérifier que ( 1)
FX (x) = lim FX x +
n→+∞ n
Soit { }
1
Bn = X ≤ x + , n ∈ N∗ .
n
∩
Vérifions que Bn = {X ≤ x}.
n∈N∗ ∩
Soit ω ∈ {X ≤ x}. Pour tout entier n ≥ 1, on a X(ω) ≤ x + n1 et donc ω ∈ Bn d’où
∩ { } n∈N ∗
1
{X ≤ x} ⊂ X ≤x+ .
∗
n
n∈N ∩
Réciproquement, soit ω ∈ Bn . Pour tout entier n ≥ 1, on a X(ω) ≤ x + n1 . En faisant
n∈N∗
tendre
∩ n vers +∞ dans l’inégalité précédente on obtient X(ω) ≤ x. D’où
Bn ⊂ {X ≤ x}. Il est clair que (Bn )n∈N∗ est une suite décroissante d’évènements. Donc
n∈N∗
( )
∩ 1
P Bn = P {X ≤ x} = lim P (Bn ) = lim P {X ≤ x + }.
n∈N∗
n→+∞ n→+∞ n
On en déduit que ( )
1
FX (x) = lim FX x + .
n→+∞ n
{ }
3) Soit Cn = X ≤ x0 − n1 , n ∈ N∗ . On vérifie que Cn est une suite croissante d’évènements
telle que ∪
Cn = {X < x0 }.
n∈N∗
∪
En effet pour tout n ∈ N∗ on a Cn ⊂ {X < x0 }. Donc Cn ⊂ {X < x0 }.
n∈N∗
∗
Soit ω ∈ {X < x0 }. Posons ϵ = x0 −X(ω). Il existe n0 ∈ N tel que pour tout n ≥ n0 on a n1 < ϵ.
∪
Ainsi X(ω) = x0 −ϵ < x0 − n10 . Ceci montre que ω ∈ Cn0 . On en déduit que {X < x0 } ⊂ Cn
n∈N∗
Comme on est assuré de l’existence de lim FX (x), pour établir que cette limite vaut
x→x0 ,x<x0
P {X < x0 }, il suffit de montrer que
{ } ( )
1 1
lim P X ≤ x0 − = lim FX x0 − = P {X < x0 }.
n→+∞ n n→+∞ n
On sait que ( )
∪
P Cn = P ({X < x0 }) = lim P (Cn )
n→+∞
n∈N∗
Donc { }
1
lim P X ≤ x0 − = P {X < x0 }.
n→+∞ n
7
Avant de démontrer 4 et 5, il convient de rappeler que toute fonction réelle croissante et bornée
admet une limite en −∞ et +∞.
4) La suite ({X ≤ −n})n est une suite décroissante d’évènements. Donc
( )
∩
P {X ≤ −n} = lim P {X ≤ −n}.
n→+∞
n∈N
∩
Montrons que {X ≤ −n} = ∅.
n∈N ∩
En effet, soit ω ∈ {X ≤ −n}. Alors, X(ω) ≤ −n pour tout n ∈ N. En passant à la limite
n∈N
on obtient X(ω) = −∞ ce qui est impossible puisque X ne prend que des valeurs finies. On en
déduit que lim P {X ≤ −n} = P (∅) = 0.
n→+∞
5) La suite ({X ≤ n})n est une suite croissante d’évènements telle que
∪
{X ≤ n} = Ω.
n∈N
⇔ P ({X = x0 }) = 0.
2. continue à droite
8
Définition 2.2. Soit X = (X1 , . . . , Xn ) une v.a. de dimension n ∈ N∗ . On appelle fonction de
répartition de X la fonction notée FX définie par :
FX : Rn −→ [0, 1]
(x1 , . . . , xn ) −→ FX (x1 , . . . , xn ) = P ({X1 ≤ x1 , . . . , Xn ≤ xn }).
FX (x1 , . . . , xn ) = PX (] − ∞, x1 ] × . . . ×] − ∞, xn ]).
lim FX (x1 , . . . , xn ) = 0
xi →−∞
FX (x1 , . . . , xn ) → 1
Preuve : 1) On a
x →−∞
0 ≤ FX (x1 , . . . , xn ) ≤ P ({Xi ≤ xi }) = FXi (xi ) i−→ 0
P (A ∩ B) = P (A) − P (A ∩ B c ). (1)
∪m = (] − ∞, m]) . On vérifie que (Am )m≥1 est une suite croissante d’ensemble telle
n
3) Posons A
que Rn = Am . Il en résulte que
m≥1
Ainsi pour tout ϵ > 0 il existe m0 ∈ N∗ tel que pour tout m ≥ m0 on a 1 − PX (Am ) < ϵ. Il en
résulte que pour tout (x1 , . . . , xn ) ∈ Rn tel que min(x1 , . . . , xn ) ≥ m0 on a
1 − FX (x1 , . . . , xn ) ≤ 1 − PX (Am ) ≤ ϵ
9
Théorème 2.4. Soient X et Y deux v.a. de dimension n. Les propriétés suivantes sont équi-
valentes :
1) PX = PY
2) FX = FY
FX (x1 , . . . , xn ) = PX (] − ∞, x1 ] × . . . ×] − ∞, xn ]) = PY (] − ∞, x1 ] × . . . ×] − ∞, xn ])
= FY (x1 , . . . , xn ).
Proposition 3.1. Soit X une v.a. définie sur (Ω, F, P ) à valeurs dans (Rn , B(Rn )), n ≥ 1.
σ(X) = X −1 (B(Rn ))
Preuve : Par définition de σ(X), ∀A ∈ B(Rn ), X −1 (A) ∈ σ(X) car σ(X) rend X mesurable.
Il en résulte que X −1 (B(Rn )) ⊂ σ(X).
Comme la tribu X −1 (B(Rn )) rend X mesurable on a σ(X) ⊂ X −1 (B(Rn )).
10
Montrons que 1 implique 2
Par
( hypothèse les)évènements {X1 ∈ B1 }, . . . , {Xn ∈ Bn } sont indépendants. Il en résulte que
∩
n ∏n
P {Xi ∈ Bi } = P ({Xi ∈ Bi })
i=1 i=1
Montrons que 2 implique 1
Pour montrer que les tribus σ(X1 ), . . . , σ(Xn ) sont indépendantes il faut vérifier que
∀B1 , . . . , Bn ∈ B(R), les évènements {X1 ∈ B1 }, . . . , {Xn ∈ Bn } sont indépendants.
Soit J une partie de {1, . . . , n} de cardinal
∩ supérieur ou égal∏ à 2.
Si J = {1, . . . , n} par hypothèse on a P ( {Xj ∈ Bj }) = P ({Xj ∈ Bj }).
j∈J j∈J
Si J ̸= {1, . . . , n} Posons Dj = Bj pour tout j ∈ J et Dj = R pour tout j ∈ J c . Comme
∩ ∩
n
{Xj ∈ R}) = Ω, on a {Xj ∈ Bj } = {Xj ∈ Dj }.
j∈J j=1
On en déduit que
∩ ∩
n ∏
n ∏
P( {Xj ∈ Bj }) = P ( {Xj ∈ Dj }) = P ({Xj ∈ Dj }) = P ({Xj ∈ Bj })
j∈J j=1 j=1 j∈J
11
En faisant tendre m vers +∞ dans 2 on déduit que
( )
∩ ∩ ∏ ∏
P {Xj ≤ xj } = P ( Aj ) = P ({Xj ≤ xj }) = P (Aj ).
j∈J j∈J j∈J j∈J
On peut donc conclure que les tribus σ(X1 ), . . . , σ(Xn ) sont indépendantes.
∏
n
FX (x1 , . . . , xn ) = Hi (xi )
i=1
Définition 3.3. Soit (Xi )i∈I une famille infinie de v.a.r. définies sur un e.p. (Ω, F, P ). On
dit que (Xi )i∈I est une famille de v.a. indépendantes si toute sous-famille finie de (Xi )i∈I est
indépendante.
π : R −→ [0, 1]
x −→ π(x) = P ({X = x}).
Remarque 4.1.
π(x) = P ({X = x}) = P ({X ≤ x}) − P ({X < x}) = FX (x) − lim FX (y)
y→x,y<x
On considère dans la suite que X est une v.a.r, π sa fonction de masse, FX sa f.d.r. et que
DX = {x ∈ R : π(x) > 0}. (DX est l’ensemble des points de discontinuité de FX .)
12
Preuve : Seule la propriété c reste à prouver.
c)Pour tout entier n ≥ 1 soit { }
1
An = x ∈ R : π(x) ≥
n
Montrons que Card(An ) ≤ n.
Raisonnons par l’absurde. Supposons que Card(An ) ≥ n + 1. On peut alors trouver n + 1
éléments distincts x1 , . . . , xn+1 de An tels que x1 < x2 . . . < xn+1 . On a alors
FX (xj+1 ) − FX (xj ) = P ({X ≤ xj+1 }) − P ({X ≤ xj }) ≥ P ({X ≤ xj+1 }) − P ({X < xj+1 })
1
= π(xj+1 ) ≥ (4)
n
De 3 et 4 on déduit que
n+1
FX (xn+1 ) ≥ >1
n
ce qui est absurde.
En outre ∪
DX = An .
n≥1
Ce qui montre que DX est au plus dénombrable car une réunion au plus dénombrable d’en-
sembles au plus dénombrable est au plus dénombrable.
Remarque 4.2. Nous avons montré que l’ensemble des points de discontinuités de la fonction
de répartition d’une v.a.r. est au plus dénombrable.
Définition 4.3. On dit qu’une v.a. X à valeurs dans (Rn , B(Rn ) n ≥ 1 est discrète s’il existe
∑ensemble au plus dénombrable DX ⊂ R appelé support de la loi de X tel que
n
un
P ({X = x}) = 1.
x∈DX
13
Pour tout A ∈ B(Rn ) on a alors
0 ≤ PX (A ∩ DX
c
) ≤ PX (DX
c
) = 0 ce qui montre que PX (A ∩ DX
c
) = 0.
Dans la pratique pour déterminer la loi de probabilité d’une v.a. discrète il faut donner
1) DX qui se note aussi X(Ω).
2) P ({X = x}) pour x ∈ DX
Pour tout A ∈ B(Rn ) on a alors
( )
∪
PX (A) = PX (A ∩ DX ) + PX (A ∩ DX ) = PX (A ∩ DX ) = PX
c
{x}
x∈A∩DX
∑ ∑
= PX ({x}) = P ({X = x})
x∈A∩DX x∈A∩DX
P {X = 1} = p, P {X = 0} = 1 − p = q.
On notera X ∼ B(p)
Si A ∈ F est un évènement de probabilité p, son indicatrice définie par
{ {
1 si ω ∈ A 1 si A est réalisé
IIA (ω) = =
0 si ω ̸∈ A 0 si A n’est pas réalisé
est une variable aléatoire suivant la loi de Bernoulli de paramètre p. Réciproquement, si X est
une v.a. de Bernoulli, on peut toujours écrire X = IIA en définissant
A = {ω ∈ Ω : X(ω) = 1}.
14
5.4 Loi Hypergéométrique
Alors que la loi binomiale intervient dans les tirages avec remise, la loi hypergéométrique
correspond aux tirages sans remise.
Exemple 5.1. Dans une production totale de N objets dont M sont défectueux, on prélève
au hasard simultanément ou successivement sans remise un échantillon de n objets. Soit X le
nombre aléatoire d’objets défectueux dans l’échantillon. Quelle est sa loi ?
{ k ×C n−k
CM N −M
si 0 ≤ k ≤ M, 0 ≤ n − k ≤ N − M.
P {X = k} = n
CN (5)
0 sinon.
Définition 5.4. La loi définie par 5 s’appelle loi hypergéométrique de paramètre N , M et n.
Notation X ∼ H(N, M, n). Le paramètre N est l’effectif de la population totale, M celui de la
sous-population à laquelle on s’interesse et n la taille de l’échantillon observé.
15
On en déduit que
exp(−λ)λk
lim Cnk pkn (1 − pn )n−k = .
n→+∞ k!
Application pratique : Ce théorème sert de justication théorique à la règle pratique suivante :
lorsque n est grand et p petit, on peut remplacer la loi binomiale B(n, p) par la loi P(λ) où
λ = np.
∪
+∞
Par hypothèse, {X ∈ N∗ } = {X = k}. On en déduit
k=1
∑ ∑ p
P {X ∈ N∗ } = P {X = k} = q k−1 p = = 1.
k∈N∗ k∈N∗
1−q
Ainsi, avec une probabilité 1, le succès apparaît au bout d’un nombre fini d’épreuves (mais pas
borné par un nombre fixé avant le début des épreuves). Finalement, on peut considérer que X
est à valeurs dans X(Ω) = N∗ au lieu de X(Ω) = N∗ ∪ {+∞}.
Définition 5.6. Une v.a. X suit la loi géométrique de paramètre p ∈]0, 1[ si X(Ω) = N∗ et,
∀k ∈ N∗ , P {X = k} = p(1 − p)k−1 .
Notation : X ∼ G(p).
Soit X ∼ G(p). Calculons P {X > n} de deux façons :
Première méthode : On calcule le reste d’une série géométrique :
∑
+∞ ∑
+∞ ∑
+∞
pq n
P {X > n} = q k−1
p= l
q p = pq n
q l−n = = qn.
k=n+1 l=n l=n
1−q
16