Leçon 8
Espace de probabilité, variable aléatoire,
loi de variable aléatoire
1. Espace de probabilité (Ω, A, P)
2. Variable aléatoire
3. Loi de variable aléatoire
4. Variable aléatoire définie presque sûrement
5. Vecteur aléatoire
Exercices
1
Cette leçon introduit la notion fondamentale de variable aléatoire et de loi
de variable aléatoire du calcul des probabilités. Si par définition une variable
aléatoire n’est rien d’autre qu’une fonction mesurable, le concept va bien au delà
dans son utilisation et sa souplesse à décrire les phénomènes aléatoires et leurs
propriétés. Cette description s’appuie sur la notion d’un espace de probabilité,
abstrait, rendant compte de l’aléa sous-jacent.
1 Espace de probabilité (Ω, A, P)
Alors que les mesures de probabilité rencontrées dans la leçon précédente
sont décrites sur un espace mesurable (E, B) le plus souvent concrètement iden-
tifié, et qu’elles sont explicites, la notion de variable aléatoire conduit à changer
de paradigme en considérant un espace probabilisé (Ω, A, P), qui restera le plus
souvent abstrait (et qu’en fait, sauf besoin explicite, il n’est pas nécessaire de
décrire – il sera toutefois supposé suffisamment riche en un sens à préciser tout
au long de la leçon).
Donc P est une probabilité sur l’espace mesurable (Ω, A) ; d’une certaine fa-
çon, le triplet (Ω, A, P) représente l’ensemble des phénomènes aléatoires (pour
rendre compte par exemple de l’incertitude dans le lancer d’une pièce – ou
si cette illustration paraît encore trop déterministe, la position de l’électron
autour du noyau de l’atome). Une sorte d’« univers » donc, sur lequel des fonc-
tions mesurables (les variables aléatoires) vont agir et décrire des phénomènes.
Il convient d’observer le caractère universel de la probabilité P à travers sa no-
tation (distincte donc des P de la Leçon 7). Une partie A de A sera appelée
événement.
Aléa. Du latin alea qui signifie « dé », « jeu de dés », « jeu de hasard ».
Hasard. De l’ancien français hasart, de l’espagnol azar, venant de l’arabe
andalou az-zahr, qui signifie « dé, jeu de dés », nommé d’après l’arabe zahr, qui
2
signifie « fleur », car la face gagnante du dé portait une fleur.
Random. De l’ancien français randon qui signifie « course rapide » ; plus
précisément, en vènerie, course erratique du cerf qui zigzague en essayant d’échap-
per aux chiens. Le mot a aussi donné « randonnée » en français.
Stochastique. Du grec ancien stokhastikos, qui signifie « conjectural », de
stokhos, qui signifie « but, cible, conjecture ».
2 Variable aléatoire
Soit (E, B) un espace mesurable, par exemple (comme cela sera essentiel-
lement le cas dans ces leçons) E = R ou Rd muni de la tribu des boréliens.
Définition 1 (Variable aléatoire). Une variable aléatoire, sur (Ω, A) à valeurs
dans (E, B), est une fonction mesurable
X : (Ω, A) → (E, B).
La notation X, comme souvent en mathématique, souligne le caractère cen-
tral de l’objet dans le cadre considéré. La définition de mesurabilité indique
donc que, pour tout B ∈ B,
X −1 (B) = ω ∈ Ω ; X(ω) ∈ B ∈ A.
Il y donc autant de variables aléatoires que de fonctions mesurables, et elles
vérifient les diverses propriétés rappelées dans la Leçon 1. En particulier, une
fonction X : (Ω, A) → (R, B(R)) est une variable aléatoire si
X −1 ] − ∞, t] = {X ≤ t} ∈ A
pour tout t ∈ R.
3
Lorsque (E, B) = (R, B(R)), les variables aléatoires sont qualifiées de réelles.
Dans ce cadre, il n’est pas inutile de rappeler au moins les fonctions indicatrices
X = 1A , A ∈ A, et les fonctions étagées X = nk=1 ck 1Ak , ck ∈ R∗ et Ak ∈ A,
P
k = 1, . . . , n, disjoints.
Il est aussi important de rappeler que la propriété de mesurabilité est stable
par composition. Ainsi, par exemple, si X : (Ω, A) → (R, B(R)) est une variable
aléatoire réelle et φ : R → R une fonction borélienne (donc mesurable pour les
tribus boréliennes sur l’espace de départ et celui d’arrivée), alors φ(X) est
encore une variable aléatoire (sur (Ω, A), à valeurs réelles). Ainsi cos(X), eX ,
X 5 ... sont des variables aléatoires réelles.
Pour la clarté et la souplesse de la réflexion à venir, il vaut la peine de
souligner, étant donné une variable aléatoire X : (Ω, A) → (E, B) et B ∈ B,
l’identité
1{X∈B} = 1B (X) = 1B ◦ X
au sens où, pour tout ω ∈ Ω,
1{X∈B}(ω) = 1B X(ω)
(puisque ω ∈ {X ∈ B} signifie X(ω) ∈ B).
3 Loi de variable aléatoire
Ce paragraphe constitue l’un des cœurs de la pensée probabiliste. Il présente
comment une variable aléatoire sur un espace probabilisé (Ω, A, P) (abstrait)
induit une probabilité (concrète) sur un espace mesurable (E, B) à travers l’opé-
ration de mesure image.
Définition 2 (Loi de variable aléatoire). La loi d’une variable aléatoire X, sur
un espace probabilisé (Ω, A, P) à valeurs dans un espace mesurable (E, B),
X : (Ω, A, P) → (E, B),
4
est la mesure image de P par X, notée PX , définie par
PX (B) = P X −1 (B) = P ω ∈ Ω ; X(ω) ∈ B ,
B ∈ B.
La loi d’une variable aléatoire pourra aussi être appelée distribution. D’autres
notations pour PX incluent P ◦ X −1 ou X#P , mais il sera plus simple d’en res-
ter à l’écriture PX (même si elle n’est pas optimale pour toutes les opérations
envisagées).
La notation de la définition sera souvent allégée
P ω ∈ Ω ; X(ω) ∈ B = P X∈B = P(X ∈ B),
la disparition de ω et des accolades n’étant pas toujours bienvenue, mais l’as-
similer participe à la compréhension de la définition d’une loi, en particulier
du rôle à la fois fondamental et discret (au sens de « discrétion ») de l’espace
probabilisé sous-jacent (Ω, A, P).
La loi d’une variable aléatoire X : (Ω, A, P) → (E, B) est donc une me-
sure de probabilité PX sur un espace « concret » (E, B), comme par exemple
(R, B(R)). En tant que mesure sur B(R), elle pourra par exemple être discrète,
ou à densité par rapport à la mesure de Lebesgue.
Ce point de vue conduit à reconsidérer les exemples classiques (Leçon 7) de
mesures de probabilité sur B(R) comme des lois de variables aléatoires. Il sera
ainsi question de variables aléatoires de Bernoulli, binomiale, de Poisson, géo-
métrique, uniforme, exponentielle ou encore normale. La terminologie conduit
en outre à transformer « mesure de probabilité » en loi de probabilité, et à par-
ler de variables aléatoires de loi de Bernoulli, de Poisson, exponentielle etc.,
voire simplement variables de Bernoulli, de Poisson, exponentielle etc. Il sera
dit en corollaire qu’une variable aléatoire « suit » une loi donnée, de Bernoulli,
de Poisson, exponentielle etc.
Par exemple, une variable aléatoire X sera dite de Bernoulli sur {0, 1} de
paramètre p ∈ ]0, 1[ si sa loi PX est la loi de Bernoulli B(p) (sur {0, 1}, de
5
paramètre p ∈ ]0, 1[). De plus, il sera suggestif de la décrire simplement sous la
forme
P(X = 1) = p et P(X = 0) = 1 − p
(puisque P(X = 1) = PX ({1}) et P(X = 0) = PX ({0})) qui concentre d’un
même coup toutes les caractéristiques. De façon alternative, et tout aussi sug-
gestive, (
1 avec probabilité p,
X =
0 avec probabilité 1 − p.
Ce petit exemple est l’occasion de deux remarques importantes. La première,
déjà mentionnée dans la Leçon 7, est qu’une variable de Bernoulli est à valeurs
dans {0, 1} (muni de la σ-algèbre des parties) et qu’il n’est pas besoin de la
considérer à valeurs dans R (ce dernier ensemble ayant simplement l’avantage
de pouvoir placer dans le même cadre une foule d’exemples).
La seconde est plus fondamentale. Tout d’abord, l’espace probabilisé (Ω, A, P)
n’est donc pas précisé dans cette définition de variable de Bernoulli, et l’esprit
mathématique en éprouvera quelque frustration. Mais qu’à cela ne tienne :
prendre Ω = {0, 1} muni de la σ-algèbre A des parties et de la probabilité
P = pδ1 + (1 − p)δ0 de Bernoulli. Alors, la variable identité
ω ∈ Ω = {0, 1} 7→ X(ω) = ω
a nécessairement pour loi pδ1 + (1 − p)δ0 puisque pour tout B ∈ A,
P(X ∈ B) = P ω ∈ Ω ; X(ω) ∈ B = P(B).
Mais cette observation va au delà. En effet, rien n’empêche de considérer un
« autre » espace probabilisé (Ω, A, P), comme par exemple Ω = [0, 1] muni de
la tribu des boréliens (restriction de B(R) à [0, 1]) et de la probabilité P = λ
mesure de Lebesgue. Alors, la variable aléatoire
ω ∈ Ω = [0, 1] 7→ X(ω) = 1[0,p] (ω)
6
sur cet espace (et à valeurs dans {0, 1}) aura aussi pour loi la probabilité de
Bernoulli pδ1 + (1 − p)δ0 . En effet,
P(X ∈ 1) = P ω ∈ Ω ; X(ω) = 1
= λ ω ∈ [0, 1] ; 1[0,p] (ω) = 1
= λ [0, p] = p
et de la même façon
P(X = 0) = λ ]p, 1] = 1 − p,
de sorte que X suit bien la loi de Bernoulli B(p).
En conclusion, des variables aléatoires différentes, construites sur des espaces
différents et donc sans comparaison, peuvent avoir la même loi, leur trait com-
mun étant l’espace de leurs valeurs (E, B) et le fait qu’elle pousse la probabilité
abstraite P en la loi donnée. Il sera souvent question de variables aléatoires X,
à valeurs dans (E, B), de loi donnée, sans que l’espace probabilisé sous-jacent
(Ω, A, P) soit même mentionné. Si X est une variable aléatoire de loi P sur
(E, B), il est en fait toujours possible de la réaliser sur Ω = E, A = B, P = P ,
comme la variable identité de E dans E pour laquelle clairement PX = P . (En
conséquence, l’espace probabilisé (Ω, A, P) devra avoir au moins cette richesse.)
Des variables aléatoires de même loi pourront être dites « équidistribuées ».
4 Variable aléatoire définie presque sûrement
Pour commencer ce paragraphe, il peut être rappeler que la loi d’une variable
aléatoire réelle, en tant que mesure sur un espace métrique, a un support, qui est
une partie fermée de R (Exercice 5, Leçon 2). Par exemple, la loi exponentielle
E(α) a pour support [0, ∞[.
Il peut aussi être signalé que si B est une partie mesurable d’un espace
(E, B), toute variable aléatoire X : (Ω, A, P) → (E, B) à valeurs presque sû-
7
rement dans B, i.e. P(X ∈ B) = 1, est aussi une variable aléatoire à valeurs
dans B muni de la tribu trace B ∩ B. Sa loi PX définit donc une mesure de
probabilité sur (B, B ∩ B). Réciproquement, si X est à valeurs dans B ∈ B,
elle est aussi à valeurs dans E, et sa loi est aussi une mesure de probabilité sur
(E, B). Par exemple, une variable aléatoire à valeurs entières est aussi une va-
riable aléatoire réelle. Ces observations traduisent simplement, dans le langage
des variables aléatoires, les opérations de restriction et d’extension de mesures
décrites dans la Leçon 2.
Une situation concrète de restriction intervient souvent lorsqu’une variable
aléatoire, réelle par exemple, sur (Ω, A, P) n’est pas définie pour tous les ω ∈ Ω,
mais seulement en dehors d’un ensemble de mesure nulle.
1
Un premier exemple, un peu extrême, consiste à examiner Y = X+1 pour
X une variable aléatoire de loi de Bernoulli B(p) sur {0, 1} vue comme variable
aléatoire réelle. Bien entendu, Y (ω) n’est pas défini si X(ω) = −1, mais cette
situation est improbable car P(X ∈ {0, 1}) = 1. En fait
P Y = 21 = p et P(Y = 1) = 1 − p,
et il n’y a donc aucune difficulté à considérer Y (à valeurs dans { 21 , 1}) et à
déterminer sa loi.
Une autre situation, fréquente, a trait à une variable aléatoire réelle X de
loi PX de densité f par rapport à la mesure de Lebesgue λ sur R, donc telle
que Z
P(X ∈ B) = PX (B) = f dλ, B ∈ B(R),
B
pour laquelle se pose la question de savoir si Y = X1 a un sens ? La variable
aléatoire Y est a priori à valeurs dans R, mais comme la loi de X a une densité,
Z
P(X = 0) = f dλ = 0
{0}
(car λ({0}) = 0). Ainsi Y est en fait presque sûrement à valeurs dans R puisque
P(Y = ±∞) = P(X = 0) = 0. De façon rigoureuse, il conviendrait de travailler
8
avec la variable aléatoire Y 0 = 1
X 1{X6=0}, définie pour tout ω ∈ Ω, pour laquelle,
pour tout borélien B de R,
1
0
P(Y ∈ B) = P ∈ B, X =
6 0 = P(Y ∈ B)
X
puisque P(X = 0) = 0. Autrement dit, la variable aléatoire Y 0 , bien définie, est
égale presque sûrement à Y .
En résumé, ce type de raisonnements et d’extensions sera employé assez li-
brement dans l’ensemble des leçons. Il s’étend à toute sorte de situations. Une
variable aléatoire réelle pourra être dite presque sûrement positive, signifiant
P(X ≥ 0) = 1, et donc considérée en fait positive partout. Réciproquement,
positive ou bornée pourra signifier positive presque sûrement ou bornée presque
sûrement. Ou encore une variable aléatoire de loi exponentielle E(α) sera consi-
dérée indifféremment sur ]0, ∞[ ou [0, ∞[ (même si son support est [0, ∞[),
tout comme les lois uniformes U(a, b) sur l’intervalle (a, b) ouvert, fermé, semi-
ouvert.
5 Vecteur aléatoire
La définition de variable aléatoire présentée dans les paragraphes précé-
dents couvre la situation générale de variables à valeurs dans un espace me-
surable (E, B) quelconque. Le cas de (R, B(R)) est bien entendu un exemple
particulier privilégié, couvert par la terminologie de variable aléatoire réelle.
Ce paragraphe décrit la situation de (Rd , B(Rd )), d ≥ 1. Une variable aléa-
toire à valeurs complexes s’interprète de façon mesurable comme un « couple
aléatoire » à valeurs dans R2 .
Définition 3 (Vecteur aléatoire). Un vecteur aléatoire est une variable aléatoire
X : (Ω, A) → (Rd , B(Rd ))
9
à valeurs dans Rd . À ce titre, il a des composantes (coordonnées)
X = (X1 , . . . , Xd ), et X est mesurable (est une variable aléatoire) si et seule-
ment si chacune des applications coordonnées X1 , . . . , Xd est une variable aléa-
toire réelle.
L’équivalence de la définition est une conséquence de la forme produit
B(Rd ) = B(R)⊗· · ·⊗B(R) des tribus boréliennes. En effet, si B = B1 ×· · ·×Bd
est un pavé mesurable de Rd ,
X −1 (B) = X1−1 (B1 ) ∩ · · · ∩ Xd−1 (Bd ).
Si X est mesurable, il suffit de choisir B2 = · · · = Bd = R pour vérifier
que X1 est mesurable, et de la même façon les autres coordonnées. Si chaque
Xk , k = 1, . . . , d, est mesurable, X −1 (B) ∈ A pour tout pavé B, ce qui suffit à
assurer la mesurabilité de X d’après la Proposition 7, Leçon 1, puisque B(Rd ) =
B(R) ⊗ · · · ⊗ B(R) est engendrée par les pavés.
La loi PX d’un vecteur aléatoire X = (X1 , . . . , Xd ) est une mesure de pro-
babilité sur B(Rd ). Le schéma précédent montre que la connaissance de PX
détermine les lois de toutes les applications coordonnées, appelées lois margi-
nales. En effet, si B = B1 × · · · × Bd est un pavé mesurable de Rd ,
P(X ∈ B) = P (X1 , . . . , Xd ) ∈ B1 × · · · × Bd
= P {X1 ∈ B1 } ∩ · · · ∩ {Xd ∈ Bd } ,
expression pour laquelle la notation simplifiée
P(X ∈ B) = P(X1 ∈ B1 , . . . , Xd ∈ Bd )
sera privilégiée. Si B2 = · · · = Bd = R, il découle que P(X ∈ B) = P(X1 ∈ B1 ),
déterminant donc la loi de X1 , et de même pour les autres coordonnées. En
conclusion
Proposition 4. La loi d’un vecteur aléatoire détermine les lois marginales.
(La réciproque est fausse en général.)
10
Par opposition avec les lois marginales, la loi du vecteur X = (X1 , . . . , Xd )
sera parfois appelée « loi jointe » des variables X1 , . . . , Xd .
Dans la pratique, comment décrire les lois marginales à partir de la loi du
vecteur ? Cette question est l’occasion de décrire les lois de quelques vecteurs
aléatoires, et d’opérer avec elles.
Supposer par exemple que X = (X1 , X2 ) est un vecteur (couple) aléatoire
à valeurs dans N × N tel que
P (X1 , X2 ) = (n1 , n2 ) = P(X1 = n1 , X2 = n2 ) = pn1 ,n2
P
avec donc (n1 , n2 ) ∈ N × N et pn1 ,n2 ≥ 0, (n1 ,n2 )∈N×N pn1 ,n2 = 1. La loi de
X1 (à valeurs dans N) s’obtient alors simplement en sommant les probabilités
pn1 ,n2 suivant la seconde coordonnée n2 puisque, pour tout n1 ∈ N,
[
P(X1 = n1 ) = P {X1 = n1 } ∩ {X2 = n2 }
n2 ∈N
[
= P {X1 = n1 } ∩ {X2 = n2 }
n2 ∈N
X
= P(X1 = n1 , X2 = n2 )
n2 ∈N
X
= pn1 ,n2 .
n2 ∈N
En effet, X2 étant à valeurs dans N, la famille {X2 = n2 }, n2 ∈ N, forme un
système complet d’événements, les identités précédentes découlant alors de la
définition d’une mesure. Par symétrie,
X
P(X2 = n2 ) = pn1 ,n2 , n2 ∈ N.
n1 ∈N
De la même manière, si la loi PX du couple aléatoire X = (X1 , X2 ) a une
densité f = f (x1 , x2 ), (x1 , x2 ) ∈ R2 , par rapport à la mesure de Lebesgue (sur
11
R2 ), la loi de X1 a pour densité
Z
f1 (x1 ) = f (x1 , x2 )dλ(x2 ), x1 ∈ R,
R
et de façon symétrique pour la loi de X2 .
Comme annoncé dans l’énoncé de la proposition, si la loi d’un vecteur
aléatoire détermine les lois marginales, la réciproque est fausse en général,
et de nombreux exemples seront mis en évidence dans les prochaines leçons.
À ce stade, il est possible de mentionner l’exemple élémentaire des couples
X = (X1 , X2 ) et Y = (Y1 , Y2 ) de densités respectives (et différentes !)
f (x1 , x2 ) = 43 (x1 + x2 )2 et g(x1 , x2 ) = 43 (x21 + x22 ) par rapport à la mesure de
Lebesgue sur [−1, +1]2 pour lesquels il est immédiat de vérifier, sur les formules
précédentes, que X1 et Y1 ont même loi et X2 et Y2 ont même loi.
12
Exercices corrigés
(Une étoile * désignera une question de difficulté supérieure.)
Exercice 1. Un jet de deux dés est modélisé par l’espace probabilisé (Ω, A, P)
1
où Ω = {1, 2, 3, 4, 5, 6}2 , A = P(Ω) et P(A) = 36 Card(A). Le premier dé sera
la variable aléatoire X : Ω → E, E = {1, 2, 3, 4, 5, 6}, B = P(E), définie par
X(ω1 , ω2 ) = ω1 .
a) Quelle la mesure image PX de P par X ?
R R
b) Si φ : E → R, expliciter les deux intégrales Ω φ ◦ XdP et E φ dPX .
Exercice 2. Soit X une variable aléatoire sur (Ω, A, P) à valeurs dans N
telle que, pour tous m, n ∈ N,
P X ≥ m + n | X ≥ n = P(X ≥ m).
(On dit que X est « sans mémoire ».) En supposant que P(X = 1) = a,
déterminer la loi de X. Même question si X est une variable aléatoire à valeurs
réelles positives telle que
P X > s + t | X > t = P(X > s), s, t > 0.
Exercice 3. Soit Y une variable aléatoire de loi uniformément répartie sur
l’intervalle [0, 5]. Quelle est la probabilité que les racines de l’équation
x2 + (Y + 2)x + Y + 3 = 0
en la variable x ∈ R soient réelles ?
Exercice 4. Soit X une variable aléatoire sur (Ω, A, P) suivant la loi bino-
miale B(2n, 21 ) ; déterminer la loi de Y = |X − n|.
13
Exercice 5. Soit X une variable aléatoire, sur un espace probabilisé (Ω, A, P),
de loi géométrique G(p) de paramètre p ∈ ]0, 1[ ; calculer pn (t) = P(X > nt),
t ≥ 0, n ≥ 1. Pour p = n1 , n ≥ 2, t ≥ 0, étudier la limite de pn (t) lorsque
n → ∞.
Exercice 6. Soit la fonction
(
0 si t < 0,
F (t) = t
1+t si t ≥ 0.
a) Tracer F et démontrer que c’est une fonction de répartition.
b) Expliquer pourquoi F est la fonction de répartition d’une unique mesure de
probabilité P sur la tribu des boréliens de R.
On désigne par X une variable aléatoire réelle, sur un espace probabilisé
(Ω, A, P), de loi P .
c) Décrire un espace probabilisé possible.
d) Soit Y = X 1{X≤3} ; justifier que Y est une variable aléatoire ; dans quel
ensemble prend-elle ses valeurs ? Décrire et tracer la fonction de répartition
FY (t) = PY (] − ∞, t] = P(Y ≤ t), t ∈ R, de la loi PY de Y .
e) Exprimer PY sous la forme d’une combinaison d’une mesure discrète et d’une
mesure admettant une densité.
Exercice 7. Soient X et Y deux variables aléatoires sur (Ω, A, P) à valeurs
dans N. On suppose que la loi jointe du couple (X, Y ) est donnée par
c
P (X, Y ) = (k, `) = , (k, `) ∈ N × N,
k! `!
où c ∈ R.
a) Déterminer la valeur de c. Reconnaître les lois marginales de X et Y .
c(k+`)
b) Mêmes questions si à présent P((X, Y ) = (k, `)) = 2k+`
, (k, `) ∈ N × N.
14
Exercice 8. Le couple aléatoire (X, Y ) défini sur un espace probabilisé
(Ω, A, P) suit la loi uniforme sur le carré [−1, +1]2 . Déterminer la probabilité
P( 21 < X 2 + Y 2 < 1).
Exercice 9 (Loi du demi-cercle). Un couple aléatoire (X, Y ) est uniformé-
ment réparti sur le disque unité
D = (x, y) ∈ R2 ; x2 + y 2 ≤ 1
de R2 .
a) Décrire la densité de la loi de (X, Y ) par rapport à la mesure de Lebesgue
sur R2 .
b) Calculer P(X ≥ √1 ). (Indications : faire un dessin ; sin( π4 ) = cos( π4 ) = √1 .)
2 2
c) Démontrer que la loi de X admet une densité par rapport à la mesure de
Lebesgue que l’on identifiera.
Exercice 10*. Pour un entier n ≥ 1, et pour 1 ≤ k ≤ n, soit
Xn
n
Ω = Ωk = x ∈ {0, 1} ; x` = k .
`=1
L’espace Ω est muni de la tribu A = P(Ω) des parties de Ω et de la probabilité
uniforme P. Le vecteur aléatoire X = (X1 , . . . , Xn ) sur (Ω, A, P) réprésente les
composantes d’un élément de Ω.
Vérifier que, pour tout ` = 1, . . . , n, X` suit une loi de Bernoulli. Démontrer
que, pour tous j, ` = 1, . . . , n distincts, (Xj , X` ) a même loi que (X1 , X2 ).
(Indication : observer que n`=1 X` = k.)
P
15