Probabilités
Probabilités
Introduction
8.1 Ensembles dénombrables
Exemple 8.1
— L’ensemble N est dénombrable... En effet, l’identité définit une bijection de N dans lui-même.
— L’ensemble des nombre pairs P est dénombrable. En effet, si on définit ϕ : N → P par, pour tout n ∈ N, ϕ(n) =
2n alors ϕ est bijective.
Remarque 8.1 Un ensemble au plus dénombrable X peut toujours être décrit en extension. En effet, si on note ϕ la
bijection (à valeurs dans N = 1, n si X est fini ou à valeurs dans N = N si X est dénombrable) et qu’on pose xk = ϕ (k)
pour tout k ∈ N alors © ª
X = xk | k ∈ N .
Réciproquement, si un ensemble X peut être décrit en extension sous la forme précédente, alors il est au plus dénom-
brable.
Démonstration Comme X ⊂ N, X admet un plus petit élément qu’on note x0 . On pose alors ϕ(0) = x0 . Alors X \ {x0 } admet aussi
un plus petit élément qu’on ©note x1 et on pose
ª ϕ(1) = x1 . On construit ainsi par récurrence une suite (xn ) ⊂ X en prenant pour xn+1
le plus petit élément de X \ xk | k ∈ 0,n et pour tout n ∈ N, on pose ϕ(n) = xn . L’application ϕ est bien définie et strictement
croissante par construction donc injective.
Montrons qu’elle est aussi surjective.© Soit x ∈ X, alors ilªexiste n ∈ N tel que© ϕ(n) > x . Sinon, ϕª est une injection de N dans 0, x ce
qui n’est pas possible. Alors x 6∈ X \ ϕ(0),... ,ϕ (n − 1)) et forcément x ∈ ϕ(0),... ,ϕ (n − 1)) . Donc il existe k ∈ 0,n − 1 tel que
ϕ(k) = x et ϕ est bien surjective.
Exemple 8.2 L’ensemble des nombres premiers est une partie infinie de N et donc dénombrable.
1
Comme X et Y sont disjoints, θ est bien définie.
Si pour z, z ′ ∈ X ∪ Y, p = θ(z) = θ(z ′ ) alors :
— si p est pair alors z, z ′ ∈ X et l’égalité s’écrit ϕ(z) = ϕ(z ′ ). Comme ϕ est injective, z = z ′
— si p est impair alors z, z ′ ∈ Y et l’égalité s’écrit ψ(z) = ψ(z ′ ). Comme ψ est injective, z = z ′
Alors θ est injective. Montrons qu’elle est aussi surjective. Soit p ∈ N.
— si p est pair, alors il existe k ∈ N tel que p = 2k . Comme ϕ : X → N est surjective, il existe x ∈ X tel que ϕ(x) = k . Alors
θ(x) = p .
— On fait de même si p est impair en considérant ψ : Y → N.
Donc θ est surjective. Alors θ réalise bien une bijection de X ∪ Y vers N.
Un corollaire immédiat est que :
Démonstration Considérons
N2
½
−→ N
ϕ:
(u, v ) 7−→ 2u (2v + 1)
et montrons que ϕ est bijective.
Soient (u, v ),(u ′ , v ′ ) ∈ N2 tels que ϕ(u, v ) = ϕ(u ′ , v ′ ) alors
′
2u (2v + 1) = 2u (2v ′ + 1)
ce qui est absurde car le nombre de gauche dans cette égalité est pair alors que celui de droite est impair. Donc u = u ′ . Mais alors
2v + 1 = 2v ′ + 1 et v = v ′ et ϕ nest injective. o
Soit n ∈ N et considérons A = k ∈ N∗ | 2k divise n . L’ensemble A est non vide car 1 ∈ A, il est aussi majoré par n donc il possède
un maximum qu’on note u . Alors n = 2u m avec m impair (sinon u n’est pas le maximum de A) et on a bien ϕ(u, v ) = n avec
2v + 1 = m . Donc ϕ est surjective.
En conclusion ϕ est bijective.
Démonstration Il existe une bijection de X dans N et de Y dans N. En utilisant une bijection de N2 dans N, on construit alors une
bijection de X × Y dans N.
Démonstration En effet, Q est en bijection avec (p, q) ∈ Z × N∗ | p ∧ q = 1 qui est une partie infinie de l’ensemble dénombrable
© ª
Démonstration Supposons que R soit dénombrable. Alors il en est de même de [0,1[ qui est une partie infinie de R. On peut donc
trouver une suite (xn ) qui parcourt tous les éléments de [0,1[. Construisons alors un élément α de [0,1[ qui n’est pas un point de
(xn ) ce qui constituera une contradiction.
On construit α via son développement décimal. Si le ni ème terme dans le développement décimal de xn est :
— non nul alors on suppose que le ni ème terme du développement décimal de α est nul ;
— nul alors on suppose que le ni ème terme du développement décimal de α vaut 1.
Supposons qu’il existe N ∈ N tel que xN = α. Alors si le Ni ème terme du développement décimal de XN est non nul, celui de α
devrait égal à 1, contradiction ! S’il est nul, alors celui de α devrait être égal à 1, nouvelle contradiction. Le nombre α n’est donc
pas un élément de (xn ).
2
P ROPOSITION 8.8 ♥ {0, 1}N n’est pas dénombrable
L’ensemble des suites à valeurs dans {0, 1} n’est pas dénombrable.
Remarquons qu’il manque une entrée. On ne considère pas le cas d’une expérience aléatoire comme celle du jet de
trois dés non pipés indiscernables. Dans une telle expérience, l’ordre n’a pas d’importance mais les répétitions sont
possibles. L’univers Ω est alors celui des k -combinaisons avec répétitions d’un ensemble à n éléments et est hors pro-
gramme. Indiquons seulement que Card (Ω) = n+k−1 . Le lecteur désireux d’approfondir le sujet est renvoyé par exemple
¡ ¢
k
à [Link]
Nous allons étudier cette année des univers infini. Nous allons néanmoins nous limiter aux univers dénombrables et à des
cas très particuliers d’univers non dénombrables.
Dans un univers infini Ω, il est loisible de considérer une infinité d’événements (A i )i∈I deux à deux disjoints où I est un
ensemble quelconque. Si P est une probabilité sur Ω, il faut alors pouvoir écrire
à !
[ X
P Ai = P(A i )
i∈I i∈I
3
D ÉFINITION 8.2 ♥ Tribu, événement, espace probabilisable
Soit Ω un ensemble et soit T une partie de P (Ω). On dit que T est une tribu sur Ω si T satisfait aux trois axiomes :
1. Si A ∈ T , alors son complémentaire A = Ω \ A est aussi dans T .
+∞
2. Si on a une suite dénombrable (A n )n∈N d’éléments de T , alors leur réunion A n est aussi dans T .
[
n=0
3. L’ensemble Ω est dans T .
Un élément de T est appelé un événement et le couple (Ω, T ) est appelé un espace probabilisable.
Exemple 8.3
— Un premier exemple de tribu élémentaire est évidemment donné par P (Ω). Toute tribu sur Ω est contenue dans
cette tribu.
— Un autre exemple ³ élémentaire
´ est donné par la tribu (∅, Ω). Toute tribu sur Ω la contient.
— Si A ⊂ Ω alors ∅, A, A, Ω est une tribu sur Ω. C’est la plus petite contenant A.
— Notons qu’une intersection de tribus sur Ω est encore une tribu. Pour une partie T de P (Ω), on peut alors
introduire la plus petite tribu de Ω contenant T . C’est l’intersection de toutes les tribus sur Ω contenant T . On
l’appelle tribu engendrée par T et on la note σ(T ).
— Si B est une partie de Ω et si T est une tribu sur Ω alors T ′ = {B ∩ T | T ∈ T } est une tribu sur B. Voir l’exercice
?? page ?? pour une démonstration.
Revenons comme promis à l’exemple consistant à lancer indéfiniment, ici un dé mais on a une construction analogue pour
le jeu de Pile ou Face.
P LAN 8.1 : Lancers infinis, épisode 1/3
On s’intéresse donc à l’expérience aléatoire consistant à jeter une infinité de fois un dé à six faces. L’univers Ω
consiste en l’ensemble des suites dont les termes sont pris dans 1, 6 : Ω = 1, 6N .
L’événement « Obtenir 2, puis 3, puis que 1 jusqu’au dixième lancé » peut être modélisé par l’événement suivant
A = {(un ) ∈ Ω | u0 = 2, u1 = 3, ∀i ∈ 2, 9 , ui = 1}.
Cet événement peut être décrit comme un produit cartésien. On note :
— A0 = {2} ;
— A1 = {3} ;
— Pour tout i ∈ 2, 9, Ai = {1} ;
— Pour tout i Ê 10, Ai = 1, 6 ;
alors A = +∞ A . Une tel événement qui s’écrit comme un produit cartésien dont tous les termes sont égaux à 1, 6
Q
k=0 k
à partir d’un certain rang, est dit cylindrique. On peut alors s’intéresser à la plus petite tribu (au sens de l’inclusion)
contenant les éléments cylindriques.
Le langage de la théorie des ensembles permet des calculs systématiques sur les événements. Toutefois, il faut savoir que
le langage courant, que nous utilisons dans une première étape pour décrire des événements a sa traduction ensembliste.
Voici un dictionnaire :
4
P ROPOSITION 8.9 ♥ Règles de calcul
Soient A, B, C ∈ P (Ω). Alors :
1 A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C), 6 Ωc = ∅,
2 A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C),
3 A ∪ Ac = Ω, 7 (A ∪ B)c = Ac ∩ Bc ,
4 A ∩ Ac = ∅,
5 (Ac )c = A, 8 (A ∩ B)c = Ac ∪ Bc .
Les deux dernières égalités sont connues sous le nom de lois de Morgan.
Démonstration
— En appliquant les axiomes ?? et ??, on a le premier résultat.
— Pour le second, on considère A0 ,... , An des éléments de T . On pose, pour tout k > n , Ak = ∅. Alors (An )n∈N est une
famille dénombrable d’éléments de T et d’après l’axiome ??, on a +∞ A = n A ∈T .
S S
k=0 k k=0 k
n
— Pour le troisième point, si A1 ,... , An ∈ T alors A1 ,... , An ∈ T et d’après le point précédent, A = Ak ∈ T . Donc A ∈ T ,
[
k=1
c’est-à-dire, grâce aux lois de Morgan :
n
[ n
\ n
\
A= Ak = Ak = Ak ∈ T .
k=1 k=1 k=1
— On procède de même dans le quatrième point mais il faut ici considérer une famille infinie (An ) d’éléments de T . Par
+∞
l’axiome ??, on sait que les éléments de (An ) sont aussi dans T et d’après l’axiome ??, An ∈ T . Mais alors, à nouveau
[
n=0
grâce à l’axiome ??, par passage au complémentaire et grâce aux lois de Morgan, il vient
∞
[ +∞
\ +∞
\
An = An = An ∈ T
n=0 n=0 n=0
5
T HÉORÈME 8.11 ♥♥♥ Règles de calcul avec une probabilité
Soit (Ω, T , P) un espace probabilisé. Alors
1. P(∅) = 0.
2. Si A 1 , A 2 , . . . , A n dans T sont deux à deux disjoints, alors
Démonstration
1. L’axiome d’additivité dénombrable est applicable à la suite constante définie par An = ∅, qui est effectivement formée
d’événements deux à deux disjoints. La série dont le terme général P(∅) est constant ne peut converger que si ce terme
général est 0.
2. La première partie du second point se démontre en appliquant l’axiome d’additivité dénombrable à A1 , A2 ,... , An continuée
par ∅ = An+1 = An+2 = · · · , et en utilisant le premier point.
3. On applique maintenant le point 2 à n = 2, A1 = A et A2 = A′ ce qui fournit 1 = P(Ω) = P(A) +P(A) d’après le premier axiome
d’une probabilité.
4. On écrit B = A∪(B\ A) comme réunion de deux ensembles disjoints (notez que B\ A = B∩ A est bien dans T ), et on applique
le 2. : P(B) = P(A) + P(B \ A) Ê P(A).
2. Si les A 1 , A 2 , . . . , A n sont des événements de T pas nécessairement deux à deux disjoints, alors
3. Continuités croissante et décroissante : Soit une suite (Bn )n∈N d’événements de T qui est ou bien croissante
(c’est-à-dire que pour tout n Ê 0 on a Bn ⊂ Bn+1 ) ou bien décroissante (c’est-à-dire que pour tout n Ê 0 on a
Bn ⊃ Bn+1 ). Alors, la suite P(Bn ) admet une limite donnée, dans le cas croissant, par :
+∞
[
lim P(Bn ) = P( Bn ) ;
n→+∞
n=0
+∞
\
lim P(Bn ) = P( Bn ) .
n→+∞
n=0
4. Sous additivité dénombrable : Soit une suite (Bn )n∈N d’événements de T . Alors
µ +∞ ¶ +∞
[ X
P Bn É P(Bk )
n=0 k=0
où P(Bk ) ∈ R+ .
P+∞
k=0
Démonstration
1. On écrit comme dans la dernière démonstration du théorème précédent ?? :
6
puis on écrit A ∪B = (A ∩B) ∪(B\ A) ∪(A \ B) comme réunion de trois ensembles deux à deux disjoints et on applique le 2. du
théorème ?? :
2. On démontre le résultat par récurrence sur n . C’est trivial pour n = 1. Si c’est démontré pour n ∈ N, appliquons la règle du
1. à A = A1 ∪ · · · ∪ An et à B = An+1 . On obtient, à l’aide de l’hypothèse de récurrence
n
X
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) É P(A) + P(B) É ( P(Ak )) + P(An+1 ).
k=1
3. Dans le cas croissant, posons A1 = B1 et, pour n Ê 2, An = Bn \ Bn−1 . ÃLes A1 , A
! 2 ,... , An ,... sont alors deux à deux disjoints
P∞ ∞ +∞
et la série P(Ak ) est donc convergente de somme Ak d’après l’axiome d’additivité dénombrable.
X [
k=1
P(Ak ) = P
k=1 k=0
D’après la partie 2. du théorème précédent, on a
n
X
P(Bn ) = P(A1 ∪ · · · ∪ An ) = P(Ak )
k=1
et donc la nieme somme partielle de P(Ak ) est donnée par P(Bn ). Comme cette série converge, il en est de même de (P(Bn )
X
Dans le cas où la famille (Cn ) est décroissante, on se ramène au cas précédent par passage au complémentaire. En effet, à
l’aide de la loi de Morgan, le complémentaire d’une union est l’intersection des complémentaires. On sait que
n
[
P(Bn ) = 1 − P(Bn ) = 1 − P( An )
k=0
mais (P(Bn )) admet, par propriété de limite croissante, une limite donnée par
à ! à ! à !
+∞
[ +∞
\ +∞
\
P Cn = P Cn = 1 − P Cn .
n=0 n=0 n=0
à !
+∞
Alors lim P(Bn ) = P Cn .
\
n=0
4. Posons pour tout n ∈ N, Cn = B1 ∪ · · · ∪ Bn . En utilisant le second point, on a pour tout n ∈ N
à !
n
[ n
X
P(Cn ) = P Bk É P(Bk ).
k=0 k=0
La famille (Cn ) est croissante et par propriété de limite croissante, la suite P(Cn ) converge et a pour limite
à ! à !
+∞
[ +∞
[
lim P(Cn ) = P Cn = P Bn .
n=0 n=0
à !
n
Mais la suite des sommes partielles de la série P(Bk ) est croissante et donc d’après le théorème de la
X P
P(Bk )
k=0 n∈N
limite monotone, elle admet une limite dans R+ . Par passage à la limite dans une inégalité, on obtient donc
+∞
[ ∞
X
P( Bn ) = lim P(Cn ) É lim (P(B1 ) + · · · + P(Bn )) = P(Bk ).
n=1 n→+∞ n→+∞
k=1
Terminons cette section par une condition suffisante d’existence d’une probabilité sur un univers Ω dénombrable.
+∞
X
pn = 1
n=0
alors il existe une unique probabilité P : P (Ω) → [0, 1] telle que P ({xn }) = p n .
7
Démonstration
Analyse Supposons qu’il existe une probabilité P sur P (Ω) telle que pour tout xn ∈ Ω, P ({xn }) = p n . Alors, comme pour tout
A ⊂ Ω, il existe IA ⊂ Ω tel que A = xi | i ∈ IA et comme les événements xi pour i ∈ IA sont deux à deux indépendants,
© ª © ª
on a : X ¡© ª¢ X
P(A) = P xi = pi .
i∈IA i∈IA
On admet, conformément au programme, que cette somme est bien définie car indépendante de l’ordre d’énumération de
ses termes.
Synthèse Considérons une application P : P (Ω) → R définie de la façon suivante. Pour tout A ⊂ Ω, il existe IA ⊂ Ω tel
que A = xi | i ∈ IA et on pose P(A) = i∈IA P xi = i∈IA p i . On pose aussi P(∅) = 0. Vérifions que P est bien une
© ª P ¡© ª¢ P
à !
[ 1 +∞
X +∞
X
PB An = P (An ∩ B) = PB (An ).
nÊ0 P(B) n=0 n=0
Il faut toutefois réaliser que la probabilité PB est concentrée sur B et ne charge pas B.
8
T HÉORÈME 8.14 ♥♥ Formule des probabilités composées
Soit (Ω, T , P) un espace probabilisé fini et soit (A i )i∈1,n des événements dont l’intersection est de probabilité non
nulle. On a la formule des probabilités composées :
à !
n
\
P A k = P(A 1 )PA1 (A 2 )PA1 ∩A2 (A 3) . . . PA1 ∩A2 ∩...∩An−1 (A n ) .
k=1
De la même façon :
P(A1 ∩ A2 ∩ A3 ) = P(A1 ∩ A2 )PA1 ∩A2 (A2 ) = P(A1 )PA1 (A2 )PA1 ∩A2 (A2 )
et on termine par une récurrence facile.
Exemple 8.4 Un soldat a 1 chance sur 3 de devenir sergent (événement S ). Un sergent à 1 chance sur 4 de devenir
lieutenant(événement L). Un lieutenant a 1 chance sur 5 de devenir général(événement G). Quelle est la probabilité que
le soldat Etienne devienne général ?
1 1 1
P(S ∩ L ∩ G) = P(S)PS (L)PS∩L (G) = × × .
3 4 5
+∞
X +∞
X
P(A) = P(A ∩ Bn ) = PBn (A)P(Bn )
n=0 n=0
Démonstration On observe que les événements de la suite (A ∩ Bn )n∈N sont deux à deux incompatibles et leur réunion est A
donc, par axiome d’additivité dénombrable, série de terme général P(A ∩ Bn ) converge et on a
à à !! à !
+∞
[ +∞
[ +∞
X +∞
X
P(A) = P (A ∩ Ω) = P A ∩ Bn =P (A ∩ Bn ) = P(A ∩ Bn ) = PBn (A)P(An ).
n=0 n=0 n=0 n=0
Exemple 8.5 On considère trois urnes U1 , U2 et U3 chacune contenant 10 boules. La première contient une seule boule
blanche, la deuxième en contient 2 et la troisième 3. On tire une boule au hasard. Quelle est la probabilité qu’elle soit
blanche ? On note B l’événement la boule est blanche et Ui l’événement « la boule provient de l’urne Ui ». L’univers est
ici formé de l’ensemble des trente boules. Les événements U1 , U2 et U3 forment un système complet d’événements. On
utilise la formule des probabilités totales :
1 1 1 2 1 3 1
P(B) = P(U1 )PU1 (B) + P(U2 )PU2 (B) + P(U3 )PU3 (B) = × + × + × = .
3 10 3 10 3 10 5
9
Remarque 8.2 Le tirage des urnes dans cet exemple est équiprobable aussi cette expérience aléatoire est équivalente à
celle de mettre toutes les boules dans une seule et même urne et à tirer une boule de cette urne.
PB (A)P(Bk )
∀k ∈ N, PA (Bk ) = P+∞ k
n=0 PBn (A)P(Bn )
Attention 8.6 Ne pas confondre indépendance et incompatibilité. Deux événements incompatibles sont en général
dépendants. En effet, la réalisation de l’un entraîne l’impossibilité de la réalisation de l’autre.
D ÉFINITION 8.7 ♥♥♥ Suite d’événements deux à deux indépendants, suite d’événements mutuellement indé-
pendants
Soit (Ω, T , P) un espace probabilisé et soit (A i )i1,n une suite finie d’événements de T . Les événements de cette famille
sont dits :
— deux à deux indépendants si et seulement si A i et A j sont indépendants pour tout i , j ∈ 1, n, i 6= j .
— mutuellement indépendants si et seulement si pour toute partie I ⊂ 1, n non vide,
à !
\ Y
P Ai = P(A i ).
i∈I i∈I
Exemple 8.7
— Par exemple si N = 2, la famille d’événements {A, B} est indépendante si et seulement si P(A ∩ B) = P(A)P(B);
dans le cas où P(B) > 0 il serait équivalent de dire PB (A) = P(A). On a coutume de dire par abus de langage que
A et B sont indépendants (abus, car l’adjectif qualificatif "indépendant" n’a de sens que s’il s’applique à la paire)
ou plus correctement que A est indépendant de B, expression qui ne rend toutefois pas justice à la symétrie de la
définition d’indépendance.
— Si N = 3 la famille d’événements {A, B, C} est indépendante si et seulement si
P(A ∩ B ∩ C) = P(A)P(B)P(C).
10
Notez que la deuxième ligne n’est pas entraînée par la première. Si Ω a 4 éléments 1,2,3,4 de probabilité 1/4
chacun, les 3 événements A = {1, 2}, B = {1, 3} et C = {1, 4} satisfont la première ligne et pas la deuxième : ils sont
seulement deux à deux indépendants.
— Si n est quelconque, il n’y a pour montrer l’indépendance que 2n − 1 − n égalités à vérifier, puisque l’ensemble
vide pour I est exclu et que les n cas où I est un singleton sont triviaux. Notez aussi que l’ensemble vide et
l’ensemble Ω sont indépendants de n’importe quoi et qu’une sous famille d’une famille indépendante est encore
indépendante.
Exemple 8.8 Comme exemple d’indépendance de n événements, considérons dans le schéma succès échec fini avec
n essais un élément particulier a = (a1 , . . . , an ) de Ω, c’est-à-dire une suite particulière de succès et d’échecs. Notons
k = X(a) le nombre de succès que comprend la suite a . Soit
© ª
A j = ω = (ω1 , . . . , ωn ) ∈ Ω | ω j = a j .
Alors {A 1 , . . . , A n } est une famille indépendante. En effet P(A j ) = p si a³ j = S et ´1 − p si a j = E. De plus, par définition
du schéma, P({a}) = p k (1 − p)n−k Comme nj=1 A j = {a} on a bien P nj=1 A j = nj=1 P(A j ). La démonstration pour
T T Q
Le problème est alors de vérifier que l’application P s’étend à tous les événements de P et que l’application ainsi
étendue fait de (Ω, T , P) un espace probabilisé.
Le théorème suivant, qui est hors programme, nous dit que c’est le cas.
C’est en ce sens que les expériences aléatoires sont dites mutuellement indépendantes.
Par exemple, si on considère l’événement « on obtient 6 aux N premiers lancers » alors cet événement correspond
au cylindre à !
A N = {6}N ×
Y
1, 6
nÊN
1
et P(AN ) = nk=0 Pk ({P}) = N .
Q
6
On peut maintenant se pencher sur le problème de calculer la probabilité d’événements du type « on obtient pile
∞
à chaque lancer » qu’on appelle A et qui s’exprime en fonction des Ak par A = A k . Remarquons que A est bien un
\
k=0
élément de T car c’est une intersection dénombrable de cylindres de T . Cette intersection est de plus décroissante
11
donc d’après le théorème de continuité décroissante, on a :
à !
∞
\
P(A) = P A k = lim P(A n ) = 0.
n→+∞
k=0
12