Cours Stat Prob Big Data
Cours Stat Prob Big Data
Un élément ω ∈ Ω est appelé une réalisation, c’est un résultat possible d’une expérience aléatoire.
Un sous-ensemble A ⊂ Ω est appelé un événement. C’est un ensemble de réalisations (par
exemple, celles qui vérifient une certaine condition). L’ensemble des événements est donc
l’ensemble P(Ω) des parties (ou sous-ensembles) de Ω.
Définition
Une probabilité sur Ω est une application P : P(Ω) → [0,1], définie sur les événements,
telle que
1. P(Ω) = 1
(v) Pour toute suite croissante (An)n d’événements (c’est-à-dire An ⊂ An+1 pour tout n),
(vi) Pour toute suite décroissante (An)n d’événements (c’est-à-dire An+1 ⊂ An pour tout n),
Pour simplifier, on suppose dans ce cours que tout ensemble de réalisations est un événement. En réalité,
ceci n’est plus possible dans le cas par exemple où Ω = [0,1] est muni de la probabilité uniforme car on ne
peut pas définir l’intégrale sur n’importe quel ensemble mais seulement sur des ensembles « mesurables ».
En pratique, ceci n’est pas une limitation car tous les ensembles que l’on utilise sont mesurables.
1
Néanmoins, pour définir rigoureusement la théorie des probabilités, on appellerait espace de probabilités
un triplet (Ω,A,P) où A est l’ensemble des événements, qui doit être une tribu sur Ω, c’est-à-dire un
S
ensemble de parties de Ω tel que a) Ω ∈ A, b) si A ∈ A alors Ac ∈ A, et c) si An ∈ A pour tout n ∈ N, alors n
An ∈ A; et P est uniquement définie sur A. Puis, sur R, on définirait la tribu borélienne, qui est la plus petite
tribu contenant les intervalles.
1.2 Cas élémentaire : équiprobabilité
On suppose que CardΩ = n, avec Ω = {ω1,ω2,...,ωn}.
Définition
La probabilité uniforme sur Ω (ou distribution équiprobable) est la probabilité P définie par :
pour tout A = {ωi1,ωi2,...,ωik} ⊂ Ω,
CardA
.
CardΩ
Rappels de dénombrement :
Proposition
Soit E un ensemble fini.
– Une permutation de E est une façon d’ordonner les éléments de E. Le nombre de
permutations d’un ensemble à n éléments est
n! = 1 × 2 × 3 × ··· × (n − 2) × (n − 1) × n.
.
– Une combinaison de k éléments de E est une façon de choisir k éléments de E, sans spécifier
d’ordre : c’est un sous-ensemble de E à k éléments.
Le nombre de combinaisons de k éléments parmi n éléments (où 0 ≤ k ≤ n) est
On peut dire aussi qu’un arrangement correspond à un tirage de k éléments un par un (et sans
remise) en mémorisant l’ordre de tirage, tandis qu’une combinaison correspond à un tirage de k
éléments simultanément.
2
Un arrangement de n éléments parmi n est une permutation, donc .
1.3 Probabilités conditionnelles
Définition
Soit B un événement tel que P(B) > 0. L’application P(·|B) : P(Ω) −→ [0,1] définie
par
pour tous i =6 j, Ai ∩ Aj = ∅, et .
Par exemple, pour tout événement B, le couple (B,Bc) est un système complet d’événements.
Théorème (Théorème des probabilités totales)
Soit(An )n un système complet d’événements. Pour tout événement
A,
3
1.4 Événements indépendants
Définition
Deux événements A et B sont indépendants si
P(A ∩ B) = P(A)P(B).
Proposition
Une famille (Ai)i d’événements est indépendante si pour toute sous-famille finie on a
= P(A)P(B)P(C).
En notant 1 pour Pile et 0 pour Face, chaque réalisation ω se représente par une suite de 0 et de 1
de longueur n : par exemple, ω = (1,0,1,1,...) si le premier tirage est Pile, le deuxième
Face, le troisième Pile, etc. Vu que les tirages sont indépendants, on a par exemple (ici, n = 4)
P({(1,0,1,1)}) = p × (1 − p) × p × p
et on voit qu’en général, si la séquence ω comporte k fois 1 (et donc n − k fois 0),
On vient de voir que, pour toute séquence ω ∈ Ak, P({ω}) = pk(1 − p)n−k. Par ailleurs, le nombre de
telles séquences est Card . On en déduit que
4
.
En notant X le nombre de fois où Pile est apparu, on dira plus tard que X est une variable aléatoire
qui suit la loi binomiale B(n,p).
Plus généralement, on peut bien sûr appliquer ce qui précède pour évaluer le nombre d’événements
réalisés parmi une suite de n événements indépendants B1,...,Bn ayant tous la même probabilité P(Bi)
= p : on pose Ak = {k événements exactement parmi B1,...,Bn se réalisent}.
Ci-dessus, on avait Bi = {le i-ième tirage est Pile}.
Soit X une variable aléatoire. La loi de X est la probabilité PX sur R définie par :
Définition
P X peut aussi être vue comme une probabilité sur X(Ω), ensemble des valeurs prises par X, aussi
appelé support de PX. On note parfois X ∼ PX pour indiquer que X suit la loi PX.
La seconde égalité est une nouvelle notation : on note {X ∈ B} l’événement formé des éventualités
Définition
Si A est un événement, on introduit la variable aléatoire fonction indicatrice de A,
A notée 1 , qui indique si l’événement A est réalisé :
pour tout
5
X X
PX(B) = P(X ∈ B) = P(X = x) = P(X = x).
x∈B∩X(Ω) x∈B
Pour caractériser une loi discrète, il suffit donc de se donner les probabilités élémentaires
Définition-Proposition
Soit E ⊂ R. Une famille (p(x))x∈E ∈ RE est une famille de probabilités élémentaires si
X
2. p(x) = 1.
x∈E
Dans ce cas, il existe une variable aléatoire X (sur un espace de probabilité (Ω,P)), à valeurs dans
E, de probabilités élémentaires pX = p, c’est-à-dire
pour tout B ⊂ R,
fDans
= ce
f . cas, il existe une variable aléatoire X (sur un espace de probabilité (Ω,P)) de densité
X
P(X = x) = 0.
R
De plus, si fX(x) = 0 pour tout x ∈ B, alors P(X ∈ B) = f (x)dx = 0. On en déduit
B X
6
2.3 Fonction de répartition
Définition
Soit X une variable aléatoire. La fonction de répartition de X est la fonction FX : R → R
Proposition
a) Soit X une variable aléatoire. Sa fonction de répartition FX est une fonction croissante,
b) Si X et Y sont deux variables aléatoires telles que FX(t) = FY (t) pour tout t ∈ R, alors X et Y
c) Si X est une variable aléatoire discrète, FX est une fonction constante par morceaux, dont les
sauts se situent aux points de X(Ω), et le saut en x ∈ X(Ω) a pour hauteur
P (X = x ).
pour tout
X
E[X] = xP(X = x).
x∈X(Ω)
Attention. L’espérance n’est pas toujours définie. Il faut pour cela que la série ou l’intégrale ci-
dessus converge absolument.
(i) Si X est constante, égale à c ∈ R (pour tout ω ∈ Ω, X(ω) = c), alors E[X] = E[c] = c.
7
Propriétés
(iii) L’espérance est linéaire : pour toutes variables aléatoires X et Y , et tout réel a,
Proposition
Soit X une variable aléatoire, et ϕ : R → R une fonction. – Si X
X
E[ϕ(X)] = ϕ(x)P(X = x).
x∈X(Ω)
L’écart type de
Attention. La variance n’est pas toujours définie. Il faut que l’espérance E[X] soit définie et que
l’espérance ci-dessus converge. Ceci revient à demander à ce que E[X2] converge.
NB. À la différence de la variance, l’écart type σ(X) est homogène à X : si par exemple X est une
distance, alors σ(X) est une distance aussi. Ceci justifie l’intérêt de l’écart type.
Propriétés
Pour toutes variables aléatoires X et Y et toute constante a,
1. Var(X) = E[X2] − E[X]2
2. Var(aX) = a2 Var(X)
3. Var(X + a) = Var(X)
4. Var(X + Y ) = Var(X) + 2Cov(X,Y ) + Var(Y ), où la covariance est définie par
Cov( .
8
Proposition
Pour toute variable aléatoire X possédant une variance, la variable aléatoire est
centrée (E[Y ] = 0) et réduite (Var(Y ) = 1).
mr(X) = E[Xr],
.
Proposition (Inégalité de Markov)
Soit X une variable aléatoire. Pour tout a> 0,
E |X |
P (|X |≥ a) ≤ .
a
Plus généralement, pour tout a > 0 et r> 0,
E |X |r
P (|X |≥ a) ≤ .
ar
Démonstration: On a toujours |X|r ≥ 0 et, si |X| ≥ a, alors |X|r ≥ ar. D’où ar1{|X|≥a} ≤ |X|r, ce qui donne, en prenant
l’espérance de chaque membre :
E[ar1{|X|≥a}] ≤ E[|X|r].
(X
Et E[ar1{|X|≥a}] = arP | | ≥ a), d’où résulte l’inégalité annoncée (r = 1 donne la première).
(où les virgules se lisent « et » : P(X1 ∈ B1,...,Xn ∈ Bn) = P({X1 ∈ B1}∩···∩{Xn ∈ Bn}))
9
Par exemple, deux variables aléatoires X et Y sont indépendantes si les événements qui ne
dépendent que de X sont indépendants des événements qui ne dépendent que de Y .
Proposition
Proposition
2. si leurs variances sont bien définies, alors on a Cov(Xi,Xj) = 0 pour tous i =6 j, d’où
E[f1(X1)···fn(Xn)] = E[f1(X1)]···E[fn(Xn)].
On rappelle que E est toujours linéaire : même si X1,...,Xn ne sont pas indépendantes,
10
Démonstration: Par linéarité de l’espérance, , et les variables sont
indépendantes donc
,
ce qui donne, en passant au complémentaire,
.
Comme le terme de droite converge vers 1 quand n → ∞, et que le terme de gauche est ≤ 1, on obtient
l’énoncé.
NB. Si (An)n≥1 est une suite d’événements indépendants et qui ont même probabilité p (par
exemple, dans une suite de tirages à Pile-ou-Face, An = {le n-ième tirage est Pile} ), alors
en posant Xi = 1Ai, on a
+
Xn = 1A1 ··· + 1An = nombre d’événements réalisés parmi A1,...,An n n
donc Xn est la fréquence de réalisation des événements A1,...,An, et la loi des grands nombres
montre que, si n est grand, cette fréquence a de grandes chances d’être proche de E[X1] = p, qui
est la probabilité commune des événements An. Ainsi, la fréquence d’apparition de Pile dans une
suite de tirages à Pile-ou-Face indépendants converge vers . Ou, si la pièce est biaisée, vers la
probabilité d’obtenir Pile à un tirage.
3 Lois usuelles
3.1 Loi de Bernoulli de paramètre p, B(p)
C’est la loi d’une variable aléatoire X qui ne peut prendre que 2 valeurs, notées 1 et 0, et p ∈ [0,1]
est la probabilité de la valeur 1 :
P(X = 1) = p et P(X = 0) = 1 − p.
C’est donc la loi de la fonction indicatrice 1A d’un événement A tel que P(A) = p.
On a
E[X] = p et Var(X) = p(1 − p).
11
La loi binomiale B(n,p) est la loi de la variable aléatoire Sn = X1 + X2 + ··· + Xn. C’est donc la loi du
nombre d’événements parmi A1,...,An qui sont réalisés, si A1,...,An sont indépendants et de même
probabilité p. (Ci-dessus, Xn = 1An)
Sn est à valeurs dans {0,1,...,n} et on a (cf. chapitre 1)
pour .
De plus
et pour tout .
On a
E[X] = λ et Var(X) = λ .
C’est la « loi des petites probabilités » car la loi limite de la loi binomiale B(n,p), avec np ∼ λ :
pour tout .
Dans la pratique, on peut approcher la loi binomiale par une loi de Poisson lorsque
n ≥ 50, p ≤ 0,1 et λ = np ≤ 15.
3.4 Loi géométrique de paramètre p, G(p)
Soit p ∈]0,1[. Soit (Xn)n≥1 une suite de variables aléatoires indépendantes et de même loi B(p).
12
C’est donc la loi du premier instant n tel que An est réalisé, si (An)n≥1 est une suite d’événements
indépendants et de même probabilité p. (Ci-dessus, Xn = 1An)
N est à valeurs dans N∗ et on a pour k ∈ N∗, P(N = k) = P(X1 = 0,X2 = 0,...,Xk−1 = 0,Xk = 1) = (1 −
p)k−1p.
On a et .
si a ≤ x ≤ b si x /∈ [a,b].
Une variable aléatoire X de loi U([a,b]) est donc à valeurs dans [a,b] et sa fonction de répartition
est donnée par :
pour tout ,
pour tout x < a, FX(x) = 0 et, pour tout x > b, FX(x) = 1.
On a et .
f(x) = λe−λx1R+(x).
Une variable aléatoire X de loi E(λ) est donc à valeurs dans R + et sa fonction de répartition est
donnée par :
pour tout
et, pour tout x < 0, FX(x) = 0 .
On a
pour tout ,
La loi exponentielle est une loi « sans mémoire ». En effet, pour tous s,t ≥ 0,
13
en utilisant le fait que l’événement {X ≥ s + t} est inclus dans l’événement {X ≥ s}.
3.7 La loi normale de moyenne m et variance σ2, N(m,σ2)
La loi normale centrée (m = 0) réduite (σ = 1), notée N(0,1), est la loi de densité
Lorsque X suit une loi normale, on dit que X est une variable aléatoire gaussienne.
Proposition
Toute combinaison linéaire de variables aléatoires gaussiennes indépendantes est une variable
aléatoire gaussienne.
Plus précisément, si X1,...,Xn sont indépendantes et Xi ∼ N(mi,σi2) alors, pour tous2 a ,...,a ∈ R, la
variable
1
aléatoire X = a1X1 + ··· + anXn suit la loi N(M,Σ ), où
n
et .
R2 qui vérifie :
pour tous A,B ⊂ R, P(X,Y )(A × B) = P(X ∈ A, Y ∈ B).
14
La loi du couple contient davantage d’information que PX et PY : elle indique aussi la façon dont les
variables dépendent l’une de l’autre (connaître X peut renseigner sur Y ).
Cas de deux variables discrètes. Si X et Y sont discrètes alors la loi de (X,Y ) est donnée par les
probabilités élémentaires :
X X p(X,Y )(x,y) = 1.
x∈X(Ω) y∈Y (Ω)
X X
pour tout x ∈ X(Ω), pX(x) = P(X = x) = P(X = x,Y = y) = p(X,Y )(x,y),
y∈Y (Ω) y∈Y (Ω)
X X
pour tout y ∈ Y (Ω), pY (y) = P(Y = y) = P(X = x,Y = y) = p(X,Y )(x,y).
x∈X(Ω) x∈X(Ω)
NB. X et Y sont indépendantes si, et seulement si p(X,Y )(x,y) = pX(x)pY (y) pour tous x,y.
Cas où P(X,Y ) a une densité. On dit que le couple (X,Y ) a une densité s’il y a une fonction f(X,Y ) : R2 →
R telle que
ZZ
⊂,
pour tout DR 2
P(X,Y )(D) = f(X,Y )(x,y)dxdy.
D
f(X,Y ) est appelée la densité du couple (X,Y ). Alors f(X,Y )(x,y) ≥ 0 pour tous x,y ∈ R, et
Z Z f(X,Y )(x,y)dxdy = 1.
RR
En particulier,
pour tous
On déduit les lois marginales de la loi du couple et, dans le cas indépendant, on déduit la loi du
couple des lois marginales :
Proposition
1. Si (X,Y ) a pour densité f(X,Y ), alors X et Y ont des densités fX et fY données par
15
2. Si X et Y ont des densités fX et fY et sont indépendantes, alors (X,Y ) a pour densité
Cas où X et Y sont discrètes. Étant donné x ∈ X(Ω), la loi conditionnelle de Y sachant X = x est la
pour tout .
Cas où P(X,Y ) a une densité. Étant donné x ∈ R tel que fX(x) > 0, la loi conditionnelle de Y sachant X =
Ainsi, si C ⊂ B,
ZZ
∈ )C) = P((X,Y )ϕ∈(C)) =
P((U,V −1
f(X,Y )(x,y)dxdy
ϕ−1(C)
16
ZZ
= f(X,Y )(ϕ−1(u,v))|Jacϕ−1(u,v)|dudv.
C
Il est parfois plus simple, pour effectuer le changement de variable, de calculer plutôt
dudv = |Jacϕ(x,y)|dxdy
tout x ∈ R, y 7→ h(x,y) est strictement croissante, ou strictement décroissante (ou que ∂h∂y = 06 ).
on remplace y par son expression en fonction de z (il faut h(x,y) = z), et on en déduit la loi de la
marginale Z par la formule usuelle :
Z
fZ(z) = f(X,Z)(x,z)dx.
R
17
5 Estimation
5.1 Principe, statistiques classiques
Définition
Soit X une variable aléatoire. Un échantillon de taille n de X est une famille X1,...,Xn de n variables
aléatoires indépendantes et de même loi que X.
On souhaite étudier la loi de X. Par exemple, X est la taille en centimètres d’un individu choisi
uniformément dans la population adulte française. Son espérance est donc la taille moyenne d’un
Français adulte, que l’on peut vouloir estimer.
On ne dispose pour cela que d’une réalisation d’un échantillon de taille n : une réalisation (x1,...,xn)
∈ Rn de n variables aléatoires indépendantes (X1,...,Xn) qui ont la même loi que X. À défaut de
pouvoir mesurer toute la population, ce qui serait long, coûteux et compliqué, on se contente de
mesurer la taille de n personnes choisies au hasard parmi les Français adultes. L’objectif de
l’estimation statistique consiste donc à déduire certaines propriétés de la loi de X (son espérance,
sa variance, ses paramètres...) à partir d’un échantillon de valeurs X1,...,Xn.
Statistiques simples. Les quantités les plus classiques pour décrire un échantillon sont – la
moyenne empirique :
– la variance empirique :
.
Proposition
Si X a pour espérance m et pour écart type σ, alors
5.2 Estimateurs
On suppose que X suit une loi Pθ qui dépend d’un paramètre θ ∈ Θ, où Θ ⊂ R est l’ensemble des
18
Définition
Un estimateur de θ est une variable aléatoire qui dépend d’un échantillon
X1,...,Xn de X. On utilise souvent la notation θ pour un estimateur de θ.
Une estimation de θ est la valeur réelle tn = f(x1,...,xn) prise par une réalisation particulière de
l’échantillon.
NB. La définition d’estimateur peut paraître curieuse à plusieurs titres. On note que n n’apparaît
pas dans l’appellation « estimateur de θ » mais apparaît dans la définition. En fait, un estimateur
peut être vu comme une suite (Tn)n de variables aléatoires où Tn dépend de X1,...,Xn, et on utilisera
la variable Tn adaptée à la taille de l’échantillon dont on dispose. De plus, θ n’apparaît pas dans la
définition : n’importe quelle fonction de X1,...,Xn est donc un estimateur de θ. En revanche θ
intervient pour mesurer la qualité de l’estimateur : Définition
Soit T un estimateur de θ.
Le biais de Tn est la différence E[Tn] − θ.
n
On dit que Tn est sans biais si E[Tn] = θ, quel que soit θ ∈ Θ.
pour tout .
Proposition
Tout estimateur asymptotiquement sans biais dont la variance tend vers 0 est convergent.
Définition
.
On dit que l’estimateur Sn est meilleur que Tn si, quel que soit θ,
RSn(θ) ≤ RTn(θ).
Par l’inégalité de Markov, un estimateur dont le risque quadratique tend vers 0 (quel que soit θ)
est convergent.
NB. Si Tn est sans biais, alors RTn(θ) = Var(Tn).
5.3 Construction d’estimateurs
Méthode des moments Le principe est d’utiliser la loi des grands nombres pour estimer les
moments, et d’utiliser ensuite ces estimateurs des moments pour estimer θ. Par la loi des grands
nombres, on a :
Proposition
Soit X une variable aléatoire d’espérance m et de variance σ2.
1. La moyenne empirique est un estimateur sans biais et convergent de m.
19
2. La variance empirique est un estimateur asymptotiquement sans biais et convergent de σ
2
, et la variance empirique modifiée est un estimateur sans biais et convergent
2
de σ .
3. Pour tout r > 0, le moment empirique d’ordre r,
est un estimateur sans biais et convergent de mr = E[Xr]. (Si mr est bien défini)
On en déduit la méthode des moments : exprimer (si possible) θ à l’aide des moments (mr)r>0, puis
remplacer dans cette expression les moments par les moments empiriques. Ceci fournit un
estimateur convergent de θ. L’expression peut aussi faire intervenir σ2, que l’on remplace par
Sn2 ou Σ2n.
En pratique, on calcule E[X], E[X2], etc., jusqu’à obtenir une expression faisant intervenir θ
(souvent, E[X] suffit), et on inverse pour obtenir θ en fonction de E[X], E[X2],etc. Il ne reste
plus qu’à remplacer m1 = E[X] par Xn, m2 = E[X2] par m2, etc. b
Méthode du maximum de vraisemblance Le principe est d’estimer θ par la valeur qui maximise la
densité du vecteur (X1,...,Xn).
Définition
La vraisemblance de l’échantillon (X1,...,Xn) est la fonction L définie par :
– si X est discrète, de probabilité élémentaire Pθ, pour tous x1,...,xn,
Un estimateur du maximum de vraisemblance (ou EMV) pour θ est un estimateur h(X ,...,Xn) tel
que, pour toutes les valeurs x1,...,xn ∈ X(Ω),
20
NB. Pour tous x1,...,xn, h(x1,...,xn) est la, ou l’une des valeurs de θ où L(x1,...,xn;θ) est maximum. Ceci
définit l’estimation (pratique). L’estimateur est la variable aléatoire h(X1,...,Xn). Sous des hypothèses
assez générales, on montre que ceci définit un bon estimateur convergent.
Pour le calcul, on est amené à maximiser L(x1,...,xn;θ) selon θ. Vu que le logarithme est strictement
croissant, c’est équivalent à maximiser la log-vraisemblance ln(L(x1,...,xn;θ)), souvent plus pratique.
La dérivée étant nulle au maximum, ceci mène à chercher θ tel que
.
C’est l’équation de la vraisemblance.
21
Dans la pratique on applique ce résultat dès que n est suffisamment grand (n ≥ 30).
P(−a ≤ Z ≤ a) = 1 − α
ce qui se réécrit
Si xn est la moyenne observée et la variance corrigée observée, en posant et
, on en déduit que [π1,π2] est un intervalle de confiance de m de niveau 1 − α.
Intervalle de confiance pour une proportion p. Ici X est une variable aléatoire de Bernoulli de
paramètre p, d’où E[X] = p et Var(X) = p(1 − p).
On a, pour n grand,
−
et l’intervalle de confiance pour p de niveau 1 − α précédent est donc
Remarques.
1. Attention : pour que ces approximations soient justifiées, les valeurs de nπ1, nπ2, n(1−π1) et
22
5.5 Application aux tests de différence
On souhaite, à partir de l’échantillon observé x1,...,xn, savoir si l’on peut raisonnablement conclure
qu’une certaine hypothèse sur la loi de X est fausse (en vue de prendre une décision). L’hypothèse
est appelée hypothèse nulle, et notée H0. C’est une hypothèse que l’on veut avoir « peu de chance
» de rejeter si elle est vraie (erreur de première espèce). Le seuil de risque du test est
d’où
.
Comme p est l’estimation associée à Xn, ceci conduit au test suivant, qui a un seuil de risque de 5%
: si
NB : Si le test est faux, on ne peut pas conclure que la proportion est π, mais simplement que
l’échantillon ne permet pas d’exclure que la proportion est π. On utilise ce test pour détecter (avec
grande probabilité) les cas où la proportion n’est pas conforme à π. Par exemple pour vérifier si un
fabricant fournit bien des pièces qui ont une précision donnée, ou des médicaments qui ont une
certaine efficacité, etc.
23
alors on rejette l’hypothèse H0. C’est un test dont le seuil de risque est 5%.
Si l’hypothèse est rejetée, on peut donc conclure que la moyenne n’est pas µ, et on se trompe dans
seulement 5% des cas.
24
Université Paris 13 — Institut Galilée Année universitaire 2013–2014
Fiches d’exercices
UniversitØ Paris 13, Institut GalilØe CCS ProbabilitØs & Statistiques
AnnØe universitaire 2013 2014
Exercice 1.
Combien de nombres peut-on former avec les chi res 0, 1, 2, 3, 4, 5, 6 et 7, en tenant compte de
l’ensemble des contraintes suivantes : • chaque nombre est composØ de chi res di Ørents;
• chaque nombre commence par un 7;
• chaque nombre est divisible par 5,
1. si les nombres sont de 8 chi res?
2. si les nombres sont de 6 chi res?
Exercice 2.
Un ensemble de dØlØguØs, composØ de 6 Øtudiants d’informatique, de 7 Øtudiants
d’ØnergØtique et de 5 Øtudiants de tØlØcom, doit Ølire un comitØ reprØsentatif formØ de 2
Øtudiants d’informatique, 2 de tØlØcom et de 2 d’ØnergØtique . Quel est le nombre de comitØs
possibles si :
1. les 18 ØlŁves sont Øligibles?
2. un Øtudiant d’ØnergØtique est Ølu d’o ce?
3. 2 Øtudiants d’informatique ne sont pas Øligibles?
Exercice 3.
Bruno et Alain jouent avec deux dØs. La rŁgle du jeu est la suivante :
• Bruno joue le premier, et gagne s’il fait un double;
• sinon, Alain joue, et gagne si la somme des chi res tirØs est impaire;
• si aucun d’eux n’a gagnØ, on joue un deuxiŁme tour dans les mŒmes conditions, et ainsi de
suite.
Calculer la probabilitØ de succŁs des deux joueurs pour chacun des tours successifs, puis
globalement. Discuter les rØsultats obtenus.
Exercice 4.
Les trois ls de Ken, au cours d’une partie de chasse, aper oivent un superbe faisan huppØ se
percher sur la ligne Ølectrique alimentant leur ferme. Ils tirent tous les trois en mŒme temps. Les
tirs de chasseurs di Ørents sont supposØs indØpendants, et chacun d’eux tire une fois et une seule.
On admet que chaque chasseur a une chance sur deux de tuer le volatile, et une chance sur cinq
de couper le l, ces deux ØvØnements Øtant Øgalement supposØs indØpendants. 1. Quelle est la
probabilitØ pour chaque chasseur
• de tuer le faisan et de couper le l?
• de tuer le faisan ou de couper le l? ( ou inclusif)
• de tuer le faisan ou de couper le l, mais pas les deux? (ou exclusif)
2. Calculer la probabilitØ de ne pas Œtre obligØ de d ner le soir aux chandelles (en d’autres termes
: quelle est la probabilitØ que le l ne soit pas coupØ?).
3. Quelle est la probabilitØ pour le faisan ait re u :
1
• aucune balle?
• exactement deux balles?
• au moins deux balles?
• au plus deux balles?
• exactement une balle?
4. Montrer que les deux ØvØnements le l est coupØ et le faisan est mort sont indØpendants.
Suggestion : on pourra montrer que les ØvØnements complØmentaires le sont.
5. En dØduire la probabilitØ de dØguster le soir le faisan aux chandelles, aprŁs l’avoir fait r tir
dans la cheminØe puisque le four Ølectrique ne fonctionne plus.
Exercice 5.
Une population est composØe de 40% d’hommes et de 60% de femmes. Dans cette population,
50% des femmes et 30% des hommes lisent plus de 10 romans par an. Quelle est la probabilitØ
pour qu’un lecteur de plus de 10 romans par an, choisi au hasard, soit un homme?
Exercice 6.
Lors d’une brŁve conversation vous apprenez d’un homme qu’il a deux enfants dont au moins une
lle. Quelle est la probabilitØ pour qu’il ait deux lles?
Exercice 7.
Deux usines fabriquent les mŒmes piŁces. La premiŁre en produit 70% de bonnes et la deuxiŁme
90%. Les deux usines fabriquent la mŒme quantitØ de piŁces.
1. Quel est le pourcentage de bonnes piŁces sur l’ensemble du marchØ, supposØ alimentØ par les
deux usines?
2. On achŁte une piŁce, elle est bonne; quelle est la probabilitØ pour qu’elle provienne de la
deuxiŁme usine?
3. MŒmes questions lorsque la premiŁre usine produit 2,5 fois plus que la deuxiŁme.
Exercice 8.
Un antiquaire possŁde trois co res C1, C2, C3. Ces co res ont chacun deux tiroirs et dans chacun de
ces 6 tiroirs, il y a une piŁce de monnaie. Dans le co re C1, il y a 2 piŁces d’or, dans le co re C2, il y a
2 piŁces d’argent, dans le co re C3, il y a 1 piŁce d’or et 1 piŁce d’argent.
1. On ouvre un des six tiroirs au hasard et on trouve une piŁce en argent. Quelle est la
probabilitØ pour que cette piŁce vienne du co re C2 ?
2. On recommence l’expØrience et on trouve une deuxiŁme fois une piŁce en argent. Quelle
est la probabilitØ pour que l’on ait ouvert deux fois le mŒme co re?
Exercice 9.
Le directeur d’un centre de loisirs ouvert aux adultes et adolescents de plus de 15 ans s’interroge
sur la nØcessitØ de recruter un moniteur de planche voile. Il dØcide de le faire si la proportion des
personnes choisissant cette activitØ est supØrieure 15%.
Une Øtude de la frØquentation du centre sur l’annØe prØcØdente a montrØ que les activitØs
choisies par les adultes ( ge ≥ 18 ans) frØquentant ce centre se rØpartissent entre : 50% pour le
tennis, 40% pour les sports nautiques et 10% pour l’Øquitation. Parmi les adultes ayant choisi les
sports nautiques, un quart fait de la planche voile.
1. DØterminer quelle est la proportion d’adultes ayant choisi la planche voile.
Le groupe des adolescents (15 ≤ ge < 18) a pour sa part des activitØs qui se rØpartissent entre :
55% pour le tennis, 40% pour les sports nautiques (dont la moitiØ pour la planche voile), 5%
pour l’Øquitation.
2. DØterminer parmi les adolescents la proportion de ceux qui font de la planche voile.
2
3. Sachant qu’une personne sur 5 frØquentant ce centre est un adolescent, dØterminer la
proportion π0 des usagers (adultes et adolescents confondus) faisant de la planche voile. Le
directeur du centre va-t-il recruter un moniteur spØcialisØ?
Exercice 10.
Un modŁle simpli Ø d’Øvolution du prix d’une action suppose que chaque jour le prix de l’action
grimpe de 1 euro avec une probabilitØ p (0 < p < 1) et descend de 1 euro avec une probabilitØ 1 −
p. L’Øvolution d’un jour donnØ est indØpendante de l’Øvolution des jours passØs.
1. Quelle est la probabilitØ qu’aprŁs 2 jours le prix de l’action soit celui du premier jour?
2. Quelle est la probabilitØ qu’aprŁs 3 jours le prix de l’action ait grimpØ d’un euro?
3. Sachant qu’aprŁs 3 jours le prix de l’action a grimpØ d’un euro, quelle est la probabilitØ que le
mouvement du premier jour ait ØtØ une hausse?
Exercice 11.
Maryse joue un jeu tØlØvisØ. Elle a, face elle, trois portes (A, B et C) identiques. DerriŁre l’une
d’elles se trouvent 5000 euros et derriŁre les deux autres rien du tout.
Maryse choisit une des portes (la porte A par exemple). L’animateur, qui conna t la porte gagnante,
ouvre une autre porte (disons la C) et lui montre qu’il n’y a rien derriŁre. Il demande alors Maryse
si elle maintient son choix ou si elle prØfŁre la porte B. Quel choix donne Maryse la plus grande
probabilitØ de gagner? Justi ez votre rØponse.
Exercice 12.
On considŁre un avion de 50 places. La probabilitØ pour qu’un voyageur ayant rØservØ ne se
prØsente pas l’embarquement est de 20% . Un jour la compagnie a enregistrØ 52 rØservations.
Quelle est la probabilitØ pour qu’elle se trouve dans une situation embarrassante?
Exercice 13.
En tant qu’ingØnieur, on sollicite votre avis sur un projet de lancement d’une fusØe. Le moteur et
l’Øquipement Ølectronique se composent de 1 500 000 piŁces distinctes. Chaque piŁce a une
chance sur dix millions de se rØvØler dØfectueuse. On prØcise que la dØfectuositØ d’une seule
piŁce su t mettre le projet en Øchec, et que les causes de dØfectuositØ de chacune des piŁces sont
statistiquement indØpendantes. Qu’en pensez-vous?
Exercice 14.
Un nouveau test de dØpistage d’une maladie rare, touchant environ une personne sur 100000,
vient d’Œtre mis au point. Pour tester sa validitØ, on a e ectuØ un test statistique : sur 534 sujets
sains, le test a ØtØ positif 1 seule fois, et, sur 17 sujets malades, il a ØtØ positif 16 fois. Une
personne e ectue ce test; le rØsultat est positif. Quelle est la probabilitØ pour qu’elle soit atteinte
par cette maladie?
Au vu de ces rØsultats, peut-on commercialiser le test?
Exercice 15.
La probabilitØ pour que l’injection d’un vaccin un individu choisi au hasard provoque une rØaction
allergique est de 0,1%. Quelle est la probabilitØ pour que, sur 900 individus vaccinØs, on observe
l’allergie dans :
1. exactement trois cas?
2. au plus trois cas?
3. au moins trois cas?
Exercice 16.
3
Un systŁme de communication est constituØ de n composants qui fonctionnent indØpendamment
les uns des autres avec une probabilitØ pour chacun d’entre eux de p ∈]0,1[. Le systŁme est
opØrationnel dŁs qu’au moins la moitiØ de ses composants fonctionnent. Pour quelles valeurs de p
un systŁme 5 composants a une plus forte probabilitØ d’Œtre opØrationnel qu’un systŁme 3
composants?
4
UniversitØ Paris 13, Institut GalilØe CCS ProbabilitØs & Statistiques
AnnØe universitaire 2013 2014
Exercice 1.
Le trousseau de clØs d’un gardien de nuit comporte dix clØs, dont une seule ouvre la porte du
poste de garde. Pour qu’il y pØnŁtre, il y a deux scØnarios possibles :
• Cas A : il prend une clØ au hasard, l’essaie, la met de c tØ si elle n’ouvre pas, et ainsi de suite. •
Cas B : il prend une clØ au hasard, l’essaie, mais la laisse sur le trousseau si elle n’ouvre pas, et ainsi
de suite.
On dØsigne respectivement par XA et XB les variables alØatoires Øgales aux nombres d’essais (y
compris le bon) avant le succŁs, dans le premier et le second scØnarios.
DØterminer la loi de probabilitØ et la fonction de rØpartition de XA et de XB.
Calculer E[XA] et E[XB].
Le gardien utilise la mØthode B un jour sur trois. Un jour, aprŁs avoir essayØ 8 clØs, il n’a toujours
pas ouvert la porte. Quelle est la probabilitØ pour qu’il ait utilisØ la mØthode B ?
Exercice 2.
On considŁre une fonction F dØ nie par
si x ≤ −1, si x
a ∈] − 1,1[ si x
≥ 1.
F(x) = bx + c
d
1. DØterminer les valeurs de a, b, c et d pour que F soit une fonction de rØpartition d’une variable
alØatoire densitØ.
2. ReprØsenter graphiquement F.
3. DØterminer la densitØ de probabilitØ associØe F.
Exercice 3.
Soit f la fonction de R dans R+ dØ nie par
x = (x − 1) + 1 , x2 = (x − 1)2 + 2(x − 1) + 1 .
Exercice 4.
1
Dans l’urne du bureau de vote du quartier Saint-Roman Roquebrune (06), les Ølecteurs ont
dØposØ, l’occasion de l’Ølection prØsidentielle, N bulletins de vote, dont S pour le candidat des
verts. Le prØsident du bureau extrait successivement, sans les remettre, n bulletins de l’urne.
On dØsigne par X la variable alØatoire Øgale au nombre de bulletins verts sur les n.
Remarque : pour que le calcul qui suit ait un sens, on est amenØ supposer que la taille n de
l’Øchantillon extrait de l’ensemble des bulletins est su samment petite pour que n < S.
1. Montrer que X suit la loi hypergØomØtrique :
pour .
2. VØri er la normalisation de cette loi. Pour cela, on pourra dØvelopper les deux membres de
l’identitØ :
(1 + x)N = (1 + x)S (1 + x)N−S
E[X] = np et
oø p dØsigne la proportion de bulletins verts : S = pN.
Exercice 5.
On considŁre une variable alØatoire rØelle X dont la fonction de rØpartition FX(x) est donnØe par
(
0 si x < 0
F x
si x ≥ 0.
1. FX(x) est-elle continue sur R?
2. DØterminer limx→+∞ FX(x). InterprØtation?
3. Calculer la densitØ de probabilitØ fX(x). Quel est le mode de X ? (C’est- -dire la valeur x
oø fX(x) est maximale)
4. Calculer l’espØrance et l’Øcart-type de X.
5. DØduire de ce qui prØcŁde les variations et la courbe reprØsentative de FX(x).
6. Calculer P(1 ≤ X < 2).
Exercice 6.
Soit T une variable alØatoire, de densitØ de probabilitØ fT donnØe par :
Exercice 7.
2
Soit U une variable alØatoire de loi uniforme sur [0,1] (sa densitØ de probabilitØ, fU est dØ nie par
fU(x) = 1[0,1](x)). On pose
.
On note FX la fonction de rØpartition de X et fX sa densitØ de probabilitØ.
1. Rappeler la fonction de rØpartition FU(u) = P(U ≤ u), pour u ∈ R, de la variable alØatoire U. 2.
DØterminer la fonction de rØpartition FX et la densitØ de probabilitØ de la variable alØatoire X.
3. Quelle est la loi de X ? Donner les valeurs de E[X] et Var(X). On rappelle que, pour tout n ∈ N,
.
Exercice 8.
On cherche comparer l’e cacitØ de deux mØthodes pour rØaliser dans un dØlai trŁs court un contr
le mØdical sur 1000 personnes.
Ce contr le utilise un prØlŁvement sanguin et doit permettre de dØterminer la prØsence ou
l’absence d’un virus dont on sait qu’il atteint un individu donnØ avec la probabilitØ 0,01. MØthode
A : On teste sØparØment les 1000 personnes; ce qui conduit rØaliser 1000 analyses. MØthode B :
On rØpartit les 1000 individus en n groupes de r personnes (avec nr = 1000). Pour chaque groupe,
on mØlange ensemble les prØlŁvements sanguins e ectuØs sur les r personnes du groupe et on
analyse le mØlange. Si le rØsultat est positif pour un groupe, alors on analyse sØparØment le sang
des r personnes qui composent ce groupe. Donc si y est le nombre de groupes positifs, la mØthode
B conduit faire n + ry analyses.
1. tude de la mØthode B.
a) Quelle est la probabilitØ q pour qu’un groupe de r personnes soit nØgatif? En dØduire la
probabilitØ p pour qu’un groupe de r personnes soit positif. Donner en fonction de p et q la loi
de probabilitØ et l’espØrance de la variable alØatoire
.
2. Comparaison des deux mØthodes.
Montrer que l’on peut trouver des valeurs de r pour lesquelles la mØthode B est meilleure que la
mØthode A. Pour quelle valeur de r la mØthode B est-elle optimale? Pour cette valeur, quel est le
nombre moyen d’analyses e ectuØes?
Exercice 9.
Chaque page du site web de l’institut GalilØe comporte un grand nombre de caractŁres, et un gros
e ort a ØtØ fait pour Øviter coquilles et autres erreurs. On constate cependant qu’on y trouve en
moyenne trois fautes toutes les deux pages. DØterminez la probabilitØ pour que la page que vous
Œtes en train de consulter prØsente au moins trois fautes.
Exercice 10.
3
Le nombre de connexions par jour au site web de l’institut GalilØe est une variable poissonnienne
de paramŁtre c. Chaque connexion peut provenir d’un ordinateur ou d’un smartphone. On note p
la probabilitØ pour qu’elle provienne d’un ordinateur. DØterminer la loi suivie par le nombre de
connexions par jour Øtablies partir d’un ordinateur.
Exercice 11.
Un avion peut transporter 100 passagers et leurs bagages. Il pŁse sans les passagers mais avec
l’Øquipage et le carburant 120 tonnes. Les consignes de sØcuritØ interdisent le dØcollage si le
poids de l’appareil dØpasse 129,42 tonnes.
Les 100 places ont ØtØ occupØes. Le poids d’un voyageur suit une loi d’espØrance 70 kg et d’Øcart
type 10 kg. Le poids de ses bagages suit une loi d’espØrance 20 kg et d’Øcart type 10 kg. Toutes
ces variables sont supposØes indØpendantes.
1. Calculer l’espØrance du poids de l’avion au dØcollage. Est-elle conforme aux normes de
sØcuritØ?
2. Calculer l’Øcart type du poids total de l’appareil.
3. En utilisant l’inØgalitØ de BienaymØ-Tchebychev, trouver un majorant de la probabilitØ pour
que le poids rØel de l’appareil au dØcollage dØpasse 129,42 tonnes.
Exercice 12.
1. Soient X et Y deux variables alØatoires indØpendantes de lois de Poisson respectives P(λ) et
P(µ).
a) Soit n un entier strictement positif. En remarquant que
,
montrer que X + Y suit une loi de Poisson de paramŁtre λ + µ. b)
Calculer, pour k = 0,1,...,n,
.
2. Application :
Soit deux Øchantillons d’articles produits en sØrie. On sait que les nombres X et Y d’articles
dØfectueux dans chacun des deux Øchantillons suivent respectivement des lois de Poisson P(2) et
P(3). On rØunit les deux Øchantillons. Sachant que le nombre total d’articles dØfectueux est 3,
quelle est la probabilitØ de l’ØvØnement {X ≤ 1}?
Exercice 13.
Soit Y une variable alØatoire de loi E(1/2). On appelle g sa densitØ (la rappeler) et G sa fonction
de rØpartition.
On Øtudie la loi d’une variable alØatoire X telle que Y = X2 et dont la densitØ f est paire. On appelle
F sa fonction de rØpartition.
1.En Øcrivant que pour tout a > 0 on a
√ √
P(0 ≤ Y ≤ a) = P(− a ≤ X ≤ a) ,
4
montrer que √ √
G(a) − G(0) = F( a) − F(− a) .
√
2.En dØduire la valeur de f( a) pour tout a > 0, puis que
pour tout .
3. Soit n > 1. On note Yn la variable alØatoire Øgale au rang d’apparition de la n-iŁme boule
blanche.
a) Quelles sont les valeurs prises par Yn ?
b) AprŁs avoir remarquØ que, pour tout k ≥ n,
Exercice 15.
On pose pour tout a > 0,
5
2. Le nombre d’appels re us par un standard tØlØphonique pendant une durØe t (t > 0) est une
variable alØatoire Xt suivant une loi de Poisson de paramŁtre λt oø λ est un rØel strictement
positif.
Soit Yn le temps d’arrivØe du n-iŁme appel ( partir de t = 0). a)
Remarquer que P(Y1 > t) = P(Xt = 0).
En dØduire que Y1 suit une loi exponentielle E(λ).
b) Plus gØnØralement, calculer P(Yn > t) en utilisant la variable alØatoire Xt. En
dØduire que la fonction de rØpartition de Yn est :
si t ≥ 0, Fn(t) = 0 sinon,
puis que Yn suit une loi Gamma dont on donnera les paramŁtres.
Exercice 16.
On cherche caractØriser deux sources photoniques par la valeur moyenne λ du nombre de
photons Ømis par unitØ de temps. Le nombre de photons Ømis par unitØ de temps suit une loi de
Poisson.
On sait que les sources appartiennent deux familles distinctes (F0,F1) associØes aux paramŁtres λ0
et λ1. Par ailleurs on sait qu’une source sur 10 est une source F1.
1. Donner les probabilitØs P(k | F0) et P(k | F1) d’observer k photons sachant que la source
provient de la famille F0 ou F1 respectivement.
2. Calculer en fonction de λ0 et λ1 la probabilitØ P(k) d’observer k photons en prenant une source
au hasard.
3. On a observØ k photons. Calculer la probabilitØ P(F0 | k) que la source observØe soit une
source F0. De mŒme calculer P(F1 | k) .
On dØcide que la source observØe appartient la famille F1 si P(F1 | k) > P(F0 | k).
4. Montrer que cette rŁgle de dØcision conduit choisir F1 si
.
5. En dØduire une rŁgle de dØcision permettant de choisir directement F0 ou F1 suivant le nombre
k de photons observØs.
Application numØrique : λ0 = 1, λ1 = 4.
Exercice 17.
Le conseil d’administration d’une banque dØcide d’organiser sa gestion de maniŁre ce qu’il y ait
999 chances sur 1000 de toujours pouvoir faire face aux demandes de retrait de ses clients. La
banque a 1000 clients, le dØp t de chaque client est de 1000 euros. La probabilitØ pour qu’un
client retire son argent un jour donnØ est 0,001. Dans ces conditions, combien la banque doit-elle
conserver de liquiditØs journaliŁres pour suivre le principe de gestion qui a ØtØ posØ? (On pourra
utiliser une loi de Poisson.)
Exercice 18.
On lance une piŁce de monnaie n fois.
1.Soit X la variable alØatoire Øgale au nombre de piles obtenus. Quelle est la loi de probabilitØ
suivie par X ? PrØciser son espØrance m et sa variance σ2 en fonction de n.
2. Soit la proportion de piles obtenus. DØterminer E[Y ] et Var(Y ).
3. En utilisant l’inØgalitØ de BienaymØ-Tchebychev, dØterminer un nombre de lancers n tel que
P(0,4 < Y < 0,6) ≥ 90%.
6
Exercice 19.
Une variable alØatoire X suit une loi normale N(m(λ),1) oø λ est un paramŁtre prenant les valeurs
0, 1, 2 avec les probabilitØs
P(λ = 0) = a P(λ = 1) = 1 − 2a P(λ = 2) = a,
et la moyenne de X est donnØe par m(λ) = λ − 1.
1. Quelles sont les conditions sur a pour que le support de la loi de λ soit {0,1,2}? 2. Soit
Z une variable alØatoire de loi normale centrØe rØduite. Soit x ∈ R. On pose
β(x) = P(Z > x).
DØterminer en fonction de β(x) les probabilitØs
P(Z < x), P(Z < −x), P(|Z| < x), P(0 < Z < x).
3. La table de la loi gaussienne centrØe rØduite donne les valeurs de Φ(x) = P(Z < x). DØduire de
la table les valeurs β(0), β(1) et β(2).
4. Calculer, en fonction de a, la probabilitØ P(−1 < X < 1).
7
UniversitØ Paris 13, Institut GalilØe CCS ProbabilitØs & Statistiques
AnnØe universitaire 2013 2014
Exercice 1.
On considŁre deux variables alØatoires indØpendantes X et Y , dØ nies sur R. Ces deux variables
suivent chacune la loi normale centrØe rØduite N(0,1).
1. Soit Z la variable alØatoire dØ nie par Z = X + Y et T la variable alØatoire dØ nie par
T = aX oø a est un rØel.
DØterminer les espØrances E[Z] et E[T] puis les variances Var(Z) et Var(T) des variables
alØatoires Z et T.
Sachant que toute combinaison linØaire de variables alØatoires gaussiennes indØpendantes est
une variable alØatoire gaussienne, en dØduire les lois et les densitØs de probabilitØ des variables
alØatoires Z et T.
2. a) Soit f une fonction paire et x ∈ R+. Montrer que
b) On appelle U la variable alØatoire dØ nie par U = X2. DØterminer pour tout rØel x la valeur de la
probabilitØ
P(U ≤ x).
En dØduire la densitØ de probabilitØ de la variable alØatoire U.
Exercice 2.
On dit qu’une variable alØatoire Z suit une loi Γ(λ,n), oø n ∈ N et λ > 0, si Z a pour densitØ de
probabilitØ la fonction :
1. VØri er que la loi Γ(λ,n) est bien dØ nie, puis calculer E[Z], E[Z2] et Var(Z).
2. Soient X et Y deux variables alØatoires indØpendantes de lois respectives Γ(λ,m) et Γ(λ,n).
DØterminer la loi jointe du couple (U,V ) dØ ni par :
1
et on rappelle que pour
Exercice 3.
Un atelier fonctionne avec deux Øquipes d’ouvriers, une du matin et l’autre du soir. Chaque jour on
enregistre le nombre d’ouvriers absents. On note X (respectivement Y ), le nombre d’absences
dans l’Øquipe de jour (respectivement de nuit). La loi jointe P de (X,Y ) est donnØe par
P(0,0) = c P(0,1) = 2c P(0,2) = 0 P(0,3) = 3c
P(1,0) = 0 P(1,1) = 3c P(1,2) = 4c P(1,3) = 0
P(2,0) = 0 P(2,1) = 4c P(2,2) = 2c P(2,3) = c
1. DØterminer la constante c.
2. Donner les lois marginales de X et Y ainsi que leurs espØrances.
3. Une absence coßte 30 euros l’usine. Quelle est la perte journaliŁre moyenne due aux
absences?
Exercice 4.
1. Soit u ∈ [0,1], v ∈ [0,1], et le changement de variables
Exercice 5.
On considŁre deux variables alØatoires indØpendantes X1 et X2, obØissant des lois dØ nies
respectivement par les fonctions de rØpartition FX1 et FX2. On pose U = max(X1,X2) et
V = min(X1,X2).
1. DØterminer les lois de U et de V . Que deviennent-elles si X1 et X2 suivent la mŒme loi, de
fonction de rØpartition F ?
2. On suppose prØsent X1 et X2 ØquirØparties sur l’intervalle [0,1]. DØterminer la
probabilitØ conditionnelle .
Exercice 6.
On considŁre un couple (X1,X2) de variables alØatoires de loi uniforme sur le carrØ [0,1]×[0,1]. 1.
Montrer que X1 et X2 sont deux variables indØpendantes.
2
Exercice 7.
Soit (X,Y ) un couple de variables alØatoires de densitØ
et .
1. Donner une reprØsentation graphique de D.
2. DØterminer les densitØs des variables alØatoires X et Y . Les variables alØatoires X et Y sont-
elles indØpendantes?
3. On pose .
a) Montrer que l’ensemble des valeurs prises par S et T est l’intervalle ]0,1].
b) Soit (s,t) ∈]0,1]2 et (x,y) ∈ D tels que .
Calculer x et y en fonction de s et t.
c) DØterminer la densitØ h(s,t) du couple (S,T).
Exercice 8.
1. Soit D le domaine du plan
.
Dessiner D.
2. Soit (X,Y ) un couple de variables alØatoires valeurs rØelles de densitØ de probabilitØ
(2√1x
e−y si (x,y) ∈ D f(x,y) =
0 ailleurs.
3
b) En utilisant l’inØgalitØ de BienaymØ-Tchebychev, trouver un minorant de la probabilitØ
P(9000 < W < 10600).
c) On suppose que la loi de W peut Œtre approchØe par une loi normale de moyenne m =
9800 et d’Øcart type σ = 309.
• Quelle est la loi suivie par la variable alØatoire ?
• Avec la table de la loi gaussienne centrØe rØduite, trouver, si Z ∼ N(0,1),
• En dØduire la probabilitØ pour que le chi re d’a aire W d’une journØe soit compris entre 9750 et
9951 euros.
Exercice 10.
1. Soit C le carrØ de sommets A (0,0), B (0,1), C (1,1), D (1,0).
DØterminer, pour tout u ∈ [0,1], l’aire D(u) du domaine D(u) dØ ni par
D(u) = C ∩ {(x,y) | − u ≤ x − y ≤ u} .
2. Deux personnes se donnent rendez-vous entre 19h et 20h. On suppose que l’on peut associer
aux instants d’arrivØe de ces deux personnes des variables alØatoires X et Y continues,
indØpendantes et uniformes sur [0,1]. Soit U = |X − Y | la variable alØatoire Øgale au temps
d’attente de la premiŁre personne. Montrer que la fonction de rØpartition de U est donnØe par
si u < 0
0 si u ∈
[0,1] si u >
F(u) = D(u) 1.
1
3. Calculer la densitØ de U et son espØrance E[U].
4. Ces deux personnes conviennent que la premiŁre arrivØe s’en ira aprŁs un temps d’attente Øgal
2E[U]. Quelle est la probabilitØ pour que le rendez-vous ait lieu?
4
UniversitØ Paris 13, Institut GalilØe CCS ProbabilitØs & Statistiques
AnnØe universitaire 2013 2014
Exercice 1.
Trois machines, A, B, C fournissent respectivement 50%, 30%, 20% de la production d’une usine.
Les pourcentages de piŁces dØfectueuses produites par ces machines sont respectivement 3%,
4%, 5%.
1. Quelle est la probabilitØ pour qu’une piŁce prise au hasard dans la production soit
dØfectueuse?
2. On prØlŁve un Øchantillon de 100 piŁces sur la production. Quelle est la loi suivie par le
nombre de piŁces dØfectueuses? Par quelle loi peut-on l’approcher?
3. Quelle est la probabilitØ pour qu’une piŁce dØfectueuse prise au hasard provienne de A, de
B, de C ?
Exercice 2.
Une compagnie d’assurance assure 500 navires pour une somme de 5 millions d’euros chacun.
Chaque navire a chaque annØe une probabilitØ Øgale 0,1% de subir un sinistre majeur couvert par
l’assurance. Soit X le nombre de navires perdus en une annØe. Donner la loi de X, son espØrance
et sa variance.
On cherche estimer quelles rØserves doit possØder la compagnie d’assurance pour Œtre sßre de
pouvoir payer les indemnitØs avec une probabilitØ Øgale 99,9% la n de chaque annØe.
1. Pourquoi peut-on estimer que la variable alØatoire X suit une loi de Poisson? Quelle est le
paramŁtre de cette loi?
La table de la loi de Poisson pour le paramŁtre λ = 0,5 donne
si 0 < x < θ
()=
0 ailleurs.
1
1. Calculer E[X], en dØduire un estimateur T1 de θ par la mØthode des moments.
2. Soit Z = max(X1,X2). Calculer la fonction de rØpartition de Z et en dØduire sa densitØ g.
Calculer E[Z] et en dØduire un estimateur T2 de θ par la mØthode des moments.
3. Montrer que T1 et T2 sont sans biais. Quel est le meilleur?
Exercice 5.
Soit X une variable alØatoire admettant pour densitØ
f(x) = θxθ−11]0,1](x),
et en dØduire E[Y ].
3. Soit (X1,X2,··· ,Xn) un Øchantillon de la variable alØatoire X.
a) On pose α = 1θ.
crire la vraisemblance L(x1,x2,··· ,xn;α) de l’Øchantillon pour α. En dØduire un estimateur α
b
de α par la mØthode du maximum de vraisemblance. Montrer que cet estimateur est sans biais. b)
On pose . Donner un estimateur sans biais de β par la mØthode des moments.
Exercice 6.
Soit X une variable alØatoire de loi uniforme sur [0,θ], oø θ > 0 est un paramŁtre. Soit
(X1,X2,··· ,Xn) un Øchantillon de X. Montrer que :
Exercice 7.
Soit X une variable alØatoire dont la loi dØpend de deux paramŁtres p1 et p2 par :
1. Trouver les conditions vØri er par p1 et p2 pour que le support de la loi de X soit Øgal
{0,1,2}. Calculer E[X], E[X ], Var(X).
2
N0 = 20, N1 = 50, N2 = 30 .
2
quelles estimations de p1 et p2 conduisent les estimateurs L1 et L2 ?
Exercice 8.
Soit X une variable alØatoire admettant pour densitØ de probabilitØ :
0 sinon.
1. Indiquer les relations que doivent satisfaire a et b pour que f soit une densitØ de probabilitØ de
support [0,1]. Exprimer b en fonction de a, paramŁtre que l’on cherche estimer.
2. Calculer E[X], E[X2] et Var(X) en fonction de a.
3. Soit (X1,X2,··· ,Xn) un Øchantillon de X. DØterminer un estimateur Ln de a par la mØthode des
moments. Montrer que cet estimateur est sans biais et que sa variance tend vers 0 quand n →
+∞; en dØduire qu’il est convergent.
4. On dØsigne par N0 le nombre de variables alØatoires Xi appartenant l’intervalle . Montrer
que l’estimateur Zn de a par la mØthode du maximum de vraisemblance peut s’Øcrire
Exercice 9.
Soit X une variable alØatoire suivant une loi de Poisson de paramŁtre λ > 0. On considŁre un
Øchantillon (X1,X2,...,Xn) de X.
1. On pose . Que valent E[Xn] et Var(Xn)?
2. a) Ecrire la vraisemblance L(k1,k2,··· ,kn;λ) de l’Øchantillon (X1,X2,··· ,Xn).
b) En dØduire que l’Øquation de la vraisemblance est
Exercice 10.
Soient (X1,X2,...,Xn), n variables alØatoires indØpendantes et de mŒme loi de densitØ de
probabilitØ
,
oø a > 0 est un paramŁtre.
1. Calculer E[Xi] et en dØduire un estimateur de a par la mØthode des moments.
2. crire la vraisemblance L(x1,x2,...,xn;a) de l’Øchantillon (X1,X2,...,Xn). En dØduire l’estimateur du
maximum de vraisemblance de a.
3. On dØ nit la variable alØatoire
I = min(X1,X2,...,Xn).
a) DØterminer , pour tout x ∈ R, la probabilitØ P(Xi ≥ x), puis la probabilitØ P(I ≥ x).
b) En dØduire la fonction de rØpartition de la variable alØatoire I, puis sa densitØ de probabilitØ.
3
c) Calculer E[I] et en dØduire un estimateur sans biais de a de la forme kI.
Exercice 11.
Un directeur de centre de loisirs souhaite embaucher un moniteur de planche voile si la proportion
de personnes choisissant cette activitØ est supØrieure 15%.
Il a observØ que π0 = 12% des personnes frØquentant le centre de loisirs avaient choisi la planche
voile l’annØe derniŁre. Il souhaite aujourd’hui rØactualiser sa dØcision. Pour cela, il dispose de plus
du pourcentage π1 = 16% des personnes ayant choisi la planche voile parmi les n premiŁres venues
en juillet. Il souhaite estimer avec un risque de 5% si π1 est conforme aux observations de l’annØe
prØcØdente.
On dØ nit n variables alØatoires indØpendantes et de mŒme loi (Xi)1≤i≤n par :
(
1 si la i-iŁme personne choisit la planche voile
Xi =
0 si la i-iŁme personne choisit un autre sport.
Exercice 12.
Soit Y une variable alØatoire de Bernoulli de paramŁtre p et Y n la variable alØatoire
,
les Yi Øtant des variables alØatoires indØpendantes et de mŒme loi que Y .
1. Quel thØorŁme permet de dire que si n ≥ 30, la variable alØatoire
suit approximativement la loi gaussiene centrØe rØduite N(0,1)? noncer ce thØorŁme dans le cas
gØnØral oø Y est une variable alØatoire de moyenne m et d’Øcart type σ.
2. On pose n = 100 et p = 0,1. Sur la table de la loi gaussienne, on voit que P(Z < 1,96) ' 0,975 si Z
∼ N(0,1). En dØduire le plus petit rØel A tel que
3. Application. Un acheteur veut tester les livraisons qu’il re oit et savoir si elles sont conformes ce
que dit le fabricant. Le fabricant assure que moins de 10% des vis livrØes sont dØfecteuses.
L’acheteur prØlŁve 100 vis chaque livraison et relŁve la proportion π de vis dØfectueuses.
4
Pour quelles valeurs de π , l’acheteur peut-il lØgitimement refuser la livraison au seuil de risque de
2,5%?
Exercice 13.
On cherche comparer les pourcentages de satisfaction de deux groupes de personnes utilisant un
mŒme produit cosmØtique.
Chacune des personnes du groupe A a une probabilitØ π0 d’Œtre satisfaite.
Chacune des personnes du groupe B a une probabilitØ π1 d’Œtre satisfaite.
On dispose d’un Øchantillon de 50 personnes dans le groupe A, dont 15 se dØclarent satisfaites.
Pour le groupe B, sur un Øchantillon de 100 personnes, 60 sont satisfaites.
1. Quels sont les pourcentages p0 et p1 de satisfaction observØs sur ces deux Øchantillons? 2. Soit
une variable alØatoire X de loi normale de moyenne m et d’Øcart type σ : X ∼ N(m,σ).
Rappeler quelle est la loi suivie par la variable alØatoire
.
3. Soit X une variable alØatoire de Bernoulli de paramŁtre π0. Montrer que la moyenne empirique
X 50 suit une loi normale de moyenne π0 et d’Øcart type
De la mŒme fa on, donner la loi suivie par Y 100 , oø Y est une variable alØatoire de Bernoulli de
paramŁtre π1.
4. Soit D la variable alØatoire D = X50 − Y 100. Quelle est la loi suivie par D ?
5. Soit H0 l’hypothŁseπ0 = π1 , que l’on souhaite tester. Sous cette hypothŁse,
oø
est la moyenne des pourcentages observØs sur les deux Øchantillons. PrØciser la valeur de p. a)
DØterminer un intervalle I tel que sous l’hypothŁse H0
P(|D| ∈ I) = 95% .
Exercice 14.
La durØe de fonctionnement d’une ampoule suit une loi normale N(m,σ2). On examine 50
ampoules et on enregistre les rØsultats suivants :
X50(ω) = 58 jours et
jours2.
5
Exercice 15.
Sur un Øchantillon de 300 piŁces fabriquØes par une machine, 60 sont dØfectueuses.
Trouver un intervalle de con ance I de niveau 99% de la proportion rØelle de piŁces dØfectueuses
fabriquØes par la machine.
Exercice 16.
On a observØ que l’ ge X des Øtudiants assidus en premiŁre annØe d’universitØ suivait une loi
normale N(18,1) et que l’ ge Y des Øtudiants non assidus suivait la loi normale N(20,1).
1. Calculer la probabilitØ pour qu’un Øtudiant assidu ait plus de 20 ans.
2. Dans un premier temps, pour organiser les groupes de TD, il est dØcidØ d’un test basØ sur l’ ge
de l’Øtudiant pour Øvaluer son assiduitØ.
Soit H0 l’hypothŁse : l’Øtudiant est assidu et H1 l’hypothŁse alternative : l’Øtudiant n’est pas assidu .
On dØcide de rejeter l’hypothŁse H0 si l’ ge de l’Øtudiant est supØrieur A = 20 ans.
Soit
α = P(rejeter H0 | H0 vraie)
le risque de premiŁre espŁce et β = P( ne pas rejeter H0 | H0 fausse) = P( ne pas rejeter
H0 | H1 vraie) le risque de deuxiŁme espŁce.
a) Remarquer que le risque de premiŁre espŁce, α, est Øgal P(X > 20). Que vaut β ?
b) On admet un risque de premiŁre espŁce Øgal 5%. Quelle valeur peut-on prendre pour A?
Que vaut alors β ?
Exercice 17.
1. La table statistique donnØe en annexe donne la probabilitØ Φ(t) pour qu’une variable
alØatoire normale Z centrØe rØduite (Z ∼ N(0,1)) soit infØrieure ou Øgale une valeur donnØe t.
Soit X une variable normale de moyenne m et d’Øcart type σ. Rappeler comment se calcule, en
fonction de Z, la probabilitØ P(X < A).
2. Un grossiste re oit des pelotes de laine provenant de deux usines di Ørentes. Toutes les
pelotes d’une mŒme usine n’ont pas exactement le mŒme poids, mais le poids (en grammes)
d’une pelote prise au hasard dans un lot de mŒme provenance suit une loi normale N(m,σ2).
Les usines A et B annoncent respectivement
mA = 100g, σA = 8g ; mB = 96g, σB = 4g.
a) Un premier client refuse toute pelote dont le poids est infØrieur 90g. De quelle usine
provient le lot donnant le plus faible pourcentage de rebut?
b) Pour un autre client, le poids minimum exigØ est inconnu; mais on constate qu’il est tel que
le choix entre les deux provenances est indi Ørent. DØterminer ce poids minimum exigØ ainsi que
le pourcentage de rebut (commun au deux lots).
3. Le grossiste de son c tØ souhaite vØri er si les lots re us sont conformes aux quali cations
annoncØes. Pour cela il prØlŁve un Øchantillon de 100 pelotes dans le lot provenant de l’usine A et
dØtermine le poids moyen m d’une pelote de cet Øchantillon.
a) Soient (X1,X2,··· ,X100), 100 variables alØatoires indØpendantes de mŒme loi N(mA,σA2 ). On
note X 100 la moyenne de ces variables alØatoires :
.
Quelle loi peut approcher la loi suivie par la variable alØatoire
6
noncer le thØorŁme utilisØ.
b) Quelles sont les valeurs de m pour lesquelles il pourra rejeter, au seuil de risque 5%,
l’hypothŁse H0 : m = mA ?
On rappelle que si Z ∼ N(0,1), P(|Z| ≤ 1,96) = 95%.
7
Table de la fonction de répartition de la loi normale centrée réduite N(0,1)
t 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0, 0,500 0,504 0,508 0,512 0,516 0,519 0,523 0,527 0,531 0,535
0 0 0 0 0 0 9 9 9 9 9
0, 0,539 0,543 0,547 0,551 0,555 0,559 0,563 0,567 0,571 0,575
1 8 8 8 7 7 6 6 5 4 3
0, 0,579 0,583 0,587 0,591 0,594 0,598 0,602 0,606 0,610 0,614
2 3 2 1 0 8 7 6 4 3 1
0, 0,617 0,621 0,625 0,629 0,633 0,636 0,640 0,644 0,648 0,651
3 9 7 5 3 1 8 6 3 0 7
0, 0,655 0,659 0,662 0,666 0,670 0,673 0,677 0,680 0,684 0,687
4 4 1 8 4 0 6 2 8 4 9
0, 0,691 0,695 0,698 0,701 0,705 0,708 0,712 0,715 0,719 0,722
5 5 0 5 9 4 8 3 7 0 4
0, 0,725 0,729 0,732 0,735 0,738 0,742 0,745 0,748 0,751 0,754
6 7 1 4 7 9 2 4 6 7 9
0, 0,758 0,761 0,764 0,767 0,770 0,773 0,776 0,779 0,782 0,785
7 0 1 2 3 4 4 4 4 3 2
0, 0,788 0,791 0,793 0,796 0,799 0,802 0,805 0,807 0,810 0,813
8 1 0 9 7 5 3 1 8 6 3
0, 0,815 0,818 0,821 0,823 0,826 0,828 0,831 0,834 0,836 0,838
9 9 6 2 8 4 9 5 0 5 9
1, 0,841 0,843 0,846 0,848 0,850 0,853 0,855 0,857 0,859 0,862
0 3 8 1 5 8 1 4 7 9 1
1, 0,864 0,866 0,868 0,870 0,872 0,874 0,877 0,879 0,881 0,883
1 3 5 6 8 9 9 0 0 0 0
1, 0,884 0,886 0,888 0,890 0,892 0,894 0,896 0,898 0,899 0,901
2 9 9 8 7 5 4 2 0 7 5
1, 0,903 0,904 0,906 0,908 0,909 0,911 0,913 0,914 0,916 0,917
3 2 9 6 2 9 5 1 7 2 7
1, 0,919 0,920 0,922 0,923 0,925 0,926 0,927 0,929 0,930 0,931
4 2 7 2 6 1 5 9 2 6 9
1, 0,933 0,934 0,935 0,937 0,938 0,939 0,940 0,941 0,942 0,944
5 2 5 7 0 2 4 6 8 9 1
1, 0,945 0,946 0,947 0,948 0,949 0,950 0,951 0,952 0,953 0,954
6 2 3 4 4 5 5 5 5 5 5
1, 0,955 0,956 0,957 0,958 0,959 0,959 0,960 0,961 0,962 0,963
7 4 4 3 2 1 9 8 6 5 3
1, 0,964 0,964 0,965 0,966 0,967 0,967 0,968 0,969 0,969 0,970
8 1 9 6 4 1 8 6 3 9 6
1, 0,971 0,971 0,972 0,973 0,973 0,974 0,975 0,975 0,976 0,976
9 3 9 6 2 8 4 0 6 1 7
2, 0,977 0,977 0,978 0,978 0,979 0,979 0,980 0,980 0,981 0,981
0 2 8 3 8 3 8 3 8 2 7
2, 0,982 0,982 0,983 0,983 0,983 0,984 0,984 0,985 0,985 0,985
1 1 6 0 4 8 2 6 0 4 7
2, 0,986 0,986 0,986 0,987 0,987 0,987 0,988 0,988 0,988 0,989
2 1 4 8 1 5 8 1 4 7 0
2, 0,989 0,989 0,989 0,990 0,990 0,990 0,990 0,991 0,991 0,991
3 3 6 8 1 4 6 9 1 3 6
2, 0,991 0,992 0,992 0,992 0,992 0,992 0,993 0,993 0,993 0,993
4 8 0 2 5 7 9 1 2 4 6
2, 0,993 0,994 0,994 0,994 0,994 0,994 0,994 0,994 0,995 0,995
5 8 0 1 3 5 6 8 9 1 2
2, 0,995 0,995 0,995 0,995 0,995 0,996 0,996 0,996 0,996 0,996
6 3 5 6 7 9 0 1 2 3 4
2, 0,996 0,996 0,996 0,996 0,996 0,997 0,997 0,997 0,997 0,997
7 5 6 7 8 9 0 1 2 3 4
2, 0,997 0,997 0,997 0,997 0,997 0,997 0,997 0,997 0,998 0,998
8 4 5 6 7 7 8 9 9 0 1
2, 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998
9 1 2 2 3 4 4 5 5 6 6
3, 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,999 0,999
0 7 7 7 8 8 9 9 9 0 0
3, 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999
1 0 1 1 1 2 2 2 2 3 3
3, 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999
2 3 3 4 4 4 4 4 5 5 5
3, 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999
3 5 5 5 6 6 6 6 6 6 7
3, 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999
4 7 7 7 7 7 7 7 7 7 8
3, 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999
5 8 8 8 8 8 8 8 8 8 8
3, 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999
6 8 8 9 9 9 9 9 9 9 9
3, 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999
7 9 9 9 9 9 9 9 9 9 9
3, 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999
8 9 9 9 9 9 9 9 9 9 9
3, 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000
9 0 0 0 0, 5 0 0 0 0 0 0 0
Pour Z de loi
N(0,1),
Φ(t)
−3 −2 −1 0 1 t 2 3
Zt −x2 dx
Φ(t) = FZ(t) = P(Z ≤ t) = e 2
√
−∞ 2π
Lois discrètes
k!
Loi géométrique G(p) p ∈]0,1] N∗ p(k) = (1 − p)k−1p
Lois continues
Loi de Poisson P(λ) λk
N
λ ∈]0, + ∞[ p(k) = e−λ
Z
Nom Paramètres Support Définition : P(A) = f(x)dx Espérance Variance
A