0% ont trouvé ce document utile (0 vote)
481 vues9 pages

Statistiques pour Ingénieurs

Transféré par

Jonathan Amatu
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
481 vues9 pages

Statistiques pour Ingénieurs

Transféré par

Jonathan Amatu
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Thème 2 : Échantillonnage, estimation Statistique pour ingénieur

Statistique pour ingénieur


Thème 2 : Éléments de correction des exercices
F. Delacroix & M. Lecomte, 31 mai 2018

Exercices sur l’estimation


Exercice 1 : Estimateurs
Soient X1 ,X2 , . . . ,Xn , . . . une suite de variables aléatoires indépendantes suivant la loi
uniforme sur [0,a] où a est un paramètre réel strictement positif à estimer. On pose

An = sup Xi et Bn = 2 X.
16i6n

1. Déterminer la loi de probabilité de An (on pourra utiliser la fonction de répartition).


Solution:
Par définition, la fonction de répartition de An est définie sur R par

∀x ∈ R FAn (x) = P (An 6 x) .

Comme An est la borne supérieure des Xi , la condition que An 6 x équivaut à dire que
pour tout i, Xi 6 x. L’événement considéré s’écrit donc comme une intersection et, comme
les variables Xi sont indépendantes, sa probabilité est le produit des probabilités. Comme
de plus elles suivent toutes la même loi, on obtient

FAn (x) = FX1 (x)n .

Pour trouver la densité de An , on peut expliciter cette fonction puis dériver. On trouve

 n xn−1 si x ∈ [0,a]
an
fAn (x) =
0 sinon.

2. Calculer l’espérance et la variance de An et en déduire que An est un estimateur de a.


Solution:
On obtient à l’aide des formules usuelles
n
E (An ) = a
n+1
n a2
V (An ) = .
(n + 1)2 (n + 2)

Comme lim E (An ) = a et lim V (An ) = 0, on en déduit que An est un estimateur de


n→+∞ n→+∞
a. Il est évidemment biaisé car son espérance n’est pas égale à a.
3. Montrer que Bn est un estimateur sans biais de a.
Solution:

Institut Mines-Télécom 1
Statistique pour ingénieur Thème 2 : Échantillonnage, estimation

Comme Bn = 2X, on a
σ2
E (Bn ) = 2µ et V (Bn ) = 4
n
avec, d’après les propriétés de la loi uniforme,
a a2
µ = E (Xi ) = et σ 2 = V (Xi ) = .
2 12
Ceci permet de montrer que Bn est un estimateur sans biais de a.
4. Comparer les variances de An et de Bn .
Solution:

n a2 a2
V (An ) = ∼ 2 V (Bn ) = .
(n + 1)2 (n + 2) n 3n
On constate qu’asymptotiquement la variance de An converge vers 0 plus rapidement
(quadratiquement) que celle de Bn . On peut également vérifier que quelle que soit la
valeur de n, V (An ) < V (Bn ).
L’estimateur An est donc préférable, et il serait possible de corriger son biais en posant

An = n+1n
An sans fortement augmenter sa variance.

Exercice 2 : Estimateur obtenu par la méthode du maximum de vraisemblance


Déterminer un estimateur du paramètre λ d’une loi exponentielle. Celle-ci est définie
par la densité de probabilité f suivante :

λ e−λx si x > 0
∀x ∈ R, f (x) =
0 sinon.

Solution:
La fonction de vraisemblance vaut
n
!
n
X
L(x1 , . . . ,xn ,λ) = λ exp −λ xi
i=1

À échantillon (x1 , . . . ,xn ) fixé, la fonction (de la variable λ) ln L admet un maximum


en la valeur !−1
n
b= 1 X
λ xi .
n i=1
1
On en déduit que X
est un estimateur de λ.

Exercice 3 : Paramètre d’une loi de Poisson


Dans une ville, on a étudié le nombre d’accidents de la circulation sur une période
de 70 jours. En regroupant les jours selon le nombre d’accidents, on a obtenu le tableau
suivant
nombre d’accidents 0 1 2 3 4 5
nombre de jours 34 22 11 2 0 1

2 Institut Mines-Télécom
Thème 2 : Échantillonnage, estimation Statistique pour ingénieur

Soit X la variable aléatoire désignant le nombre d’accidents quotidien. On admet que


X suit la loi de Poisson de paramètre λ, c’est-à-dire que

λn
X(Ω) = N et ∀n ∈ N, P (X = n) = e−λ .
n!
L’objet de cet exercice est de déterminer une estimation ponctuelle de λ par deux méthodes
distinctes. Pour cela, on considère un échantillon statistique (X1 , . . . ,Xn ) de X, c’est-à-dire
n variables aléatoires réelles indépendantes suivant toutes la loi de Poisson de paramètre
λ.
1ère méthode : maximum de vraisemblance.
1. Construire un estimateur de λ par la méthode du maximum de vraisemblance. Est-il
sans biais ? En déduire, en utilisant les données du tableau, une estimation ponctuelle de
λ.
Solution:
La fonction de vraisemblance s’écrit, pour λ > 0 et x1 , . . . ,xn ∈ N :
n n
λ xi
P (Xi = xi ) = e−nλ
Y Y
L(λ,x1 , . . . ,xn ) = .
i=1 i=1 xi !

En prenant le logarithme et en dérivant par rapport à λ, on trouve un maximum, à


x1 , . . . ,xn fixés, égal à
n
b= 1
X
λ xi = x.
n i=1
 
On en déduit que X est un estimateur de λ. Il est sans biais étant donné que E X =
E (X) = λ.
Une estimation ponctuelle de λ est donc x = 0,79.
n
X
2ème méthode : on pose Σn = Xi .
i=1
2. Quelle est la loi de probabilité de la variable aléatoire Σn ?
Solution:
Si deux variables aléatoires X1 et X2 suivant des lois de Poisson P(λ1 ) et P(λ2 ) sont
indépendantes, leur somme X1 + X2 suit encore une loi de Poisson de paramètre λ1 + λ2 .
Par récurrence immédiate on en déduit ici que Σn suit la loi de Poisson P(nλ).
3. Montrer que, pour tout entier naturel j,
j
n−1

P ({X1 = 0}|{Σn = j}) = .
n
Solution:

P ({X1 = 0} ∩ {Σn = j})


P ({X1 = 0}|{Σn = j})) = .
P (Σn = j)
On peut réécrire l’événement

{X1 = 0} ∩ {Σn = j} = {X1 = 0} ∩ {X2 + · · · + Xn = j}.

Institut Mines-Télécom 3
Statistique pour ingénieur Thème 2 : Échantillonnage, estimation

La variable X2 + · · · + Xn suit, comme précédemment, une loi de Poisson de paramètre


(n − 1)λ et est indépendante de X1 . En reportant ces éléments dans la formule de la
probabilité conditionnelle, on obtient le résultat annoncé :
j
e−λ × e−(n−1)λ [(n−1)λ]
j!

n−1
j
P ({X1 = 0}|{Σn = j}) = j = .
e−nλ (nλ)
j!
n

4. En déduire que la variable aléatoire


Σn
n−1

Tn =
n
est un estimateur sans biais de e−λ .
Solution:
La variable aléatoire Tn étant une fonction de Σn , on peut écrire (on vérifie la conver-
gence de la série) :
∞  n
n−1 j
X  X
E (Tn ) = P (Σn = j) = P ({X1 = 0}|{Σn = j}) P (Σn = j) = P (X1 = 0)
j=0 n j=0

= e−λ .

En procédant de même pour E (Tn2 ), on trouve


λ
 
V (Tn ) = e−2λ e n − 1 −−−→ 0.
n→+∞

Ainsi, Tn est un estimateur sans biais de e−λ .


5. Déduire des questions précédentes un nouvel estimateur de λ et une nouvelle estimation
ponctuelle de λ.
Solution:
Le fait que Tn soit un estimateur de e−λ incite à penser que la variable aléatoire
Λn = − ln(Tn ) = Σn ln n−1n
est un estimateur de λ.
Plutôt que de faire appel à un résultat général, cherchons à le démontrer à la main en
calculant son espérance et sa variance. Par linéarité de l’espérance,
n−1 1 1
     
E (Λn ) = − ln E (Σn ) = −nλ ln 1 − ∼ −nλ − = λ.
n n n→+∞ n
De même, la variance est quadratique :
2 2
n−1 1
   
V (Λn ) = ln V (Σn ) = nλ ln 1 − .
n n
On obtient à nouveau un équivalent à l’aide des développements limités de référence :
1 λ
V (λn ) ∼ nλ 2
= −−−→ 0.
n→+∞ n n n→+∞
On a bien E (Λn ) → λ et V (Λn ) → 0 donc Λn est un estimateur de λ. Il est cette fois
biaisé.
6. Comparer les estimateurs obtenus à la question 1 et à la question 5. Conclure.

4 Institut Mines-Télécom
Thème 2 : Échantillonnage, estimation Statistique pour ingénieur

Solution:  
On a deux estimateurs de λ : la moyenne empirique X et Λn = Σn ln n−1
n
=
 
n X ln 1 − n1 .
Une première comparaison entre ces deux estimateurs concerne le biais : X est sans
biais alors que Λn est biaisé. Avantage X.
Le second volet de la comparaison concerne les variances : or d’après la relation entre
Λn et X, on a
1 2  
  
2
V (Λn ) = n ln 1 − V X .
n
h  i2
Or, l’étude de la fonction x 7−→ x2 ln 1 − x1 sur ]1, + ∞[ montre qu’elle est toujours
supérieure à 1. Avantage X à nouveau.
On en conclut que X est un meilleur estimateur que Λn .

Exercices sur les intervalles de confiance


Exercice 4 : Intervalle de confiance pour une moyenne et une variance
Une société fabrique des billes pour roulements à billes. On admet que la masse d’une
bille est une variable aléatoire suivant la loi normale N (µ,σ) où µ et σ sont inconnus.
Un échantillon de 30 billes de masses xi a donné les résultats suivants :
30 30
x2i = 163,1862 g 2 .
X X
xi = 69 g et
i=1 i=1

1. Déterminer un intervalle de confiance pour µ au niveau de confiance de 95 %.


Solution:
La variable aléatoire T = SX−µ
∗ / n suit la loi de Student à n − 1 degrés de liberté. Soit

 
t1−α/2 tel que P T 6 t1−α/2 = 1 − α2 . Alors on obtient l’intervalle de confiance aléatoire

S∗ S∗
" #
IC1−α (µ) = X − t1−α/2 √ ; X + t1−α/2 √ .
n n

Avec les données de l’énoncé, x = 2,3, s∗ = 0,39 et n = 30, α = 5%. On lit dans la
table de la loi T (29) la valeur t0,975 = 2.045 et on obtient alors l’intervalle de confiance
réel
Ic1−α (µ) = [2,15; 2,45].

2. Déterminer un intervalle de confiance pour σ au niveau de confiance de 95 %.


Solution:
2
La variable aléatoire Z = nS σ2
suit la loi du χ2 à n − 1 degrés de liberté. Soient les
2 2
fractiles χα/2 et χ1−α/2 tels que

α α α
   
P Z6 χ2α/2 = et P Z 6 1 − =1− .
2 2 2

Institut Mines-Télécom 5
Statistique pour ingénieur Thème 2 : Échantillonnage, estimation

On obtient l’intervalle de confiance réel


   
n S2 n S2  n n 
s s
IC1−α (σ 2 ) =  2 , donc IC1−α (σ) = S ,S
χ1−α/2 χ2α/2 χ21−α/2 χ2α/2

et, compte tenu des données numériques, l’intervalle de confiance réel :

Ic(σ) = [0,31; 0,53].

Exercice 5 : Intervalle de confiance pour une proportion


On appelle p la proportion de billes défectueuses dans une production de billes. Déter-
miner un intervalle de confiance pour p au seuil 5 % dans les deux cas suivants.
1. Dans un échantillon de 100 billes, on a observé 11 billes défectueuses.
Solution:
Par lecture de l’abaque de la loi binomiale B(n,p) (cf. tables statistiques, abaque no7.2)
avec n = 100 on trouve, pour une proportion f = 11%, un intervalle de confiance réel
bilatéral pour p au risque 5% :

Ic95% (p) = [5%,17%].

2. Dans un échantillon de 500 billes, on a observé 48 billes défectueuses.


Solution:
On a n f (1−f ) ' 43 > 18 donc l’approximation fournie par le théorème de De Moivre-
Laplace est considérée comme légitime. Par cette méthode, l’intervalle de confiance réel
obtenu est  s s 
f (1 − f ) f (1 − f ) 
Ic1−α (p) = f − u1−α/2 ,f + u1−α/2
n n

où u1−α/2 est le fractile d’ordre 1 − α/2 de la loi N (0,1). Numériquement, on trouve

Ic95% (p) = [7%,12,2%].

Exercice 6 : Publicité mensongère ?


Un fabricant de piles électriques indique sur ses produits que la durée de vie moyenne
de ses piles est de 200 heures. Une association de consommateurs prélève un échantillon
de 25 piles et observe une durée de vie moyenne de 185 heures avec un écart-type (calculé
à partir de l’estimateur biaisé de la variance) de 30 heures.
1. S’agit-il de publicité mensongère ? On précisera la démarche utilisée (hypothèses, rai-
sonnements, calculs, etc.).
Solution:

6 Institut Mines-Télécom
Thème 2 : Échantillonnage, estimation Statistique pour ingénieur

Supposons que la durée de vie d’une pile donnée soit une variable aléatoire X suivant
une loi normale d’espérance µ et de variance σ 2 . Alors, comme à l’exercice 4, on peut
déterminer un intervalle de confiance réel bilatéral pour µ :

Ic95% (µ) = [172,36; 197,63].

Cet intervalle ne contenant pas la valeur annoncée par le fabricant, on peut conclure avec
un risque 5% à la publicité mensongère.
À noter que le choix d’un intervalle unilatéral pourrait paraître plus pertinent compte
tenu de l’objectif du calcul ; avec ce même niveau de confiance la conclusion serait iden-
tique.
2. Que faudrait-il faire pour répondre négativement à la question posée ?
Solution:
En supposant que les valeurs de x et s restent inchangés, répondre négativement
nécessite que l’intervalle de confiance obtenu contienne la valeur 200 donc soit plus large.
Cela nécessiterait un niveau de confiance 1 − α plus élevé, de l’ordre de 99% pour un
intervalle bilatéral, 99,5% pour un intervalle unilatéral.

Exercice 7 : Paramètre d’une loi continue


Pour θ > 0, on définit la fonction

fθ : R −−−→ R

eθ−x si x > θ
x 7−−−→
0 sinon.

L’objet de ce problème est de construire des estimations de θ.


1. Démontrer que fθ est une densité de probabilité.
Solution:
Il suffit de vérifier qu’il s’agit d’une fonction positive, intégrable sur R et dont l’intégrale
vaut 1.
2. Soit X une variable aléatoire admettant fθ pour densité de probabilité. Démontrer que
la variable X admet une espérance et une variance et que

E[X] = θ + 1 et Var(X) = 1.

Solution:
Il suffit de calculer les intégrales définissant E (X) et E (X 2 ) à l’aide d’intégrations par
parties.
Dans toute la suite de l’exercice, on considère des variables aléatoires X1 , . . . ,Xn indé-
pendantes admettant fθ pour densité de probabilité.
n
1X
3. On pose Un = (Xi − 1).
n i=1
3.1 Calculer l’espérance et la variance de Un .
3.2 Que peut-on en déduire ?
Solution:

Institut Mines-Télécom 7
Statistique pour ingénieur Thème 2 : Échantillonnage, estimation

À l’aide des propriétés de l’espérance et de la variance, on trouve

1
E (Un ) = θ et V (Un ) = .
n
On peut en déduire que Un est un estimateur sans biais de θ.
4. Justifier que, si n est assez grand, la variable aléatoire

Tn = n (Un − θ)

suit approximativement la loi normale centrée réduite.


Solution:
Compte tenu de l’espérance et la variance précédemment calculées, il suffit d’appliquer
le théorème central limite.
5. On suppose que n = 100 et x = 2,0706. À l’aide de la question précédente, déterminer
un intervalle de confiance pour θ au niveau de confiance 95%.
Solution:
Soit t1−α/2 = 1,96 le fractile d’ordre 1 − α2 = 0,975 de la loi N (0,1). Alors (pour n
assez grand)
 
P |Tn | 6 t1−α/2 = 1 − α

et on en tire un intervalle de confiance aléatoire pour θ au niveau de confiance 1−α = 95% :


" #
t1−α/2 t1−α/2
IC1−α (θ) = Un − √ ,Un + √
n n

et, avec les données numériques, l’intervalle de confiance réel

Ic95% (θ) = [0,8746; 1,2666].

6. On admet le résultat suivant :

Théorème (Inégalité de Bienaymé-Tchebychev)


Si Y est une variable aléatoire admettant une espérance µ et une variance σ 2 , alors

σ2
∀k > 0, P (|Y − µ| > k) 6 .
k2

6.1 En appliquant ce théorème à la variable aléatoire X, déterminer un intervalle de


confiance aléatoire pour θ avec un niveau de confiance supérieur ou égal à 1 − α = 95%.
Solution:
L’inégalité de Bienaymé-Tchebychev appliquée à X (dont l’espérance et la variance
sont respectivement égales à µ = θ + 1 et σ 2 = n1 ) donne
  1
∀k > 0, P X − θ − 1 > k 6 .

n k2
8 Institut Mines-Télécom
Thème 2 : Échantillonnage, estimation Statistique pour ingénieur

Pour que cette probabilité soit inférieure à 5%, il suffit que le majorant soit lui même
inférieur à 5%, c’est-à-dire
s
1 5 20
2
6 ⇐⇒ k > .
nk 100 n
Avec cette valeur de k,
 s s   s s 
20 20  20 20 
0,95 = P − 6X −θ−16 = P X − 1 − 6θ 6X −1+
n n n n

qui donne pour intervalle de confiance aléatoire


 s s 
20 20 
IC95% (θ) = X − 1 − ,X − 1 + .
n n

6.2 Donner l’intervalle réel ainsi obtenu lorsque n = 100 et x = 2,0706.


Solution:

Ic95% (θ) = [0,6233; 1,5178] .

7. Comparer les intervalles de confiance obtenus aux questions 6.2 et 5. Quel serait le
niveau de confiance permettant d’obtenir l’intervalle de confiance de la question 6.2 avec
la méthode de la question 5 ?
Solution:
Pour un même niveau de confiance, l’intervalle de confiance obtenu à partir de l’inéga-
lité de Bienaymé-Tchebychev est bien plus grand que celui obtenu à partir du théorème
central limite, donc bien moins intéressant.
Celui de la question 6.2 est de longueur 0,8945. Celui de la question 5 pour un niveau
t
de confiance 1−α et n = 100 a pour longueur 1−α/25
. Pour qu’elles soient égales, il faudrait
α
t1−α/2 = 5 × 0,8945 = 4,4725 soit 1 − = Φ(4,4725) ' 0,999997
2
ce qui nécessiterait un niveau de confiance parfaitement déraisonnable de
α
 
1−α=2 1− − 1 = 0,999994 soit α = 6 × 10−6 .
2
La conclusion est que le majorant fourni par l’inégalité de Bienaymé-Tchebychev, s’il peut
être utile sur le plan théorique (démonstration de la loi faible des grands nombres), est
bien trop grossier pour être utilisé en pratique.

Institut Mines-Télécom 9

Vous aimerez peut-être aussi