L3 Sorbonne Université 2024-2025 Cours: C.
Dion-Blanc 1
Examen de Statistique LU3MA247
Mardi 13 mai 8h30-10h30
Aucun document n’est autorisé.
La rédaction doit être soignée, et les questions numérotées.
Le barème est donné à titre indicatif et pourra changer.
Exercice 1 (10 points) On se donne σ > 0 et µ ∈ R. Soit X une variable aléatoire réelle de
densité
1 2 2
fµ,σ (x) = √ e−(ln(x)−µ) /(2σ ) 1{x>0}
2πσx
1. Montrer que fµ,σ définit bien une densité.
2. Calculer E[ln(X)] et E ln(X)2 .
3. On observe un échantillon de taille n, X1 , . . . , Xn , de variables indépendantes de même loi
que X.
On suppose dans la suite le paramètre σ connu. Trouver l’estimateur du maximum de
vraisemblance µ
b de µ.
4. Calculer le biais de l’estimateur µ
b.
5. Calculer le risque quadratique de l’estimateur µ
b.
6. Montrer que c’est un estimateur consistant de µ.
7. Qu’est-ce que l’on aurait pu proposer d’autre pour estimer µ ?
Exercice 2
Devant la crise de la dette publique en Europe, de nombreux états européens ont fait de la
lutte contre la fraude fiscale une priorité nationale. Des dispositifs de détection de la fraude sont
mis en place, et parmi eux, la détection de l’écart à la loi de Benford. Cette loi modélise la
fréquence d’apparition du premier chiffre d’un nombre issu de résultats de mesures non falsifiées.
La table de la loi de Benford (en base 10) est donnée ci-dessous en notant C une variable aléatoire
modélisant le premier chiffre d’un nombre issu de résultats de mesures.
k 1 2 3 4 5 6 7 8 9
P (C = k) 0.301 0.176 0.125 0.097 0.079 0.067 0.058 0.051 0.046
Lors du contrôle fiscal d’une entreprise, afin de détecter et d’identifier plus rapidement une
éventuelle zone falsifiée dans la comptabilité de l’entreprise, un contrôleur relève au hasard 120
montants apparaissant dans cette zone.
L3 Sorbonne Université 2024-2025 Cours: C. Dion-Blanc 2
Partie I (5 points) Le contrôleur s’intéresse à la loi du premier chiffre d’un montant relevé
dans la zone de comptabilité étudiée. Il souhaite tester l’hypothèse selon laquelle cette loi est
la loi de Benford. Il note pour cela le nombre de montants commençant par k parmi les 120
montants relevés, pour k = 1 . . . 9, et il obtient les résultats suivants.
k 1 2 3 4 5 6 7 8 9
Montants commençant par k 12 10 12 13 17 18 16 12 10
On rappelle les quantiles d’ordre 1 − α et 1 − α/2 de la loi du χ2 (d) en fonction de d son
degré de liberté :
α 0.05
χ2 (9)
q1−α 16.92
χ2 (9)
q1−α/2 19.02
χ2 (8)
q1−α 15.51
χ2 (8)
q1−α/2 17.53
1. Quel test du Khi-Deux faut-il utiliser ici ? Quelles sont les hypothèses H0 , H1 ?
2. Écrire la statistique de test et le test de niveau asymptotique α. (On rappellera notamment
sa loi asymptotique sous H0 ).
3. Écrire le calcul explicite de la statistique de test sur les données en fonction des valeurs
numériques (il n’est pas demandé de faire le calcul).
4. Le calcul de la statistique de test donne T (ω) = 62.05. Réalisez le test au niveau α = 0.05,
qu’en concluez-vous sur la loi du premier chiffre ? Que pouvez-vous dire sur la probabilité
de vous tromper en faisant cette conclusion ?
Les parties I et II sont indépendantes
Partie II (11 points) Le temps (en jours) consacré habituellement au contrôle fiscal d’une pe-
tite entreprise peut être modélisé par une loi gaussienne d’espérance m = 55. On souhaite savoir
si la mise en place des récents dispositifs de contrôle permettent de diminuer significativement
la durée d’un contrôle fiscal en moyenne.
On pose le modèle statistique suivant. Soit D = (D1 , . . . , Dn ) un échantillon de variables
aléatoires (i.i.d.) de loi gaussienne d’espérance m inconnue, de variance σ 2 inconnue, modélisant
les durées de n = 50 contrôles fiscaux après la mise en place du dispositif. On relève pour les
durées (d1 , . . . , d50 ) de n = 50 contrôles fiscaux après la mise en place d’un dispositif de contrôle.
⊗50
Ici Θ = R+ × R∗+ , et pour θ = m, σ 2 ∈ Θ, Pθ = N m, σ 2
. On souhaite effectuer le test
H0 : m ≥ 55 contre H1 : m < 55.
1. Donner un estimateur de m puis un estimateur de σ 2 , sans biais.
2. Donner la loi de ces estimateurs en justifiant.
3. Construire un intervalle de confiance unilatéral à gauche pour m de niveau de confiance
1 − α, α ∈]0, 1[.
L3 Sorbonne Université 2024-2025 Cours: C. Dion-Blanc 3
4. Construire un test de niveau α en utilisant la question précédente.
5. Calculer la taille de ce test.
6. Écrire maintenant un test pour les hypothèses H0 : σ 2 = 1 contre H1 : σ 2 6= 1 de niveau
α.
Exercice 3 (Loi exponentielle, 12 points) On considère un échantillon (Xi )1≤i≤n avec
n ≥ 3 de variables aléatoires i.i.d. et X1 de densité
fθ (x) = θ exp(−θx)1[0,+∞[ (x),
où θ > 0 est le paramètre inconnu.
1. On propose d’estimer θ par Yn = Pn n .
i=1 Xi
(a) Montrer que la v.a. Yn est bien définie.
(b) Justifier le choix de Yn comme estimateur de θ.
√
(c) Déterminer la loi asympotique de n(Yn − θ).
(d) La variable aléatoire ni=1 Xi suit la loi Gamma γ(n, θ). On en déduit (admis) que
P
nθ n2 θ 2
E(Yn ) = , Var(Yn ) = .
n−1 (n − 1)2 (n − 2)
En utilisant ces résultats, en déduire quelle est la valeur du risque quadratique de Yn
comme estimateur de θ : E[(Yn − θ)2 ].
n−1
2. Pour estimer θ, on propose d’utiliser Zn = n Yn .
(a) Zn vérifie-t-il des propriétés de convergence similaires à celles de Yn ?
(b) Qui de Yn ou Zn choisiriez-vous pour estimer θ ?
3. Soit α ∈]0, 1[. Donner un intervalle de confiance bilatère de niveau asymptotique (1 − α)
pour θ.
4. Proposer un test de niveau asymptotique α pour tester H0 : θ = 1 contre H1 : θ 6= 1.