0% ont trouvé ce document utile (0 vote)
64 vues2 pages

Statistique

Transféré par

zinab0932
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
64 vues2 pages

Statistique

Transféré par

zinab0932
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

UNIVERSITÉ DE RENNES I

UFR DE MATHEMATIQUES
Licence Biologie Première Année
Probabilités et Statistiques

Devoir Maison

Exercice 1
Un astronome souhaite calculer, à l’aide d’un dispositif approprié, la distance d, en années-lumière
(AL), entre la terre et une étoile. En raison des influences atmosphériques et d’inévitables erreurs de
mesure, l’astronome prévoit de prendre plusieurs mesures et d’accepter leur moyenne comme estimation
de la distance réelle d. Il y a des raisons de penser que les différentes valeurs mesurées correspondent à
des variables aléatoires X1 , . . . , XN , indépendantes, identiquement distribuées, d’espérance commune
d et de variance commune 4.
On cherche le nombre N de mesures que doit réaliser l’astronome afin d’obtenir une approximation de
la distance d avec une marge d’erreur inférieure à 1/2 AL et un seuil de confiance de 95% (au moins).
N
1 X
1 - Soit X = Xk . Déterminer, en justifiant le calcul, l’espérance et la variance de X. Solution :
N
P k=1
E(X) = N1 E( Xk ) = n1 k E(Xk ) = N1 · N · d = d. Pour la variance, nous avons vu en cours que
P
pour des variables aléatoires indépendantes X, Y on a V(X + Y ) = V(X) + V(Y ). Ici, cela implique
V(X) = N12 k V(Xk ) = N12 N · 4 = N4
P
2 - En utilisant le théorème central limite, donner une estimation du nombre N de mesures que doit
réaliser l’astronome. Solution : Selon le TCL, si le nombre de mesures N est suffisamment important,
on peut considérer que X est distribué comme une Gaussienne N (d, N4 ). On a vu en cours qu’un
intervalle de confiance de niveau 95% est [X − z97,5% · √σn , X + z97,5% · √σn ] = [X − 1,96·2
√ , X + 1,96·2
n
√ ].
n
1,96·2
L’astronome veut que √
N
< 21 , donc N > (4 · 1, 96)2 = 61, 4656. Il faut donc 62 mesures !
Exercice 2
On considère l’échantillon statistique suivant :

1, 0, 2, 1, 1, 0, 1, 0, 0

1 - Calculer la moyenne et la variance empiriques de cet échantillon. Solution : moyenne empirique


1+2+1+1+1 2 2 2 2 2
9 = 23 , variance empirique 1 +2 +19 +1 +1 − ( 23 )2 = 94
2 - En supposant que les données de cet échantillon sont des réalisations d’une variable aléatoire de loi
inconnue, donner une estimation non biaisée de l’espérance et de la variance de cette loi. Solution : on
a vu en cours que le moyenne empirique est un estimateur non-biaisé de l’espérance, donc 23 est une
estimation non-biaisée de l’espérance. On a vu en TD qu’un estimateur non-biaisé de la variance est
n 9 4 1
n−1 fois la variance empirique, donc 8 · 9 = 2 est notre estimation non-biaisée de la variance.
3 - On choisit de modéliser les valeurs de cet échantillon comme les réalisation d’une variable aléatoire
de loi binomiale B(2, p).
a) Proposer un estimateur pour p basé sur la moyenne empirique. Solution : L’espérance de la loi
B(2, p) est 2p. Donc si m̂ est notre estimateur de la moyenne, alors p̂ = m̂2 est un estimateur de p. Dans
notre exemple, on a l’estimation p̂ = 21 · 23 = 13 .
b) Avec le même modèle, utiliser la variance empirique pour proposer un autre estimateur de p.
Solution : la variance de la loi B(2, p) est V = 2p(1 − p). Donc si v̂ est notre estimation de la variance,
alors une estimationqp̂ de p devrait satisfaire v̂ = 2p̂(1 − p̂). On obtient donc deux estimations pour
1 1
p, à savoir p̂ = 2 ± 4 − v̂2 . Dans le cas présent, v̂ = 1
2 (voir partie 2 en haut). Nos deux estimations
1
collapsent vers une seule p̂ = 2.
4 - On choisit de modéliser les valeurs de cet échantillon par une loi de Poisson de paramètre λ. Quelle
estimateur proposez-vous pour λ ? Solution : Ici, il y a plusieurs réponses raisonnables. Une loi de
Poisson P(λ) est d’espérance λ, on pourrait donc utiliser la moyenne empirique (qui est un estimateur
non-biaisé de l’espérance) comme estimateur de λ. On obtient ainsi une estimation λ̂ = 23 . En revanche,
la variance de la loi P(λ) est aussi λ, on pourrait donc raisonnablement utiliser notre estimateur de la
variance comme estimateur de λ, c.à.d., λ̂ = 12 .
Exercice 3
On a mesuré les dimensions d’une tumeur chez des souris traitées ou non avec une substance anti-
tumorale. On a obtenu pour le groupe de souris témoins (échantillon de n1 = 30 souris) : moyenne
m1 = 7, 075 cm2 et écart type σ1 = 0, 576 cm2 et pour le groupe de souris traitées (échantillon de
n2 = 28 souris) : moyenne m2 = 5, 850 cm2 et écart type σ2 = 0, 614 cm2 . On souhaite déterminer si
la différence observée entre le groupe traité et le groupe témoin est significative en ayant recours à un
test d’hypothèse.
On suppose d’une part que les données du groupe témoin correspondent à des réalisations de n1
variables aléatoires X1 , . . . , Xn1 indépendantes et identiquement distribuées et d’autre part que les
données du groupe traité correspondent à des réalisations de n2 variables aléatoires Y1 , . . . , Yn2 indé-
pendantes et identiquement distribuées. On suppose de plus que les variables X1 , . . . , Xn1 et Y1 , . . . , Yn2
sont indépendantes.
On souhaite tester l’hypothèse nulle (H0 ) : m1 = m2 contre l’hypothèse alternative (H1 ) : m1 6= m2 .
1 - Justifier que l’on peut considérer que de manière approchée X = n11 (X1 + · · · + Xn1 ) suit une loi
normale N (m1 , σ12 /n1 ) et que Y = n12 (Y1 + · · · + Yn2 ) suit une loi normale N (m2 , σ22 /n2 ). Solution :
Le TCL dit exactement que, si toutes les variables aléatoires Xi suivent la même loi, de moyenne
m1 et de variance σ12 , et sont indépendantes, alors la variable aléatoire X suit, pour n1 assez grand,
σ2 σ2
approximativement une loi normale de moyenne m1 et de variance n11 , donc X ∼ N (m1 , n11 ). Pour
justifier qu’un échantillon de taille 30 est suffisamment grand pour pouvoir appliquer le TCL, il faudrait
regarder la situation médicale en plus de détail – ceci dépasse le cadre du cours et de cette question.
2 - En admettant que la somme de 2 variables aléatoires indépendantes de loi normale suit encore une
loi normale, déterminer la loi de la variable aléatoire D = X − Y sous l’hypothèse (H0 ). Solution :
H
D’abord, E(D) = E(X)−E(Y ) = m1 −m2 =0 0. L’observation clé maintenant est que, par hypothèse, les
variables aléatoires X et −Y sont indépendantes. Par un théorème vu en cours, les variances de variables
aléatoires indépendantes sont additives : V(D) = V(X + (−Y )) = V(X) + V(−Y ) = V(X) + V(Y ) =
σ12 σ22
n1 + n2 . En plus, on a admis que D = X + (−Y ) suit une loi normale (approximativement), donc
σ2 σ22
D ∼ N (0, n11 + n2 )
3 - On note
D
T =q .
σ12 σ22
n1 + n2
Montrer que sous l’hypothèse (H0 ), on a P(−z ≤ T ≤ z) ≈ 1 − α où z est le quantile d’ordre 1 − α2 de la
loi N (0, 1). En déduire le principe d’un test au niveau α pour l’égalité de 2 moyennes. Solution : Puisque
σ2 σ2
D ∼ N (0, n11 + n22 ), il vient T ∼ N (0, 1), c.à.d. T suit une loi centrée réduite (approximativement).
On a vu en cours et TD que ceci implique P(−z ≤ T ≤ z) ≈ 1 − α, où z est le quantile d’ordre 1 − α2
de la loi N (0, 1). On a donc un test très simple pour l’hypothèse H0 (égalité des deux moyennes) : on
calcule les moyennes empiriques X et Y et les écarts-type empiriques σ1 , σ2 des deux échantillons. Si
√ X−Y est en-dehors de l’intervalle [−z, z], on rejette l’hypothèse H0 , sinon on l’accepte.
blah blah
4 - Calculer la valeur de la variable aléatoire T pour les échantillons observés. Qu’en déduit-on
7,075−5,85
pour l’expérience considérée au seuil α = 5 %. Solution : ici, T = denominateur , avec denominateur=
q
(0,576)2 2
30 + (0,614)
28 . On trouve T = 7, 823, ce qui largement est en-dehors de l’intervalle [−z, z], avec
z = 1, 96. On rejette donc l’hypothèse nulle, et on accepte l’hypthèse alternative m0 6= m1 .

Vous aimerez peut-être aussi