Lundi 9 Février 2015 (10h30 – 12h) Numero d'anonymat :
Licence L3 S6, Contrôle Continu 1/3
Examen de STATISTIQUE POUR BIOLOGISTES: Réponses
Complétez cette fiche, à rendre en fin d'épreuve, ne rédigez pas de copie.
– pour les questions calculatoires, reportez les valeurs numériques que vous avez obtenues dans
les emplacements (cadres) prévus à cet effet
– pour les questions à choix multiples, entourez la lettre (ou les lettres) correspondant à votre
choix de réponse(s) exacte(s),
exemple: a b c d e f g h i
une légère pénalité est prévue pour les choix inexacts
contrôlez bien le numéro de l'exercice et celui de la question à l'endroit où vous inscrivez votre
réponse
Exercice 1 Exercice 2 Exercice 4
question 1 question 7 question 4
Exercice 1 Exercice 2 Exercice 4
question 2 question 8 question 5
Exercice 1 Exercice 2 Exercice 4
question 3 question 9 question 6
Exercice 1 Exercice 3 Exercice 4
question 4 question 1 question 7
Exercice 1 Exercice 3 Exercice 4
question 5 question 2 question 8
Exercice 2 Exercice 3 Exercice 4
question 3 question 3 question 9
Exercice 2 Exercice 4 Exercice 4
question 4 question 1 question10
Exercice 2 Exercice 4 Exercice 4
question 5 question 2 question11
Exercice 2 Exercice 4 Exercice 4
question 6 question 3 question12
Exercice 1, question 6: a b c d e f g h i Exercice 1, question 7: a b c d e f g h i
Exercice 2, question 1: a b c d e f g h i Exercice 2, question 2: a b c d e f g h i
Exercice 2, question 10 a b c d e f g h i Exercice 2, question 11 a b c d e f g h i
Exercice 4, question 13 a b c d e f g h i
Diplôme: Licence Sciences
Spécialité: Sciences du vivant
Parcours: CB, BCM et BCPO
Année: 2014/2015 second semestre
Session : contrôle continu, première épreuve
Intitulé UE: VI00FUST
Intitulé épreuve:
Statistique pour Biologistes L3 S6
Durée: 1h30
Enseignant référent: [Link]
L’usage des téléphones portables (et autres appareils électroniques) est interdit pendant toute
la durée de l'épreuve. Les appareils doivent impérativement être éteints et rangés pendant
l'épreuve. Ils ne peuvent donc pas être utilisés comme chronomètre ou calculatrice.
L'épreuve se déroulera sans document.
Le seul type de calculatrice autorisé est le modèle basique quatre opérations.
Trois Tables sont jointes à la fin de ce document :
- table no.1 : loi binomiale + Wilcoxon
- table no.2: loi Normale
- table no.3 : table Mann-Whitney + Wilcoxon
EXERCICE no.1 Test des Signes
Douze peupliers, issus d'un même clonage puis plantés dans des zones polluées, ont fait l'objet de
deux mesures chacun (l'une en août, l'autre en novembre), portant sur la concentration en
aluminium, en microgrammes d'aluminium par gramme de bois:
I II III
concentration en concentration en VARIATION de
Peuplier No. AOUT NOVEMBRE concentration
1 8.1 11.2 3.1
2 10.0 16.3 6.3
3 16.5 15.3 - 1.2
4 13.6 15.6 2.0
5 9.5 10.5 1.0
6 8.3 15.5 7.2
7 18.3 12.7 - 5.6
8 13.3 11.1 - 2.2
9 7.9 19.9 12.0
10 8.1 20.4 12.3
11 8.9 14.2 5.3
12 12.6 12.7 0.1
Environmental Pollution 2004, 131(3) 485-494 article de [Link], [Link], [Link], [Link], [Link]
Pour étudier l'évolution de cette pollution au cours du temps, on considère le caractère X défini
comme la différence concentration en novembre – concentration en août .
Les valeurs observées pour ce caractère X sur notre échantillon de taille n = 12 sont les mesures
enregistrées dans la colonne III ci-dessus.
à partir de la colonne III, MINITAB a calculé les moyennes deux à deux, pour lesquelles il affiche
diverses statistiques descriptives indiquées ci-dessous. De même pour les différences deux à deux
calculées à partir des colonnes II et I.
Statistiques descriptives : moyennes deux à deux
Variable Moyenne EcTyp Variance Minimum Médiane Maximum
moy 2à2 3,358 3,884 15,083 -5,600 3,175 12,300
Statistiques descriptives : différences deux à deux
Variable Moyenne EcTyp Variance Minimum Médiane Maximum
diff 2à2 3,358 4,614 21,285 -7,800 3,150 12,500
On va tester l'hypothèse (H0): la variable aléatoire X est de médiane nulle, en utilisant le test des
signes.
Question 1. On note s la valeur observée pour la statistique du test des signes.
On souhaite pratiquer le test des signes au seuil 10 %. On veut déterminer l'intervalle I tel que:
si s ∉ I , alors on rejette (H0)
si s ∈ I , alors on considère (H0) vraie
Cet intervalle s'écrit sous la forme d'un intervalle fermé I = [ a , b ] . Que vaut a ?
Question 2. Que vaut b ?
Question 3. Dans l'affichage MINITAB ci-dessous, les valeurs de s , p et m relatives à notre
échantillon ont été effacées :
Test du signe pour la médiane : variation de concentration
Test du signe de la médiane = 0,00000 contre test différent de 0,00000
N Au-dessous Egal Au-dessus P Médiane
variation ? ?? ?? s=? p=? m=?
Que vaut s ?
Question 4. Recalculer m .
Question 5. Recalculer p , la P-valeur de l'échantillon.
Question 6. Pour formuler la décision du test, choisissez parmi les phrases ci-dessous:
a) on accepte (H0) car p < 0,5 f) on accepte (H0) car p > 0,1
b) on accepte (H0) car p < 0,95 g) on accepte (H0) car p > 0,05
c) on rejette (H0) car p > 0,05 h) on rejette (H0) car p < 0,1
d) on rejette (H0) car p > 0,1 i) on rejette (H0) car p < 0,95
e) on accepte (H0) car p < 0,1
Question 7. Pour évoquer le risque d'erreur dans cette prise de décision, choisissez parmi les phrases
ci-dessous:
a) on accepte (H0) avec un risque d'erreur de 10%
b) on rejette (H0) avec un risque de première espèce
c) on a un risque d'erreur de 10% car s ∈ I et cet intervalle I a été construit pour un seuil de 10%
d) on rejette (H0) avec un risque de deuxième espèce
e) le risque d'erreur est égal à p
f) on accepte (H0) avec un risque de deuxième espèce
g) on a un risque d'erreur de 10% car s ∉ I et cet intervalle I a été construit pour un seuil de 10%
h) on accepte (H0) avec un risque de première espèce
i) on rejette (H0) avec un risque d'erreur de 10%
EXERCICE no.2 Test des Rangs Signés de Wilcoxon
On reprend intégralement les données de l'exercice précédent.
Question 1. Quelle est l'hypothèse (H0) du test de Wilcoxon? choisir la bonne réponse parmi les
phrases ci-dessous:
a) le caractère X est de loi normale
b) les populations (I) et (II) ont la même moyenne théorique
c) le caractère X suit une loi symétrique
d) le caractère X suit une loi symétrique par rapport à l'origine
e) le caractère X suit une loi discrète
f) la médiane de X (ou médiane théorique) est nulle
g) les deux échantillons (I) et (II) sont homogènes
h) le caractère X suit une loi continue
i) la moyenne théorique est nulle
Question 2. Quand il pratique le test de Wilcoxon, MINITAB sous-entend implicitement que
l'utilisateur a au préalable vérifié une certaine condition. Laquelle? choisir la bonne réponse parmi
les phrases proposées à la question précédente.
Question 3. La statistique du test de Wilcoxon est une variable aléatoire notée W qui peut prendre
diverses valeurs, selon les échantillons considérés. Parmi toutes ces valeurs possibles, quelle est la
valeur maximale?
Question 4. On note w la valeur observée pour la statistique du test de Wilcoxon.
On souhaite pratiquer le test de Wilcoxon au seuil 10%. On va déterminer l'intervalle J tel que:
si w ∉ J , alors on rejette (H0)
si w ∈ J , alors on considère (H0) vraie
Cet intervalle s'écrit sous la forme d'un intervalle fermé J = [ c , d ] . Que vaut c ?
Question 5. Que vaut d ?
Question 6. Au niveau de l'échantillon particulier sur lequel porte notre expérience, quel est le rang
signé attribué au peuplier no.9 ?
Question 7. A partir des données de l'exercice précédent, MINITAB fournit l'affichage ci-dessous,
dans lequel les valeurs de w , q et e ont été effacées.
Test des rangs signés de Wilcoxon : variation de concentration
Test de médiane = 0,000000 contre médiane différente de 0,000000
N pour Statistique Médiane
N test de Wilcoxon P estimée
variation ? ? w=? q=? e=?
Recalculer w .
Question 8. Recalculer q , la P-valeur associée à notre échantillon.
Question 9. Déterminer e .
Question 10. Pour formuler la décision du test, choisissez parmi les phrases ci-dessous:
a) on accepte (H0) car q < 0,95
b) on rejette (H0) car q < 0,95
c) on accepte (H0) car q > 0,05
d) on rejette (H0) car q < 0,05
e) on rejette (H0) car q > 0,05
f) on accepte (H0) car q < 0,1
g) on rejette (H0) car q < 0,1
h) on accepte (H0) car q < 0,9
i) on rejette (H0) car q < 0,9
Question 11. Suite de la question précédente... choisissez parmi les phrases ci-dessous celle(s)
convenable(s) pour exprimer la conclusion du test :
a) on accepte (H0) car q < 0,5
b) on rejette (H0) car q < 0,5
c) on accepte (H0) car q < 0,05
d) on accepte (H0) car q >0,1
e) il y a une modification significative de la concentration en aluminium car q < 0,5
f) on rejette (H0), c'est-à-dire: il y a une modification significative de la concentration
g) on rejette (H0) car q >0,1
h) on accepte (H0) autrement dit: la pollution à l'aluminium n'a pas empiré
i) la pollution a significativement augmenté car e > 0
EXERCICE no.3 Coefficient Binomial, Loi Binomiale
Soit S une variable aléatoire qui suit la loi binomiale B ( 7 , ½ ).
Question 1. Déterminer le coefficient binomial: C73 noté aussi
( ) 7
3
Question 2. Calculer P(S=0)
Question 3. Calculer P ( S ≤ 3 )
EXERCICE no.4 Test de Mann & Whitney
Les larves de poissons marins (ichtyoplancton) sont victimes de prédateurs tels que les Crustacés ou
les Méduses. Le taux de prédation est défini comme le quotient Ne / ( Ni Np D ) avec :
Ne = nombre de proies mangées
Ni = nombre initial de proies dans l'aquarium
Np = nombre de prédateurs dans l'aquarium
D = durée de l'expérience
Le caractère étudié est : X = ln ( 1 / taux de prédation )
On voudrait tester l'hypothèse (H0) : le caractère X suit la même loi dans la population des
Crustacés que dans la population des Méduses.
L'étude porte sur 13 aquariums contenant uniquement des Crustacés et 18 aquariums ne contenant
que des Méduses.
Premier échantillon aquariums de Crustacés (effectif n1 = 13)
aquarium no.i 1 2 3 4 5 6 7 8 9 10 11 12 13
xi 3,65 4,13 4,45 4,59 5,12 5,37 5,95 6,26 6,85 7,63 9,47 9,67 10,21
Deuxième échantillon aquariums de Méduses (effectif n2 = 18)
aquarium no.i 14 15 16 17 18 19 20 21 22
xi 3,88 4,60 4,72 4,83 4,93 5,00 5,22 5,43 5,62
aquarium no.i 23 24 25 26 27 28 29 30 31
xi 5,73 5,88 6,00 6,34 6,57 6,71 7,19 7,20 8,84
Canadian Journal of Fisheries and Aquatic Sciences, 53, 1126-1235, 1996, article de: [Link], [Link], [Link]
A partir des mesures sur ces deux échantillons, MINITAB calcule les moyennes deux à deux, ainsi
que les différences deux à deux, pour lesquelles il fournit diverses statistiques descriptives :
Statistiques descriptives : moyennes 2 à 2
Variable Moyenne EcTyp Variance Somme Minimum Médiane Maximum
moyennes 2 à 2 6,0658 1,1956 1,4295 3008,6400 3,6500 5,8550 10,2100
Statistiques descriptives : différences 2 à 2
Variable Moyenne EcTyp Variance Somme Minimum Médiane Maximum
différences 2 à 2 0,595 2,430 5,903 139,330 -5,190 0,270 6,330
Question 1. La statistique du test de Mann-Whitney est une variable aléatoire U dont la valeur
observée est notée u. On fixe comme seuil 5%. On recherche un intervalle I tel que:
si u ∉ I, alors on rejette (H0)
si u ∈ I, alors on considère (H0) vraie
Il sera noté sous forme d'un intervalle ouvert I = ] a1 , a2 [ . Déterminer la borne inférieure a1 .
Question 2. Déterminer la borne supérieure a2 .
Question 3. Quatre autres variables aléatoires R1 , R2 , U1 et U2 interviennent dans le test de
Mann-Whitney. On fournit en indication: U2 = R1 - n1 ( 1+ n1 ) / 2 (formule admise).
En général, pour deux échantillons quelconques de tailles n1 = 13 et n2 = 18, donnez la valeur
minimale parmi toutes les valeurs possibles pour R2 .
Question 4. En général, pour deux échantillons quelconques de tailles n1 = 13 et n2 = 18, que vaut
la somme R1 + R2 ?
Question 5. En général, pour deux échantillons quelconques de tailles n1 = 13 et n2 = 18, donnez
la valeur maximale parmi toutes les valeurs possibles pour R1 .
Question 6. Quel est le rang attribué à l'aquarium no.10 de notre expérience ?
Question 7. Sur les deux échantillons particuliers étudiés dans notre expérience, on observe que les
variables aléatoires R1 , R2 , U1 et U2 prennent comme valeurs respectives: r1 , r2 , u1 et u2 .
Calculer r1
Question 8. Calculer u2
Question 9. Calculer u1
Question 10. Déterminer u.
Question 11. Dans l'affichage MINITAB ci – dessous, la valeur z a été effacée, recalculez-la.
Test de Mann-Whitney et IC : Crustacés; Méduses
N Médiane
Crustacés 13 z = ??
Méduses 18 ???
L'estimation ponctuelle de η1 - η2 est t = ??
Le pourcentage IC (95,2) pour η1 - η2 est (-0,950;1,901)
W = ???
Le test de η1 = η2 contre η1 ≠ η2 est significatif sur 0,7640
Question 12. La valeur t a été effacée, retrouvez-la.
Question 13. Pour formuler la conclusion de cette étude, sélectionnez parmi les phrases ci-dessous
celle(s) qui est (ou sont) valable(s):
a) on accepte (H0) car 0 est situé dans l'intervalle (-0,950;1,901) .
b) on rejette (H0) car t est situé dans l'intervalle (-0,950;1,901) .
c) on rejette (H0) car 0,7640 > 0,05
d) on accepte (H0) car 0,7640 < 0,95
e) on accepte (H0) car t est situé dans l'intervalle (-0,950;1,901) .
f) on rejette (H0) car 0 est situé dans l'intervalle (-0,950;1,901) .
g) on accepte (H0) car 0,7640 > 0,05
h) on rejette (H0) car 0,7640 < 0,95
i) on rejette (H0) car z est situé hors de l'intervalle (-0,950;1,901) .
TABLES
Loi Binomiale
Soit Z une variable aléatoire de loi binomiale B (N,½).
Pour différents entiers k et N , on vous fournit quelques valeurs de P ( Z ≤ k ) :
N=9 N = 10 N = 11 N = 12 N = 13
k=0 0,001953 0,000977 0,000488 0,000244 0,000122
k=1 0,019531 0,010742 0,005859 0,003174 0,001709
k=2 0,089844 0,054687 0,032715 0,019287 0,011230
k=3 0,253906 0,171875 0,113281 0,072998 0,046143
k=4 0,500000 0,376953 0,274414 0,193848 0,133423
k=5 0,746094 0,623047 0,500000 0,387207 0,290527
k=6 0,910156 0,828125 0,725586 0,612793 0,500000
Test de Wilcoxon
+
Soit WN la statistique du test de Wilcoxon sur les échantillons sans ex-aequo de taille N.
Pour différents entiers N et différents seuils α , on vous fournit le plus grand entier k tel que :
+
P ( WN ≤ k ) ≤ α / 2
N α = 0,10 α = 0,05 α = 0,02 α = 0,01 α = 0,001
11 13 10 7 5 0
12 17 13 9 7 1
13 21 17 12 9 2
14 25 21 15 12 4
15 30 25 19 15 6
16 35 29 23 19 8
17 41 34 27 23 11
18 47 40 32 27 14
19 53 46 37 32 18
20 60 52 43 37 21
+
Pour différents entiers k et N , on vous fournit quelques valeurs de P ( WN ≤ k ) :
N k = 11 k = 12 k = 13 k = 14 k = 15 k = 16 k = 17 k = 18 k = 19 k = 20
11 0,027 0,034 0,042 0,051 0,062 0,074 0,087 0,103 0,120 0,139
12 0,013 0,017 0,021 0,026 0,032 0,039 0,046 0,055 0,065 0,076
Loi Normale
La fonction de répartition F d'une variable aléatoire Z de loi normale centrée réduite N ( 0 , 1)
est définie par: F(x) = P ( Z ≤ x ) pour tout réel x.
Le nombre F(x) peut être interprété comme la surface grisée:
La table ci-dessous fournit des valeurs de F(x) :