Module : Biostatistique (Réalisé par Dr ADDAD D.
) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
L’estimation de μ par intervalle de confiance est couramment utilisée en pratique. Elle
augmente le niveau d’information par rapport à une estimation ponctuelle. Elle permet d’avoir
un aperçu des valeurs possibles pour μ. Un intervalle de confiance à 100 (1−α)% pour μ
consiste à trouver deux bornes, inférieure et supérieure, qui dépendent de l’échantillon tiré. Si
on tire un grand nombre de fois un échantillon et si pour chacun on calcule l’intervalle de
confiance, alors dans 100 (1−α)% des cas le paramètre μ devrait être dans l’intervalle de
confiance.
1. Notion d’intervalle de confiance d’une moyenne
C’est l’intervalle à l’intérieur duquel peut se situer la vraie valeur de la moyenne de la
population µ.
Cet intervalle est estimé en fonction d’un coefficient de risque α, qui représente la
probabilité de se tromper lorsque on affirme que la valeur du moyenne dans la
population statistique se situe à l’intérieur de l’intervalle donnée
Exemple :
𝑥 =158,86 et α = 0,05
P (157,17˂µ˂160,55)=1- α =1-0,05= 0,95
Et P (µ≤ 157,17) + P(µ ≥ 160,55) = α = 0,05
Donc on a prend 95% de chance pour que la moyenne d’un échantillon 𝑥 soit proche
ou égale la moyenne de la population et seulement 5% de chance que cette moyenne
soit différente significativement de µ.
Un échantillon représentatif doit avoir une moyenne 𝑥 très proche de µ. Pour n
échantillon les moyennes couvrent un intervalle qui doit, implicitement, contenir µ. Si
ces échantillons sont représentatifs cet intervalle est dit Intervalle de confiance ou
l’intervalle estimateur de µ
Loi de Student
Si 𝑥 et 𝑆 2 dénotent la moyenne et la variance d’un échantillon aléatoire de taille n issu
de la loi N (μ, σ2), une distribution normale de moyenne μ et de variance σ2, alors
1
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
𝑥 −𝜇
𝑆 est distribuée selon une loi t à (n−1) degrés de liberté. Ce théorème permet de
𝑛
faire de l’inférence sur le paramètre μ d’une loi normale. Les bornes de l’intervalle de
confiance à 100(1−α) % pour μ sont obtenues à partir de l’égalité suivante:
𝑥 −𝜇
1−α = P [−t(n−1, α/2) ≤ 𝑆 ≤ t(n−1, α/2)]
𝑛
𝑆 𝑆
=P [𝑥 − t(n−1, α/2) ≤ μ ≤ 𝑥 + t(n−1, α/2) ].
𝑛 𝑛
L’intervalle de confiance est donnée ́par :
𝑺 𝑺
IC=[𝒙− t(n−1, α/2) ; 𝒙 + t(n−1, α/2) ].
𝒏 𝒏
Loi Z limite central
Si x1, x2, . . . sont des variables aléatoires indépendantes et identiquement distribuées avec
𝑥 −𝜇
moyenne μ ∈ R et avec variance 0< σ2<∞, alors quand n → ∞ on obtient σ ∼N(0,1).
𝑛
Et sous certaines conditions de régularité qui ne seront pas cités ici, la distribution
𝑥 −𝜇
asymptotique lorsque n tends vers ∞ est T= σ ∼ N(0,1).
𝑛
Ce théorème nous permet de construire un intervalle de confiance `a 100(1−α)% pour μ à
partir de l’égalité :
𝑥 −𝜇
1−α = P [−z α/2 ≤ 𝑆 ≤ z α/2)]
𝑛
𝑆 𝑆
=P [𝑥 − zα/2 ≤ μ ≤ 𝑥 + z α/2 ].
𝑛 𝑛
L’intervalle de confiance est donnée ́par :
2
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
𝑺 𝑺
IC = [𝒙− t(n−1, α/2) ; 𝒙 + t(n−1, α/2) ].
𝒏 𝒏
Exercice 01
Donner l’intervalle de confiance d’un échantillon de taille des enfants d’une ville donnée :
70 85 93 99 101 105 110 121 138 166
74 85 93 99 102 106 110 125 140 180
79 87 94 99 102 107 114 128 147 180
Solution 1
∑𝑋 𝑖 3339
𝑥= = = 111,3
𝑛 30
1 ∑ 𝑥𝑖 2 1 3339 2
𝑆 2 = 𝑛−1 (∑𝑥𝑖 2 − = 29 (395347 − ) = 817,80
𝑛 29
817,80
𝑆𝑥 = = 5,22
30
Intervalle de confiance 𝒏 ≥ 𝟑𝟎
𝑍𝛼 = 1,96 (𝑑𝑒𝑟𝑛𝑖é𝑟𝑒 𝑙𝑖𝑔𝑛𝑒 𝑑𝑒 𝑡𝑎𝑏𝑙𝑒)
2
𝐼𝐶 = 𝑋 ∓ 𝑍𝛼 𝑆𝑥 ⇒ 𝐼𝐶 = 111,3 ∓ 1,96(5,22) = 111,3∓10,23
2
𝐼𝐶: 101,06; 121,53 𝑑𝑜𝑛𝑐 𝜇 𝑒𝑠𝑡 𝑐𝑜𝑚𝑝𝑟𝑖𝑠 𝑑𝑎𝑛𝑠 𝑐𝑒𝑡 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑙𝑒
Exercice 02 :
on admet que le taux de cholestérol chez une femme suit une loi normale sur un échantillon de
10 femme on a obtenu les taux de cholestérol (Eng/l) suivant : 3,0 ; 1,8 ; 2,1 ; 2,7 ; 1,4 ; 1,9 ;
2,2 ; 2,5 ; 1,7 ; 2,0
3
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
1) Déterminer une estimation ponctuelle de la moyenne et de l’écati type du taux
2) Déterminer un intervalle de confiance pour la moyenne du taux au seuil 1% ?
3) Déterminer un intervalle de confiance pour la moyenne du taux au seuil 5% ?
Solution 2 :
Il s’agit de déterminer l’intervalle de confiance d’une moyenne d’un petit échantillon.
∑𝑋 𝑖 21,3
𝑥= = = 2,13
𝑛 10
4,3 2
1 ∑ 𝑥𝑖 2 47,49−
𝑆 = 𝑛−1 (∑𝑥𝑖 −
2 2
= 10
= 0,24
𝑛 9
𝑆2 0,24
𝑆𝑥 = = = 0,38
𝑛 10
𝐼𝐶1% = 𝑥 ∓ 𝑡 𝑑𝑑𝑙 ;
𝛼 𝑆𝑥 ⟹ 𝐼𝐶 = 2,13 ∓ 0,38 × 3,2498
2
⟹ 𝐼𝐶 = 2,13 ∓ 1,22
⟹ 𝐼𝐶: 0,91; 3,35 𝑑𝑜𝑛𝑐 𝜇 ∈ 0,91; 3,35
𝑡9,1% = 3,2498
𝑡9,5% = 2,2622
𝐼𝐶5% = 2,13 ∓ 0,38 × 3,2498 = 2,13 ∓ 0,851 ⟹ 𝐼𝐶: 1,28; 2,98 𝑑𝑜𝑛𝑐 𝜇 ∈ 1,28; 2,98
4
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
Chapitre 3. Les tests de conformité et d’indépendance
1. Test de Khi-deux
Le test X2 est un test non paramétrique qui permet de tester d’équation d’une série de donnée
à une famille de lois de probabilité autrement il est conçu pou déterminer si les déférences
entre deux distributions de fréquence est attribuable alérion titre d’échantillonnage ou est
suffisamment grande pour être statistiques significat ou de tester l’indépendance entre deux
variables qualitative
1.1.Test Khi-deux d’ajustement
Objectif : adéquation d’une loi théorique à une distribution observée.
5
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
Démarche :
- Analyse du phénomène et de la distribution observée.
- Choix de la loi théorique.
- Estimation des paramètres de la loi suivant les observations.
- Test d’adéquation.
Nombre de degrés de liberté = k-1
Prise de décision :
Si X2obs< X2tab alors l’hypothèse d’adéquation à la distribution théorique est jugée
acceptable
Si X2obs > X2table alors on rejette l’hypothèse au risque α de se tromper.
1.2.Test Khi-deux d’indépendance
Le croisement de deux variables qualitatives donne un tableau de contingence. Le test de
Khi2 peut s’appliquer si les données sont indépendantes (non appariées, par exemple les
individus sont tous différents).
Soit X possédant k modalités et la variable Y répartie en p classes.
Ho : les variables sont indépendantes ou répartition uniforme des effectifs
Pour effectuer le test, on dresse le tableau de contingence qui contient les fréquences
absolues observées aij :
La table de contingence présente les effectifs conjoints. À la ligne i, colonne j, on trouve nij ,
qui est le nombre d’individus dans la classe i pour le premier caractère et dans la classe j pour
le second. Si le nombre de modalités des deux caractères sont r et s, la table a r lignes et s
colonnes. Les effectifs marginaux sont les sommes par ligne ou par colonne de la table de
6
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
contingence ; est le nombre total d’individus dans la classe i pour le
premier caractère ; est le nombre total d’individus dans la classe j pour le
second caractère. Le nombre total d’individus est
La valeur attendue dans chaque case, sous l’hypothèse nulle, se calcule par
La statistique du test est :
(𝑂−𝐸)2
2
ou 𝑥𝑜𝑏𝑠 = ∑𝑛𝑖=0 𝐸
Sous l’hypothèse nulle où les deux caractères sont indépendants, T suit la loi du khi-deux de
paramètre ddl = (r−1)(s−1).
2 2
La règle de décision est si 𝑥𝑜𝑏𝑠 est supérieur aux 𝑥𝑡𝑎𝑏 alors l’hypothèse d’indépendance des
variable est rejetée.
Attention, on ne doit pas avoir plus de 20% d’effectifs théoriques inférieurs à 5, aucun
inférieur à 1.
X2 de conformité ou d’ajustement X2 d’indépendance ou de contingence
Une seule variable Deux variables
Permet de savoir si les distributions observe et Mesure la liaison entre deux variables
théorique sont conformes ou non qualitative.
Nbre de classes des deux
bre
N de modalités de la variable
variable
ddl = K-1 ddl= (r-1)(s-1)
les hypothèses :
Les hypothèses
o H0⟹les fréquences observées
o H0: les deux variables sont
conforment aux frequencies théoriques
o H1⟹les distribue observée ne conforme indépendantes
pas les distribue théorique o H1: l’une des variables est dépendante de
l’autre.
Formule Formule
7
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
𝑛
2
(𝑂 − 𝐸)2
𝑥𝑜𝑏𝑠 =
𝐸
𝑖=0
Conditions d’application de X2
n assez grand supérieur à 30 voir même supérieur à 60
Les effectifs théoriques doivent être supérieurs ou égaux à 5
NB si ce n’est pas le cas on procède à un regroupement de classes.
Exercice 03
On effectue le croisement entre des pois à fleurs blanches et des pois à fleurs rouges. On
obtient en deuxième génération sur 600 plantes les effectifs suivants :
Phénotype Rouge Rose Blanc
Effectif 141 325 134
Donner les proportions théoriques de la répartition mendélienne pour les trois couleurs.
Calculer la statistique de test pour le test du khi-deux.
Solution 03
Notons R l’allèle induisant la couleur rouge et B l’allèle induisant la couleur blanche. On
suppose que les phénotypes “fleurs rouges”, “fleurs roses” et “fleurs blanches”
correspondent respectivement aux génotypes RR, RB et BB. Si on croise deux individus de
génotypes respectifs RR et BB, on obtient forcément des individus de génotype RB à la
première génération. À la seconde génération, on obtiendra théoriquement un quart de
génotypes RR, la moitié de génotypes RB et un quart de génotypes BB ; on devrait donc
observer théoriquement un quart de plantes à fleurs rouges, la moitié à fleurs roses, et un
quart à fleurs blanches.
Les effectifs théoriques correspondants sont 150, 300, 150.
La statistique de test du khi-deux prend la valeur :
2 (𝑂−𝐸)2 (141−150)2 (325−300)2 (134−150)2
𝑥𝑜𝑏𝑠 =∑ = + + = 4.33
𝐸 150 300 150
8
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
Cette valeur doit être comparée aux quantiles de la loi du khi-deux de paramètre 3 − 1 = 2.
2
D’après le tableau de 𝑥 2 , la valeur de 𝑥𝑡𝑎𝑏 égale à 5.99, et dépasse 4.33. On accepte
l’hypothèse d’adéquation de la loi observée avec la loi théorique.
Exercice 04.
Le centre de transfusion sanguine de Pau a observé la répartition suivante sur 5000 donneurs.
O+ → 2291 A+ → 1631 B+ → 282 AB+ → 79
O- → 325 A- → 332 B- → 48 AB- → 12
1. Écrire la table de contingence correspondant à ces observations.
2. Calculer la valeur prise par la statistique du test du khi-deux de contingence.
3. Au seuil de 1% que concluez-vous ?
Solution 04
1. la table de contingence de ces observations est la suivante
2. Calcule de la valeur prise par la statistique du test du khi-deux de contingence.
2
On calcule :Xobs = 5000
groupes O E O- E (O-E)2 (O- E)2/E
O+ 2291 4283x2616/5000=2240,8656 50.1344 2513,45806 1,121646056
A+ 1631 4283x1963/5000=1681,5058 -50.5058 2550,83583 1,516994966
9
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
B+ 282 4283x330/5000=282,678 -0.678 0,459684 0,001626175
AB+ 79 4283x91/5000=77,9506 1.0494 1,10124036 0,014127414
O- 325 717x2616/5000=375,1344 -50.1344 2513,45806 6,700153501
A- 332 717x1963/5000=281,4942 50.5058 2550,83583 9,061770486
B- 48 717x330/5000=47,322 0.678 0,459684 0,00971396
AB- 12 717x91/5000=13,0494 -1.0494 1,10124036 0,084390114
(𝑂−𝐸)2
2
𝑥𝑜𝑏𝑠 = ∑𝑛𝑖=0 = 18.5104
𝐸
Autre Méthode
Sous l’hypothèse d’indépendance, la statistique de test suit la loi de khi-deux de paramètre
ddl= (4 − 1)(2 − 1) = 3. Le quantile d’ordre 0.99 de cette loi est 11.34.
Comme 18.5104 est supérieur, on conclut qu’il y a dépendance entre le groupe
sanguin et le rhésus, au vu de ces données.
10
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
11
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
2. Test de Student t
2.1. Comparaison d’une moyenne d’un échantillon à celle d’une population
Ce test sont destiné à vérifier si un échantillon peut être considéré comme extrait d’une
population donnée ou représentatif de cette population, vis-à-vis d'un paramètre comme la
moyenne observée.
On tire de la formulation de l’intervalle de confiance, le test de signification suivant:
Ce test permet de vérifier deux hypothèses qui sont:
H0 : 𝑥 = μ c’est –à-dire l’échantillon appartient à la population cible
H1 : 𝑥 ≠μ c’est-à-dire l’échantillon n’appartient pas à la population cible (appartient à une
autre population que la population cible).
A comparer la valeur observée à celle théorique lue de la table de t avec α seuil d’erreur pour
arriver à des conclusions
n<30 : cas des petits échantillons n˃30 : cas des grands échantillons
σ connue σ inconnue σ connue σ inconnue
𝑥−𝜇 𝑥−𝜇 𝑥−𝜇
𝑡𝑜𝑏𝑠 = σ 𝑧𝑜𝑏𝑠 = σ 𝑧𝑜𝑏𝑠 =
𝑆
𝑛 𝑛 𝑛
t5% : valeur lue a partir de la table t avec α= 5% Z5%: valeur lue a partir de la dernière ligne de la
et ddl =n-1 table t avec α= 5 %
12
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
Si tobs < ttab on accepte H0
Si tobs > ttab on accepte H1
2.2. Comparaison de deux moyennes de deux échantillons
La valeur à calculer pour conclure est donnée par la formule suivante :
𝑥 1 −𝑥 2 𝑺𝟐𝟏 𝑺𝟐𝟐
𝑡𝑜𝑏𝑠 = avec 𝑺𝑫 = +
𝑺𝑫 𝒏𝟏 𝒏𝟐
Le test t teste deux hypothèses qui sont:
H0 : 𝑥1 = 𝑥2 c’est –à-dire les deux échantillons appartiennent à la même population
H1 : 𝑥1 ≠ 𝑥2 c’est –à-dire les deux échantillons n’appartiennent pas à la même population
( ils appartiennent à deux populations différentes).
13
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
2.3.Comparaison deux moyennes de deux échantillons appariés
La procédure Test T pour échantillons appariés compare la moyenne de deux variables pour
un seul groupe. Elle permet de calculer les différences entre les valeurs des deux variables
pour chaque observation et de tester si la moyenne diffère de 0.
Exemple : Dans le cadre d'une étude sur l'hypertension, des mesures sont prises sur tous les
patients au début de l'étude, un traitement est administré, puis on procède à une nouvelle
mesure. Par conséquent, chaque sujet est l'objet de deux mesures, souvent nommées mesures
avant et après.
Le test t des échantillons appariés se déroule comme suit
calcule des di les différences entre les couples d’observations des deux échantillons
∑ 𝑑𝑖
calcule de la moyenne des différences 𝑑= 𝑛
14
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
2
(∑ 𝑑 𝑖 )
∑ 𝑑 𝑖2 −
calcule de la variance des différence 𝑆𝑑2 = 𝑛
𝑛 −1
𝑆𝑑2
calcule de l’écart type de la moyenne de différences 𝑆𝑑 = 𝑛
d
calcule de 𝑡𝑜𝑏𝑠 = 𝑆 puis on compare le t obs au ttab lue de la table t à n- 1 ddl
𝑑
3. Test de Fisher
Le test F est utilisé pour tester si deux variances de deux échantillons indépendants viennent
d’une même population de variance ou variance commune 𝜎 2 . Ce test s’exprime comme
suit :
𝑆𝐺2 𝑝𝑙𝑢𝑠 𝑔𝑟𝑎𝑛𝑑𝑒
𝐹=
𝑆𝑃2 𝑝𝑙𝑢𝑠 𝑝𝑒𝑡𝑖𝑡
Exemple
𝑆12 = 40.2 ; 𝑆22 = 6.97
H0 → 𝑆12 = 𝑆22
H1 → 𝑆12 ≠ 𝑆22 → 𝑆12 > 𝑆22
𝑆𝐺2 𝑝𝑙𝑢𝑠 𝑔𝑟𝑎𝑛𝑑𝑒 40.2
𝐹= = 6.97 = 5.76 F(5%,6;6) = 4.28
𝑆𝑃2 𝑝𝑙𝑢𝑠 𝑝𝑒𝑡𝑖𝑡
𝐹𝑜𝑏𝑠 > 𝐹𝑡𝑎𝑏 ⇒on rejette
𝐻0 𝑒𝑡 𝑜𝑛 𝑎𝑐𝑐𝑒𝑝𝑡𝑒 𝐻1 𝑑𝑜𝑛𝑐 𝑙𝑒𝑠 𝑑𝑒𝑢𝑥 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑠𝑜𝑛𝑡 𝑖𝑛é𝑔𝑎𝑙𝑒𝑠
15
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
16
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
Série 1 : Tests statistiques Biochimie
Exercice 1. La taille moyenne des hommes aux Pays-Bas est de 1,76 mètre. Sur un
échantillon, on trouve
𝑥= 1,78 m. On veut savoir si sur cet échantillon la taille est "significativement " plus grande
que la moyenne. On fait l'hypothèse que la variable aléatoire est indépendante de la loi
1
Normale. Ici on suppose que б est connu et que б= 8
1. Pour répondre à la question, quelles sont les hypothèses à tester.
2. Construire le test statistique permettant de répondre à la question posée. On suppose que n
= 30, que peut-on conclure?
3. Même question pour n = 100 et n = 150.
Exercice 2. La créatine phosphokinase (CPK) est une enzyme essentielle dans le
métabolisme énergétique musculaire. Elle peut être employée comme marqueur biologique
des lésions musculaires et permet d’apprécier dans le suivi d’un groupe de sportifs la
tolérance de la préparation musculaire vis-à-vis de l’intensité et des types de travail. On
considère des valeurs de CPK de l’ordre de 1000 (en UI/l) comme importantes. On présente
ici les valeurs de CPK relevées
– chez 5 footballeurs d’une équipe de Ligue 1 : 180 220 392 266 387
– chez 5 tennismen : 332 405 308 507 376
Peut on conclure qu’il ya une corrélation entre l’intensité et des types de sport et la tolérance
de la préparation musculaire ?.
Exercice 3 Parmi des enfants présentant des troubles du comportement on en choisit 18 au
hasard que l'on répartit en deux groupes A et B. Au groupe A on projette un film d'aventure et
au groupe B on projette un documentaire sur la montagne. Pendant les six heures qui suivent
la projection, on dénombre les comportements agressifs de chacun des enfants des deux
groupes.
A 25 40 17 8 50 19 33 72 8 88
B 20 65 25 33 40 15 9 17
1. On suppose que les conditions d'application sont vérifiées pour un test t. Rappelez ces
conditions.
2. Peut-on dire alors que la nature de la projection a exercé une influence sur le comportement
agressif des enfants ?
Exercice 4
Un échantillon de 20 poissons de la même espèce a fourni les poids suivant (en g)
61 82 92 97 101 104 109 118 131 155
105 110 121 138 166 74 85 93 99 102
1. Calculer la moyenne et la variance de cette série.
2. La distribution de cette variable peut-elle être considérée comme normale ?
2. Déterminer un intervalle de confiance à 95% de la moyenne.
3. La moyenne est-elle significativement différente de 100 avec un risque de 5% ? de 1%
Exercice 5
Pour étudier l'action d'un produit sur un paramètre biologique, on a mesuré, sur un échantillon
de 10 individus, la valeur du paramètre avant et après le traitement. Les résultats sont les
suivants :
Individu 1 2 3 4 5 6 7 8 9 10
Valeur avant traitement 5,33 6,13 5,66 4,50 5,35 6,32 4,24 5,83 6,27 4,86
17
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
Valeur après traitement 5,32 6,00 5,64 4,59 5,49 6,17 4,11 5,86 6,13 4,68
Le traitement modifie-t-il de façon significative le paramètre biologique (a = 5 % ) ?
Exercice 6
Lors d’une enquête sur la durée de sommeil des enfants de 2 à 3 ans dans un département
français, on a trouvé une moyenne du temps de sommeil par nuit de 10,2 heures dans un
groupe de 40 enfants. L’écart type est 2,1 heures.
• La moyenne du temps de sommeil est de 11,7 heures chez les enfants de cet âge.
• La durée de sommeil des enfants de ce département diffère-t-elle du temps de sommeil des
enfants de cet âge?
18
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
19
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
20
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
TP 2 : Tests statistiques
Exercice 1. Un producteur de pommes a dans son cahier des charges la clause suivante : "le
diamètre d’une pomme dans chaque lot fourni devra avoir un écart-type inférieur ou égal à
0,65 centimètres". Sur 8 pommes extraites au hasard dans un lot, on obtient les diamètres en
centimètres suivants :
On suppose que le diamètre en centimètres d’une pomme de la production peut être modélisé
par une var X suivant une loi normale.
Peut-on affirmer, au risque 1%, que le cahier des charges n’est pas respecté ?
Exercice 2. On cherche à savoir si le rendement moyen en blé dans une région A est
strictement supérieur à celui dans une région B. On considère alors 16 parcelles différentes
réparties sur les deux régions.
Le rendement en blé en quintaux par hectare dans la région A peut être modélisé par une var
X1, et celui dans la région B peut être modélisé par une var X2. On suppose que X1 et X2
suivent des lois normales.
Proposer un test statistique adapté au problème et conclure.
Exercice 3. On dispose de deux lots de boîtes de sauce italienne conditionnées de la même
manière mais provenant de producteurs différents. On s’intéresse à la teneur en grammes de
viande dans celles-ci.
21
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
La teneur en grammes de viande dans une boîte provenant du premier producteur peut être
modélisée par une var X1, et celle dans une boîte provenant du deuxième producteur peut être
modélisée par une var X2. On suppose que X1 et X2 suivent des lois normales.
1. Peut-on admettre que la dispersion de la teneur de viande dans une boîte ne diffère pas
selon les producteurs ?
2. Peut-on affirmer qu’il y a une différence entre les producteurs quant à la teneur moyenne en
viande dans les boîtes ?
Peut-on affirmer, au risque 5%, que les jugements ne sont pas en moyenne identiques ?
Exercice 4. Un expérimentateur cherche à savoir si en moyenne la concentration d’α-
lactalbumine dans le collostrum de la vache est significativement différente de la
concentration d’α-lactalbumine dans le lait de la vache. Il examine 12 vaches et pour chacune
d’elles, il mesure en mg/mL la concentration d’_-lactalbumine. Les résultats sont :
La concentration d’α-lactalbumine dans le collostrum d’une vache peut être modélisée par une
var X1 et la concentration d’α-lactalbumine dans le lait d’une vache peut être modélisée par
une var X2. On suppose que X1 � X2 suit une loi normale. Proposer un test statistique
adapté au problème et conclure.
Exercice 5. On a demandé à 257 personnes choisies au hasard dans la rue d’indiquer la langue
étrangère qu’il connait le mieux. Les résultats sont :
Peut-on affirmer, au risque 5%, que les connaissances en langues étrangères dépendent du
sexe ?
22
Module : Biostatistique (Réalisé par Dr ADDAD D.) M1 Biochimie
Chapitre 2. Estimation de l’intervalle de confiance pour une moyenne
Exercice 6. Sur 14 familles composées d’une mère et d’une fille, on examine le QI de la mère
et le QI de la fille. Les résultats sont :
Peut-on affirmer qu’il y a une liaison significative entre le QI de la mère et le QI de la fille ?
23