Travaux Dirigés de et Exercice de synthèse
A) Travaux Dirigés
Exercice 1
Soit une population de 7 personnes dont le nombre de visites au mois de juillet chez le médecin est
respectivement 0, 2, 1, 3, 1, 3, 5
1- Calculer le nombre moyen et l’écart type du nombre de visites
2- Dans cette population
a) Ecrire tous les échantillons de taille 2 qu’on peut extraire de cette population avec remise
b) Calculer les moyennes et les écart-types de chacun de ces échantillons
c) Calculer la moyenne et l’écart-type de la distribution d’échantillonnage des moyennes
Exercice 2
Dans le but d’étudier la cartographie de la polio sauvage dans un pays où cette maladie n’est pas encore
complètement éradiquée et de prévoir une stratégie de vaccination, l’on a recensé les nombres de cas
suivants dans 20 villes.
(850, 740, 900, 1070, 930, 850, 950, 980, 980, 880, 1000, 980, 930, 650, 760, 810, 1000, 1000, 960, 960).
Coefficient d’aplatissement= -0,96 ; Coefficient d’asymétrie= 0,57.
1. Trouvez le minimum, le maximum, le premier quartile, le troisième quartile, la médiane, la
moyenne, la variance, les deux modes et l’étendu.
2. Interprétez la moyenne, la médiane, les modes, Q1 et Q3.
3. Déterminez l’intervalle interquartile et l’interpréter.
4. Comparer la moyenne, les modes et la médiane. La distribution est-elle symétrique ?
5. Peut-on dire que cette distribution ressemble à une loi normale ?
Exercice 3
Dans une étude visant à étudier les facteurs déterminants de l’hépatite B, une enquête systématique a
abouti aux données suivantes sur le nombre de nouveaux cas en deux mois dans 31 villes camerounaises.
80,63,51,61,60,73,73,61,81,50,52,46,98,85,62,47,56,57,84,49,49,62,72,85,78,74,66,64,77,83,70.
a) Choisissez une amplitude de votre choix et faites l’histogramme de la distribution des nombres de
nouveaux cas.
b) Calculez la moyenne en utilisant les données (b1) individuelles et (b2) groupées
c) Déterminez les quartiles Q1, Q2, Q3 et les interprétez.
d) Déterminez l’intervalle interquartile et l’intervalle interquartile relatif.
Exercice 4
Une compagnie pharmaceutique vient de mettre au point un nouveau test de dépistage du cancer du sein.
Une étude est menée en vue d’évaluer sa validité.
On note :
T+ l’événement « test positif » et T- l’événement « test négatif ».
M+ l’événement « patient malade » et M- l’événement « pas malade ».
1
1. Définir les valeurs suivantes : Sensibilité, Spécificité, Valeur Prédictive Positive et Valeur Prédictive
Négative.
2. Quelles sont les valeurs idéales pour ces valeurs ?
3. Parmi ces valeurs, lesquelles sont en principe d’une grande utilité pour un médecin ? Justifier votre
réponse? Pourquoi en pratique ces valeurs ne sont en général pas disponibles ?
4. A quoi sert une courbe ROC (Receiver Operating Characteristic). Où se trouve le point ideal ?
5. Pour estimer ses performances sur un échantillon de 52119 femmes, on a obtenu les résultats
suivants :
M+ M-
T+ 156 1234
T- 78 50651
Donnez les valeurs estimées de : Sensibilité, Spécificité, Valeur Prédictive Positive et Valeur
Prédictive Négative. Interprétez.
Exercice 5
Les résultats d’une enquête menée dans la ville de Yaoundé chez 104 pharmaciens quant à leur salaire
journalier ( ) ont montré que =1052348FCFA et =543838FCFA2, où est
l’estimation du salaire moyen.
1- Donner une estimation du salaire journalier moyen d’un pharmacien ainsi que l’écart-type
2- Calculer le coefficient de variation du salaire
3- Donner un intervalle de confiance à 95% et 97% du salaire moyen et interpreter
Exercice 6
On a mesuré la concentration massique du phosphore (mg/l) chez 50 adultes. Les données obtenues sont
résumées dans le tableau suivant :
Classe Effectif
[20-26[ 5
[26-30[ 7
[30-32[ 9
[32-34[ 8
[34-36[ 11
[36-40[ 8
[40-48[ 2
Total 50
a) Trouvez la concentration moyenne et la classe modale.
b) Expliquez pourquoi il sera nécessaire d’ajuster les effectifs.
c) Construire le tableau statistique et l’histogramme non ajusté.
d) Quelles sont les deux grandeurs (citez sans les calculer) qui permettent de comparer cette
distribution à la distribution normale.
Exercice 7
Une enquête portant sur 70 personnes a montré que 9 étaient atteintes du diabète. Donnez un intervalle de
confiance à 95% de la vraie proportion des diabétiques au sein de la population et interpréter.
2
Exercice 8
Dans le but de renforcer le système immunitaire par le soja, on a confié à plusieurs exploitations agricoles sa
production. On veut estimer la quantité moyenne µ. Soit X la quantité de soja produite sur une exploitation.
On suppose que son écart type est σ=1,3. Sur un échantillon de 175 exploitations, on a trouvé la moyenne
égale à 23,56 tonnes.
1- Donner une estimation ponctuelle de la vraie moyenne µ
2- Construire un intervalle de confiance à 95% et 98% pour µ et interpréter.
3- Suppose que l’écart-type n’était pas connu et que l’on devait l’estimer par la variance empirique
S=2,2. Construire l’intervalle de confiance à 95%.
Exercice 9
Un fabricant d’appareil servant dans l’imagerie médicale affirme que ses ampoules ont une durée moyenne
de 3400 heures. Dans le but de vérifier la véracité de ces informations, on prélève au hasard 90 ampoules et
on trouve une durée moyenne de 3223 heures avec un écart type empirique S de 97 heures. Peut-on affirmer
que le fabricant a raison ? En d’autres termes, est que cette différence est due au hasard ?
Exercice 10
On a trouvé dans un groupe de 323 femmes de poids normal un taux de corticoïde urinaire égal à 6,6mg/24h
avec un écart type empirique de 2,6. La même recherche effectuée dans un groupe de 211 femmes présentant
une obésité a donné un taux moyen de 4,3mg/24h avec un écart type empirique de 3,4. Peut-on affirmer que
le groupe de femmes obèses a un taux de corticoïdes urinaires inferieur à celui des femmes de poids normal ?
Exercice 11
On désire comparer les taux d’occupation dans deux hôpitaux A et B. Dans l’hôpital A, sur 750 lits, 650 sont
occupés alors que dans l’hôpital B, sur 456 lits, 399 sont occupés.
1- Construire l’intervalle de confiance à 95% pour le taux d’occupation dans chaque hôpital.
2- Peut-on affirmer au seuil de 5% qu’il existe une différence significative des taux d’occupations dans
les deux hôpitaux.
Exercice 12
Dans le but d’étudier la relation entre l’âge et la tension artérielle, sur 76 hommes on a obtenu un coefficient
de corrélation linéaire r=0,67. Si on note ρ le vrai coefficient de corrélation linéaire entre l’âge et la tension
artérielle, tester ρ = 0 contre ρ≠0 au seuil de 0,02, puis à 0,05
Exercice 13
Selon les connaissances en génétique, il est connu que des parents de groupe sanguin AB mettront au monde
des enfants de types AA, AB et BB ; avec des probabilités de 50%, 25% et 25% respectivement d’après les
lois de Mendel sur l’hérédité. Un sondage auprès de 284 enfants nés de 100 couples AB a montré que sur les
284 enfants, 152 avaient le groupe AB, 65 le groupe AA et 67 le groupe BB. Peut-on dire que ces données
respectent les lois de Mendel ?
Exercice 14
On a suivi pendant 10 ans un échantillon de 3864 couples (homme-femme) afin d’évaluer si la pérennité du
mariage dépend du lieu de résidence. Les résultats obtenus sont les suivants :
Rural Petite ville Grande ville Total
Encore mariés 287 1124 2081 3492
Divorcés ou séparés 18 89 265 372
Total 305 1213 2346 3864
1- Pour chacun de ces lieux, donner une estimation de la proportion des unions persistantes
2- Donner un intervalle de confiance à 95% de chaque proportion et les interpréter
3- Existe-t-il une dépendance entre la pérennité du mariage et le lieu de résidence ?
3
Exercice 15
Une plante servant à fabrication d’un médicament a en général une hauteur moyenne de 8,5 cm. On plante un
échantillon de 100 semences dans un sol enrichi pour voir si la hauteur moyenne peut être améliorée et on
trouve une hauteur moyenne de 8,8 cm. L’écart type empirique de la différence est de 1 cm. Quelle
conclusion peut-on tirer ?
Exercice 16
On désire rechercher s’il existe une relation entre les notes obtenues en Anatomie et celle obtenues en
Physiologie. Sur un échantillon de 528 étudiants, on a les résultats suivants :
Anatomie
Bonne note Note moyenne Mauvaise note Total
Bonne note 56 71 12 139
Physiologie Note moyenne 47 163 38 248
Mauvaise note 14 42 85 141
Total 117 276 135 528
1- Calculer toutes les probabilités jointes
2- Calculer toutes les probabilités conditionnelles
3- Calculer toutes les probabilités marginales
4- Existe-t-il une relation entre les deux notes ?
B) Exercice de synthèse
Exercice 17
Dans un essai clinique ayant pour but d’évaluer l’efficacité d’un nouveau médicament dans le renforcement
de l’organisme en fer, l’on a sélectionné 20 femmes ayant une carence en fer (µmol/L). Ils ont été de
manière randomisée alloués à deux groupes : Ceux du groupe 1 ont reçu le nouveau médicament alors que
ceux du groupe 2 ont reçu le meilleur médicament déjà existant sur le marché. Les données suivantes ont été
obtenues :
Groupe 1 : 11,0 ; 15,8 ; 11,2 ; 17,2 ; 15,8 ; 6,4 ; 20,8 ; 11,3 ; 9,3 ; 18,6
Groupe 2 : 10,2 ; 8,2 ; 10,9 ; 14,3 ; 10,7 ; 6,6 ; 9,5 ; 10,8 ; 8,8 ; 15,3
1. Quels sont les principaux facteurs qui auraient été pris en compte pour obtenir la taille d’échantillon
de 20 ?
2. Calculer dans chaque groupe la moyenne, la médiane, le 1er et 3ème quartiles et la variance.
2.1 Lequel des deux groupes est plus dispersé ?
2.2 Donnez une interprétation à chaque valeur des statistiques descriptives du groupe 1.
3. Les tests (adéquation) de normalité de Kolmogorov-Smirnov donnent les Valeurs-P respectives 0,97
et 0,94 pour le groupe 1 et groupe 2. Peut –on dire que dans ces deux groupes les valeurs du fer
suivent une loi normale ?
4. Formulez l’hypothèse nulle et l’hypothèse alternative puis proposez des tests et justifiez.
5. Pour un test de Student, calculer la valeur T de la statistique. Que peut-on conclure.
5.1 Le calcul de la Valeur-P donne 0,0445. Quelle décision prenez-vous au seuil de significativité
de 5% ?
5.2 Trouver un intervalle de confiance pour la différence de moyenne à 95% et interprétez.
5.3 La différence entre les deux moyennes appartient-elle à cet intervalle ? Que peut-on conclure?
6. Pour un test de Wilcoxon, Valeur-P = 0,0524, quelle conclusion tirez vous ?
7. D’une manière générale, donnez les conditions d’application puis les avantages et les inconvénients
des tests paramétriques et des tests nonparamétriques.
4
Exercice 18
Les autorités d’un pays exigent que la prise du vaccin contre une maladie qui s’évit dans le pays doit
dépendre de l’âge de l’enfant. Pour vérifier de manière systématique si le programme en charge de la
vaccination a respecté ce principe, les agents de contrôle ont classé les 401974 enfants vaccinés d’un
département par tranche d’âge et par type de vaccin et obtenu le tableau ci-après.
[0,1[ [1,3[ [3,5] Total
Type 1 200688 24 33 200745
Type 2 201087 27 115 201229
Total 401775 51 148 401974
L’on désire utiliser un test de Chi-Deux.
1. Formuler l’hypothèse nulle et l’hypothèse alternative
2. La Valeur-P pour le test est 0. Quelle décision doit-on prendre ?
3. La statistique D de Chi-Deux est 45.4224. Quel est le nombre de degrés de liberté associé. Décider
au seuil de 1%.
N.B. Les fractiles X de la loi de Chi-Deux sont :
X(6,0.01)=0.872, X(3,0.01)=0.115, X(2,0.01)=0.02
4. La corrélation entre l’âge et le poids de ces enfants donne 0.78 avec une Valeur-P de 0.003 et un
intervalle de confiance de [0.29, 0.90]. Peut-on affirmer qu’il ya une corrélation positive entre l’âge
et le poids de ces enfants ? Interprétez l’intervalle de confiance.
Exercice 19
On se propose d’estimer la prévalence (p) d’une maladie dans un pays afin de vérifier si cette prévalence
cadre avec la norme de 4% fixée par l’Organisation Mondiale de la Santé (OMS).
1. Formulez l’hypothèse nulle et l’hypothèse alternative.
Deux méthodes d’estimation ont abouti aux valeurs respectives de 5,5% et 6%.
2. Quels sont trois (3) critères statistiques qui vous permettront de choisir une de ces deux estimations.
Lequel est le plus important ?
3. Supposez qu’en utilisant ces critères, la valeur de 5,5% soit préférable.
3.1 Quelles sont trois (3) méthodes permettant de pendre la décision.
3.2 Un intervalle de confiance à 95% donne [3,6% ;7,4%]. Interprétez. Quelles conclusions peut-on
tirer ?
Exercice 20
Un laboratoire vient de mettre au point un médicament contre le diabète et affirme qu’il agit de façon
substantielle dans la réduction du taux de glycémie (g/l) chez les personnes diabétiques. Une étude pilote est
menée dans le cadre d’un essai clinique qui consiste à comparer ce médicament avec le meilleur traitement
existant. Vingt (20) patients ont été recrutés et alloués par randomisation à deux groupes. Le nouveau
traitement a été administré au 1er groupe de 10 patients tandis que les 10 patients du 2nd groupe ont reçu
l’ancien traitement. Les résultats obtenus sont :
Groupe 1 : 0,9 ; 2,3 ; 1,1 ; 0,8 ; 1,2 ; 0,6 ; 0,8 ; 0,7 ; 0,9 ; 0,6.
Groupe 2 : 1,4; 3,2; 1; 0,9; 2,3; 2,8; 0,7; 1,7; 3,3; 1,8.
1. Formulez l’hypothèse nulle et l’hypothèse alternative.
2. Proposez un test pour la décision.
3. Calculez la moyenne dans chaque groupe.
4. Calculer la variance empirique dans chaque groupe.
5. Le calcul de la valeur-P donne 0.01747. Quelle décision prenez-vous ?
6. Construire un intervalle de confiance à 95% pour la différence et interprétez.
Quelle décision prenez-vous ?
7. Calculer la statistique T pour la comparaison des deux moyennes.
5
8. Déterminez le nombre de degrés de liberté et que peut-on conclure au seuil de 5%.
9. Si on avait à comparer ce nouveau traitement à 2 autres traitements existants. Quel test proposeriez-
vous ?
Exercice 21
Selon l’Organisation Mondiale de la Santé, une maladie est considérée rare si sa prévalence est inférieure
1/2000 (soit 0,000500). Le Syndrome de Pallister-Killian (Tétrasomie 12p) est une maladie génétique
caractérisée par des anomalies de pigmentation cutanée, des malformations viscérales fréquentes et un retard
mental profond avec épilepsie. Une étude a été menée dans le but de déterminer si cette maladie peut être
considérée comme rare. Sur une population de 3 974 000 habitants, 2001 personnes l’avaient. Un test
statistique donne la Valeur-P=0,98.
et un intervalle de confiance à 95% de [0,000484, 0,000528].
1. Donnez un intervalle de confiance à 95% de la vraie proportion.
2. Convertissez ces deux prévalences ainsi que l’intervalle de confiance en pour 100 000.
3. Formulez l’hypothèse nulle et l’hypothèse alternative.
4. Décrivez et proposez un test statistique pour ces hypothèses.
5. Quelles conclusions tirez-vous en vous basant sur la Valeur-P et sur l’intervalle de confiance au seuil
de 5%. Interprétez l’intervalle de confiance.
Exercice 22
Dans un essai clinique ayant pour but d’évaluer l’efficacité d’un nouveau médicament dans le renforcement
de l’organisme en fer, l’on a sélectionné 10 adultes ayant une carence en fer (µmol/L) dont les valeurs sont
(13,2 ; 8,2 ; 10,9 ; 14,3 ; 10,7 ; 6,6 ; 9,5 ; 10,8 ; 8,8 ; 13,3). Deux semaines après la prise de ce nouveau
médicament, on a mesuré et obtenu les valeurs suivantes (14,0 ; 16,8 ; 11,2 ; 17,2 ; 15,8 ; 6,4 ; 20,8 ; 11,3 ;
9,3 ; 18,6). Un test statistique donne une valeur-P de 0,021.
1. Calculer la moyenne et l’écart-type avant et après.
2. Formulez l’hypothèse nulle et l’hypothèse alternative.
3. Trouvez un intervalle de confiance pour la différence des deux moyennes et l’interpréter.
4. Décrivez et proposez un test statistique pour ces hypothèses.
5. Calculer la statistique de test T.
6. Quelles conclusions tirez-vous en vous basant sur la Valeur-P et sur l’intervalle de confiance.