Entraînement statistiques
Exercice 9
Des chercheurs désirent tester l’effet d’une antibiothérapie et de sa forme
d’administration sur l’apparition d’une infection post-opératoire. Lors d’un essai clinique,
certains patients ont reçu une antibiothérapie par injection (AI), certains une
antibiothérapie par voie orale (AVO) alors que d’autres ont eu un placebo injecté (PI) ou
par voie orale (PVO). Les chercheurs notent pour chaque participant son groupe et s’il y
a eu une infection post-opératoire (iPO) ou non.
Voici les données :
1) Quelles sont la nature de chaque variable et l’échelle de mesure associée ?
Patient : variable aléatoire
Groupe : variable qualitative (étiquettes verbales) nominale (non ordonnable entre elles)
IPO : variable qualitative et nominale car il n’y a que deux modalités possibles
Administration : qualitative et nominale
Type de médicament donné : qualitative et nominale
2) Quelle est la taille de l’échantillon ?
N = 33
3) Élaborez la distribution d’effectifs selon la thérapie
AI AVO PI PVO
Eff. partiel (ni) 10 8 9 6
Fréquence (fi) 0.3 0.24 0.27 0.18
4) Quelle est la proportion de personnes qui ne reçoivent pas d’antibiothérapie ?
0.27+0.18 = soit une proportion de 0.45 personnes qui ne reçoivent pas d’antibiothérapie.
5) Quel est le pourcentage de patients qui ont reçu l’antibiothérapie par voie orale ?
0.24*100 = 24% de patients ayant reçu l’antibiothérapie par voie orale.
Exercice 10
Dans une maison de retraite, 42 personnes âgées ont répondu au questionnaire de
dépression de Beck (BDI2), voici leur score respectif :
1) Élaborez la distribution d’effectifs et de fréquences du niveau de dépression, en
utilisant la classification de l’échelle :
● score strictement inférieur à 10 = pas de dépression
● Entre 10 et 18 = dépression légère
● Entre 19 et 29 = dépression modérée
● Supérieur ou égal à 30 = dépression sévère
0 dépression Légère Modérée Sévère
ni 16 10 9 7
fi 0.38 0.24 0.21 0.17
2) Faites une représentation graphique adaptée de la distribution de fréquence.
On a ici une variable qualitative : sa représentation sera soit en secteurs (camembert),
soit en bâtons (barres qui ne se touchent pas entre elles).
3 ) A partir de cette distribution, trouvez le mode
Le mode (modalité la plus fréquente) est “Pas de dépression” avec un effectif de 16
personnes.
Exercice 11
Le lait d’ornithorynque pourrait permettre de lutter contre l’antibiorésistance, grâce à
une protéine unique (étude australienne). Des chercheurs ont donc proposé à des
personnes ayant une maladie non grave et présentant une antibiorésistance de
participer à leur étude. Ils ont noté au bout de combien de jours ces personnes
présentaient des signes d’amélioration (si ce n’est de guérison complète). La répartition
est la suivante :
1) Que peut-on dire de la forme de la distribution des fréquences simples ?
Elle est biaisée à droite.
2) Quel score regroupe au moins 0.5 de l’échantillon ?
N = 64
Nb jours 1 2 3 4 5 6 7 8
ni 2 1 5 10 11 16 12 7
fi 0.03 0.02 0.08 0.16 0.17 0.25 0.19 0.11
Eff. cum. 2 3 8 18 29 45 57 64
croiss.
Calcul de la médiane : 64/2 = 32 rang médian, ainsi c’est 6.
Le score regroupant au moins 0.5 de l’échantillon est 6.
Exercice 12
Pour chaque énoncé, indiquez quel(s) indice(s) de position peuvent être calculés.
1) Pour savoir si les français sont en form après leurs vacances, des médecins ont
proposé à des salariés de répondre à un questionnaire sur la santé et le bien-être (score
max = 100). Quantitatif et numérique (mode, médiane, moyenne, quartiles)
2) Un laboratoire demande à des femmes la raison principale qui les amène à choisir
telle ou telle marque de maquillage (ex. texture, odeur, couleur) au cours d’un semestre.
Qualitatif et nominal (mode)
3) Pour connaître l’impact de l’utilisation des ordinateurs sur l’apprentissage, des
éducateurs ont réalisé une expérience dans laquelle les élèves devaient apprendre 3
cours différents, après quoi ils devaient répondre à un QCM comportant 25 questions en
vrai/faux. Quantitatif numérique (mode, médiane, moyenne et quartiles)
4) Un professeur de physique souhaite connaître l’attrait de ses élèves de 1ère pour sa
matière au début de l’année. Pour cela, il leur demande de dire à quel point ils aiment la
discipline. Qualitatif ordinale (mode, médiane, quartiles)
Exercice 13
Le tableau ci-dessous présente l’évaluation de la qualité des relations amicales par des
étudiants.
Décrire les données : en vous appuyant sur le calcul des indices de position, que
pouvez-vous dire de la qualité des relations amicales de ces étudiants ?
Représentez les données de façon adéquate.
Ici on a une variable qualitative (étiquettes nominales) et ordinale (ne respectant pas le
principe de cardinalité)
N = 20
D C B A
ni 2 8 7 3
fi 0.1 0.4 0.35 0.15
Eff. cum cr. 2 10 17 20
Mode : “C = moyenne”
Médiane : 20/2 = 10, soit “C = moyenne”
Quartiles :
● Q1 : 20/4 = 5, “C = moyenne”
● Q3 : 20/4*3 = 15, “B = Satisfaisante”
Selon 40% des personnes (plus grand effectif) ayant répondu, la nature des relations est
moyenne. Cela est rejoint par le premier quartile qui nous indique que 25% des étudiants
considèrent au mieux que la relation est moyenne, et 75% trouvant qu’au pire, elle est
moyenne. 50% de l’effectif considère qu’au moins, la relation est moyenne, et au pire,
qu’elle est moyenne. Seulement 75% de l’échantillon considère qu’au mieux, la relation
est satisfaisante, et qu’au pire, elle est satisfaisante.
Ici, comme c’est qualitatif, le graphique sera soit un diagramme en secteurs, soit en
bâtons.
Distribution d’effectifs partiels selon l’évaluation de la qualité des relations
amicales
Exercice 14
Afin de déterminer si la santé et la qualité de travail des employés est affectée par leur
temps de transport, le directeur d’une petite entreprise parisienne a demandé à ses onze
employés combien de temps mettent-ils chaque jour pour venir sur leur lieu de travail.
Voici les données obtenues en minutes :
En sachant qu’au-delà de 30 min de trajet, la santé et le travail sont menacés, que
peut dire le directeur ?
La variable est de nature quantitative et numérique, de rapport et discrète. Nous
pouvons donc calculer le mode, la médiane et la moyenne ainsi que les quartiles.
La distribution est amodale.
Je range mes données dans l’ordre
N = 11
8 9 13 16 26 28 31 35 48 55 72
1 1 1 1 1 1 1 1 1 1 1
Mode = amodale
Médiane = 11/2 = 5.5, soit le rang médian 6 = 28 min
Moyenne = 31 min (somme modalités (avec leur coef)/11)
Quartiles :
● Q1 : 11/4 = 3 : 13 minutes
● Q3 : 11/4*3 = 9 : 48 minutes
La moyenne et la médiane sont toutes deux aux alentours des 30 minutes (+/- 2 min)
Exercice 15
Dans une étude clinique, deux groupes de personnes souffrant d’anorexie ont été suivis :
l’un bénéficiant d’un nouveau suivi thérapeutique complet, et l’autre participant à un suivi
thérapeutique standard.
Afin de tester le bénéfice de ces suivis, la différence de poids (entre avant et après le
suivi) a été mesurée pour chaque groupe.
Les chercheurs estiment que si les patients reprennent du poids, le suivi est bénéfique.
A partir du graphique des effectifs cumulés pour les personnes souffrant d’anorexie
suivant une thérapie standard, déterminez la valeur minimale pour laquelle on
retrouve au moins 75% de l’effectif de ce groupe.
Que peut-on dire de la perte de poids des femmes souffrant d’anorexie bénéficiant
du nouveau suivi thérapeutique ?
Diff. -1.5 -0.8 -0.4 0 0.3 0.5 0.8 1.2
poids
ni 1 3 5 7 10 8 4 2
cum. cr 1 4 9 16 26 34 38 40
Q3 = 40/4*3 = 30 : 0.5
La valeur minimale pour laquelle on retrouve au moins 75% de l’effectif de ce groupe est
0.5kg. Ce qui signifie que 25% des personnes reprennent au mieux 0.5kg, et 75% au
moins 0.5kg.
Dist. d’effectifs de la différence de poids pour le groupe ayant un suivi nouveau
Diff. -1.5 -0.8 -0.4 0 0.3 0.5 0.8 1.2
poids
ni 0 2 4 4 5 8 12 5
cum. cr 0 2 6 10 15 23 35 40
Mode : 0.8
Médiane (40/2) : 0.5
Moyenne : 0+ (-1.6) + (-1.6) + 0 + 1.5 + 4 + 9.6 + 6 = 17.9/N = 0.45kg
Quartiles :
● Q1 : (40/4) : 0
● Q3 : (40/4*3) : 0.8
On peut dire que les femmes suivant le nouveau suivi prennent en moyenne 0.45kg.
L’ensemble des femmes semblent avoir repris du poids.