2 Automath – Statistiques descriptives
Attention, on utilise les possibilités de la calculatrice en mode statistique !
Pour les TI 83, pour les CASIO, pour les NumWorks
Monsieur V., enseignant de mathématiques de son état, a donné le même DS sur le chapitre « Coordonnées dans le
plan » à ses trois classes de seconde.
Partie I : la classe de S7
Voici les 33 notes relevées en S7 au fur et à mesure de la correction des copies.
6 14 12 12 16 2 14 13 4 16 11 19 19 16 10 12 15
13 18 14 3 13 6 17 14 19 8 13 5 6 16 5 16
1) Compléter le tableau
Classe de S7
Notes 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total
Effectifs
Fréquences
Effectifs
cumulés
croissants
2) Donner, à l’aide de phrases précises, une interprétation de chacun des nombres contenus dans les cases grises.
3) Expliquer comment calculer « à la main » chacun des nombres contenus dans les cases grises.
4) Déterminer la note moyenne de la classe de S7 et l’écart-type. Expliquer.
5) Dans la liste ordonnée, donner les valeurs de « rang 1 », de « rang 4 », « de rang 13 ».
6) Déterminer la note médiane de la classe de S7. Expliquer.
7) Déterminer le premier quartile 𝑄1 . Expliquer.
8) Déterminer le troisième quartile 𝑄3 . Expliquer.
9) Déterminer l’étendue des notes.
10) Déterminer l’intervalle interquartile.
11) Déterminer l’écart interquartiles.
Partie II : la classe de S6
Voici, présentés dans une feuille de tableur, les résultats des élèves de S6.
2 Automath - Statistiques.docx F. de Verclos (lycée Saint-Marc) Page 1 sur 9
1) Toute la question 1 est en « Piste noire »
Seuls les nombres de la ligne 2 et de la ligne 3, sauf ceux de la colonne « Total » ont été entrés à la main.
Tous les autres sont le résultat d’une formule entrée dans la case où se trouve le nombre.
a) Quelle formule a été entrée dans la case B5 ?
b) Quelle formule a été entrée dans la case C5 ?
c) Quelle est la formule contenue dans la case F4 ?
2) Si on ordonnait les notes de la plus basse à la plus haute, quelles seraient les 7 premières notes ?
3) Déterminer la note moyenne et l’écart-type.
4) Interpréter cette moyenne par des phrases : que signifie ce nombre (on ne demande pas comment le calculer) ?
5) Déterminer la note médiane.
6) Interpréter cette médiane par des phrases : que signifie ce nombre (on ne demande pas comment le calculer) ?
7) Déterminer le premier quartile.
8) Interpréter le premier quartile : que signifie ce nombre (on ne demande pas comment le calculer) ?
9) Déterminer le troisième quartile.
10) Interpréter le troisième quartile : que signifie ce nombre (on ne demande pas comment le calculer) ?
Partie III : la classe de S2
Dans la classe de S2, la note moyenne est de : 13,7
La note médiane est de : 15
Le premier quartile 𝑄1 est de : 12
Le troisième quartile 𝑄3 est de : 17
1) Classer les trois classes par ordre de réussite. Expliquer.
2) Pour la classe de S2, donner l’intervalle interquartile. Donner en une interprétation.
3) Entre la classe de S6 et la classe de S7, quelle est la plus homogène ?
4) Entre la classe de S6 et la classe de S2, quelle est la plus homogène ?
5) Piste noire Comment sont construites les « boites à moustaches » suivantes ?
2 Automath - Statistiques.docx F. de Verclos (lycée Saint-Marc) Page 2 sur 9
Partie IV : l’ensemble des trois classes
La classe de S2 compte 34 élèves. Rappelons les résultats précédents.
1) Calculer, si possible, la moyenne de l’ensemble des 99
élèves (avec 2 chiffres après la virgule).
2) Calculer, si possible, la médiane de l’ensemble des 99
élèves.
3) Calculer, si possible, le premier quartile de l’ensemble
des 99 élèves.
4) Calculer, si possible, le troisième quartile de l’ensemble
des 99 élèves.
5) Compléter le tableau suivant (toutes les fréquences sont arrondies à 0,01 près)
6) Utiliser ce tableau pour déterminer
a) La médiane
b) Le premier quartile
c) Le troisième quartile
d) Recalculer la moyenne (avec ce tableau)
Pour corriger la partie I
Question 1
Question 2
a) Ligne Effectifs : Trois élèves de S7 ont obtenu la note de 6 sur 20.
1 0,03 3
b) Calcul (non demandé) : il y a 1 élève de S7 sur 33 au total qui a eu une note de 11 : ≈ 0,03 ≈ ≈
33 1 100
3
Interprétation ligne « Fréquences » : 0,03 ≈ 100
Environ 3% des élèves de S7, ont été notés 11 sur 20
c) Ligne Effectifs Cumulées Croissants : 8 élèves de S7 ont une note inférieure ou égale à 6 au DS.
2 Automath - Statistiques.docx F. de Verclos (lycée Saint-Marc) Page 3 sur 9
Question 3
a) Ligne Effectifs : il suffit de remarquer que dans la liste, il y a 3 élèves de S7 qui ont obtenu la note de 6 sur 20.
1
b) Ligne Fréquences : 1 élève sur les 33 élèves de la classe a obtenu la note de 11 sur 20. ≈ 0,03
33
c) Ligne Effectifs Cumulées Croissants :
Première idée : 1 + 1 + 1 + 2 + 3 = 8 (les cinq premiers nombres de la ligne Effectifs)
Seconde idée plus rapide : on remarque que 1 + 1 + 1 + 2 a déjà été calculé (case à gauche de la grise dans la
ligne des Effectifs cumulés croissants) et on a trouvé 5. Il suffit de faire 5 + 3
Question 4
Somme totale des notes : 1 × 2 + 1 × 3 + 1 × 4 + 2 × 5 + 3 × 6 + ⋯ + 1 × 18 + 3 × 19 + 0 × 20
Effectif total : 1 + 1 + 1 + 2 + 3 + ⋯ + 1 + 3 + 0
Donc la formule pour la moyenne :
1×2+1×3+1×4+2×5+3×6+⋯+1×18+3×19+0×20 1×2+1×3+1×4+2×5+3×6+⋯+1×18+3×19+0×20
1+1+1+2+3+⋯+1+3+0
= 33
≈ 12,03
Formule pour l’écart-type :
1×(2−12,03)2 +1×(3−12,03)2 +⋯.+3×(19−12,03)2
𝑠=√ 33
≈ 4,89
Attention, on utilise les possibilités de la calculatrice en mode statistique (à apprendre … voir le site) !
Question 5
Si on classait les notes de la plus basse à la plus haute, on aurait :
2 3 4 5 5 6 6 6 8 10 11 12 12 12 13 13 13 13 14 … et ainsi de suite
On dit que dans cette liste ordonnée que la valeur de « rang 4 » est 5.
La valeur de « rang 1 » est 2
La valeur de « rang 13 » est 12.
Les valeurs de « rang 6 », de « rang 7 », de « rang 8 » valent toutes les trois 6.
On peut déterminer ces valeurs sans écrire la liste ordonnée de toutes les notes. D’après la ligne des Effectifs
cumulés croissants :
les 23 plus basses notes sont inférieures ou égales à 15
28 copies ont une note inférieure ou égale à 16.
La valeur de « rang 25 » est 16 (ainsi que les valeurs de « rang 24 », de « rang 26 », de « rang 27 », de « rang 28 »).
33
Question 6 = 16,5 donc 33 = 16 + 1 + 16
2
Dans la série ordonnée, la valeur de « rang » 17 est la seule valeur centrale.
A l’aide de la ligne des effectifs cumulés croissants, on détermine la valeur de « rang 17 ». Donc 𝑀𝑒 = 13
33
Question 7 = 8,25
4
A l’aide de la ligne des effectifs cumulés croissants, on détermine la valeur de « rang 9 ». Donc 𝑄1 = 8
2 Automath - Statistiques.docx F. de Verclos (lycée Saint-Marc) Page 4 sur 9
3
Question 8 4
× 33 = 24,75
A l’aide de la ligne des effectifs cumulés croissants, on détermine la valeur de « rang 25 ». Donc 𝑄3 = 16
Question 9 𝐸𝑡𝑒𝑛𝑑𝑢𝑒 = 𝑃𝑙𝑢𝑠 𝑔𝑟𝑎𝑛𝑑𝑒 𝑣𝑎𝑙𝑒𝑢𝑟 − 𝑃𝑙𝑢𝑠 𝑝𝑒𝑡𝑖𝑡𝑒 𝑣𝑎𝑙𝑒𝑢𝑟 = 19 − 2 = 17
Question 10 L’intervalle interquartile est : [ 𝑄1 ; 𝑄3 ] = [ 8 ; 16 ]
Question 11 L’écart interquartile est 𝑄3 − 𝑄1 = 16 − 8 = 8
Pour corriger la partie II
Question 1
a) Case B5 = 𝐵3
b) Case C5 = 𝐵5 + 𝐶3
La formule = 𝐵3 + 𝐶3 donne le bon résultat mais est une très mauvaise idée : elle ne pourra pas être recopiée
dans les cases suivantes.
c) Case F4 = 𝐹3 / 32 ou encore mieux = 𝐹3 / $𝑈$3
Question 2 Les sept premières notes de la série ordonnée par ordre croissant sont : 3 6 6 6 7 7 8
1×3+3×6+2×7+2×8+⋯+4×17+1×19+3×20
Question 3 La note moyenne : 1+3+2+⋯+4+1+3
≈ 11,906 ≈ 11,9
1×(3−11,9)2 +3×(6−11,9)2 +2×(7−11,9)2 +⋯+3×(20−11,9)2
Ecart-type : 𝑠=√ ≈ 4,6
32
Attention, on utilise les possibilités de la calculatrice en mode statistique !
Pour les TI 83, pour les CASIO, pour les NumWorks
Question 4
Première interprétation : la moyenne est le nombre qui « égalise ».
Si on remplace chacune des notes par la moyenne, la somme totale des notes de la classe ne change pas.
Seconde interprétation : les écarts à la moyenne se compensent exactement.
Quand on remplace chacune des notes par la moyenne, on commet des écarts en plus ou en moins, mais ces écarts
se compensent exactement !
Voici ci-dessous, le détail des notes.
2 Automath - Statistiques.docx F. de Verclos (lycée Saint-Marc) Page 5 sur 9
La deuxième ligne donne les écarts entre chacune des notes et la moyenne :
L’écart entre 19 et la moyenne 11,906 est : 19 − 11,906 ≈ 7,1
L’écart entre 12 et la moyenne est : 12 − 11,906 ≈ 0,1
L’écart entre 8 et la moyenne est : 8 − 11,906 ≈ −3,9
…
La somme de ces écarts à la moyenne vaut 0.
32
Question 5 L’effectif total est 32. On a : 2
= 16 donc 32 = 16 + 16
Dans la série ordonnée, il y a deux valeurs centrales la valeur de « rang 16 » et la valeur de « rang 17 ».
A l’aide de la ligne des effectifs cumulés croissants, on les détermine :
La valeur de « rang 16 » est : 11. La valeur de « rang 17 » est : 12
11+12
Donc la médiane est : 𝑀𝑒 = 2
= 11,5 (d’après la définition retenue par les programmes officiels)
Question 6 Au moins la moitié des élèves de la classe de S6 ont obtenu une note inférieure ou égale à 11,5.
Au moins la moitié des élèves de la classe de S6 ont obtenu une note supérieure ou égale à 11,5.
32
Question 7 =8
4
A l’aide de la ligne des effectifs cumulés croissants, on détermine la valeur de « rang 8 ». Donc 𝑄1 = 8
Question 8 Au moins le quart des élèves de la classe de S6 ont obtenu une note inférieure ou égale à 8.
Au moins trois quarts des élèves de la classe de S6 ont obtenu une note supérieure ou égale à 8.
3
Question 9 4
× 32 = 24
A l’aide de la ligne des effectifs cumulés croissants, on détermine la valeur de « rang 24 » : 𝑄3 = 15
Question 10 Au moins les trois quarts des élèves de la classe de S6 ont obtenu une note inférieure ou égale à 16.
Au moins le quart des élèves de la classe de S6 ont obtenu une note supérieure ou égale à 16.
Pour corriger la partie III
Question 1
Pour une comparaison, il faut bien préciser le critère retenu, car suivant le choix fait, l’ordre peut changer !
Il y a, au moins, deux façons de donner le « centre d’une série statistique » :
La médiane
La moyenne
En utilisant la moyenne :
Les classes de S2, S6, S7 ont pour moyennes respectives 13,7 11,9 12.
Suivant ce critère, les S6 ont moins bien réussi que les S7 (la différence est minime et peu significative),
les S7 ont moins bien réussie que les S2 (la différence est importante).
2 Automath - Statistiques.docx F. de Verclos (lycée Saint-Marc) Page 6 sur 9
En utilisant la médiane : cela revient à comparer les notes des élèves en milieu de classement dans chaque classe.
Les moyennes sont sensibles aux valeurs extrêmes.
Par contre la médiane, n’est pas sensible aux valeurs extrêmes (mais elle ne prend pas en compte la valeur exacte
de toutes les valeurs).
Les classes de S2, S6, S7 ont pour médianes respectives 15 11,5 13.
Suivant ce critère, les S6 ont moins bien réussi que les S7,
les S7 ont moins bien réussie que les S2.
Question 2 Pour la classe de S2, l’intervalle interquartile est : [ 12 ; 17 ] (c’est [ 𝑄1 ; 𝑄2 ] )
L’intérêt de l’intervalle interquartile c’est de contenir la majorité des valeurs de la série statistique : la
majorité c’est au moins la moitié des valeurs !
Au moins la moitié des élèves de S2 ont une note comprise entre 12 (inclus) et 17 (inclus).
Question 3 Il y a, au moins, deux façons de mesurer l’homogénéité d’une série statistique :
L’écart-interquartile que l’on associe à la médiane
L’écart-type que l’on associe à la moyenne
Une mesure de dispersion assez fiable, que l’on associe à la médiane, est l’écart interquartile.
Pour la classe de S7 : 𝑄3 − 𝑄1 = 16 − 8 = 8 Pour la classe de S6 : 𝑄3 − 𝑄1 = 8
L’écart interquartile est le même. Les résultats présentent la même homogénéité dans les deux classes.
Une autre mesure assez fiable de dispersion, que l’on associe à la moyenne, est l’écart-type :
Pour les S7 : 𝑠 ≈ 4,89 Pour les S6 : 𝑠 ≈ 4,6
Les deux écarts-types sont presque les mêmes. Les deux classes présentent la même homogénéité.
Remarque : l’étendue est une autre mesure de dispersion mais elle est peu fiable.
Question 4 Pour la classe de S6 : 𝑄3 − 𝑄1 = 8 Pour la classe de S2 : 𝑄3 − 𝑄1 = 17 − 12 = 5
La classe de S2 est plus homogène que la classe de S6.
Pour les S7 : 𝑠 ≈ 4,89 Pour les S6 : 𝑠 ≈ 4,6
Les deux écarts-types sont presque les mêmes. Les deux classes présentent la même homogénéité.
Question 5
2 Automath - Statistiques.docx F. de Verclos (lycée Saint-Marc) Page 7 sur 9
Pour corriger la partie IV
Question 1
13,7+11,9+12
Le calcul 3
est une erreur de raisonnement ! Les moyennes de chaque classe doivent être pondérées
suivant les effectifs des classes.
Dans cet exemple, le résultat faux 12,533 est proche de la réponse … mais c’est uniquement parce que les
effectifs (33, 32, 34) sont proches !
34×13,7+32×11,9+33×12 34×13,7+32×11,9+33×12
Moyenne : 34+32+33
= 99
≈ 12,55
Commentaires (non demandés)
Le dénominateur 34 + 32 + 33 représente l’effectif total (le nombre d’élèves en mélangeant les S2, S7, S6.
34 × 13,7 (effectif de S2 × moyenne de S2) est la somme de toutes les notes de S2
32 × 11,9 (effectif de S6 × moyenne de S6) est la somme de toutes les notes de S6
33 × 12 (effectif de S7 × moyenne de S7) est la somme de toutes les notes de S7
34 × 13,7 + 32 × 11,9 + 33 × 12 est donc la somme totale des notes des trois classes réunies.
34×13,7+32×11,9+33×12 𝑙𝑎 𝑠𝑜𝑚𝑚𝑒 𝑑𝑒 𝑡𝑜𝑢𝑡𝑒𝑠 𝑙𝑒𝑠 𝑣𝑎𝑙𝑒𝑢𝑟𝑠
Ainsi, la formule : donne bien la
34+32+33 𝑒𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑡𝑜𝑡𝑎𝑙
Question 2
En ne connaissant que la médiane et les effectifs, il n’y a pas de moyen pour retrouver la médiane de l’ensemble.
Question 3
En ne connaissant que les premiers quartiles et les effectifs, il n’y a pas de moyen pour retrouver le premier quartile
de l’ensemble.
Question 4
En ne connaissant que les troisièmes quartiles et les effectifs, il n’y a pas de moyen pour retrouver le troisième
quartile de l’ensemble.
Question 5
Notes 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Fréquences 0,01 0,03 0,03 0,02 0,06 0,02 0,05 0,06 0,03 0,04 0,1 0,07 0,08 0,09 0,07 0,08 0,02 0,08 0,05
Fréquences
cumulées 0,01 0,04 0,07 0,09 0,15 0,17 0,22 0,28 0,31 0,35 0,45 0,52 0,6 0,69 0,76 0,84 0,86 0,94 0,99
croissantes
Question 6
a) Dans la ligne des fréquences cumulées croissantes, on détermine la valeur pour laquelle la fréquence cumulée
50 1
croissante atteint ou dépasse 0,5 ( 50 % = 100
= 2 = 0,5) 𝑀𝑒 = 13
b) Dans la ligne des fréquences cumulées croissantes, on détermine la valeur pour laquelle la fréquence cumulée
25 1
croissante atteint ou dépasse 0,25 ( 25 % = 100 = 4 = 0,25) 𝑄1 = 9
2 Automath - Statistiques.docx F. de Verclos (lycée Saint-Marc) Page 8 sur 9
c) Dans la ligne des fréquences cumulées croissantes, on détermine la valeur pour laquelle la fréquence cumulée
75 3
croissante atteint ou dépasse 0,75 (75 % = = = 0,75) 𝑄3 = 16
100 4
d) Moyenne : 0,01 × 2 + 0,03 × 3 + 0,03 × 4 + 0,02 × 5 + ⋯ + 0,02 × 18 + 0,08 × 19 + 0,05 × 20 ≈ 12,55
Il est inutile de diviser par la somme des coefficients 0,01 + 0,03 + 0,03 + 0,02 + ⋯ + 0,02 + 0,08 + 0,05
puisque celle-ci vaut 1.
2 Automath - Statistiques.docx F. de Verclos (lycée Saint-Marc) Page 9 sur 9