Institut National de Recherche et d’Action Pédagogiques
[Link]
TITRE DE LA LEÇON : STATISTIQUE
Discipline : Mathématiques
Sous-discipline : Statistique
Cycle : Collège - Niveau : Troisième
I- GENERALITES
Activité Dans une classe de 3ème,on demande à 16 élèves :« Combien de jours par semaine
travaillez-vous les mathématiques ? »
Réponses recueillies : 3 ;0 ;0 ;2 ; 0 ;0 ;2 ;0 ;0 ;2 ;0 ;3 ;0 ;0 ;1 ;0
-Que représentent les 16 élèves ?
-Que représentent ces jours de travail dans la semaine ?
-Que représente chaque réponse recueillie ?
-Quel est le caractère étudié. Donne sa sature
-Dépouillent ces résultats en dressant un tableau regroupant tous les élèves et toutes les
fréquences des réponses recueillies.
Je retiens :
Définition : La statistique est un ensemble de méthodes mathématiques qui consiste à
collecter, à analyser et à interpréter des observations relatives à un même phénomène.
Le but de toute étude statistique, est d’obtenir une information à partir des données
recueillies par des observations, des expériences scientifiques ou des enquêtes, afin de
prendre une décision
Terminologie ou vocabulaire de base en statistique
La population statistique, est l’ensemble des individus sur lequel porte l’étude
statistique ;
Un échantillon, est une partie de la population ;
Une unité statistique ou individu, un élément de la population ;
Caractères statistiques :
Un caractère, est une propriété ou une particularité ou un aspect commun(e) qui permet
d’étudier une population statistique.
Les valeurs prises par un caractère (ou les différentes situations définies sur un caractère) sont
appelées : Modalités ou valeurs du caractère
Un caractère est dit : caractère qualitatif, lorsque ses modalités sont des qualités de l’individu
(ou lorsque ses modalités ne sont pas exprimées par des nombres, mais par des codes.)
Exemples : Opinion, profession, sexe, état matrimonial, comportement, couleur, catégorie,…
Un caractère est dit : caractère quantitatif (ou une variable statistique), lorsque ses
modalités sont des quantités mesurables (ou lorsque ses modalités sont exprimées par des
nombres.)
1
Institut National de Recherche et d’Action Pédagogiques
[Link]
Exemples : Taille, durée, température, note, prix, …
Un caractère est dit : caractère quantitatif discret, lorsque ses modalités prennent un nombre fini
des valeurs numériques
Un caractère est dit : caractère quantitatif continu, lorsque ses modalités prennent une infinité
de valeurs numériques, souvent regroupées en intervalles de la forme [𝑎; 𝑏[, appelés :Classes.
Effectifs
L’effectif d’une modalité 𝑥𝑖 ou effectif ou encore fréquence absolue, (dans le cas d’un caractère
quantitatif discret), est le nombre de fois que cette modalité 𝑥𝑖 apparait dans l’ensemble des
objets étudiés. On note 𝒏𝒊 : L’effectif de la 𝑖 −𝑖è𝑚𝑒 modalité 𝑥𝑖 .
Dans le cas d'une série continue, on répartit souvent les données par classes :[𝑎; 𝑏[
L’effectif total, est le nombre d’individus de la population entière. On le note N et on écrit:
𝒑
𝑵 = ∑𝒊=𝟏 𝒏𝒊 ou 𝑵 = 𝒏𝟏 + 𝒏𝟐 + ⋯ + 𝒏𝒑
La fréquence relative ou la fréquence d’une modalité 𝑥𝑖 est notée 𝑓𝑖 et est définie par :
𝒏 𝒏
𝑓𝑖 = 𝑵𝒊 . Avec : 0 ≤ 𝑓𝑖 ≤ 1 ; ∑𝑛𝑖=1 𝑓𝑖 = 1. 𝑓𝑖 = 𝑵𝒊 × 100 est la fréquence en pourcentage
Les effectifs cumulées croissants (ECC) d’une modalité 𝑥𝑖 , sont la somme des effectifs des
modalités inférieures ou égales à la modalité 𝑥𝑖
Les effectifs cumulées décroissants (ECD) d’une modalité 𝑥𝑖 , sont la somme des effectifs
des modalités supérieures ou égales à la modalité 𝑥𝑖
Série statistique : Une série statistique à un seul caractère ou à une seule
variable X, est l’ensemble des couples ( 𝑥𝑖 ; 𝑛𝑖 ), c’est-à-dire, l’ensemble des
résultats d’une étude.
On représente souvent une série statistique sous forme d’un tableau ou d’une liste des valeurs du
caractère prises par chaque individu.
NB : Etudier une série statistique à une seule variable, consiste à étudier un aspect des éléments d’un
ensemble donné.
Regroupement des données en classes
Pour faciliter l’étude d’une série statistique dont l’étendue des valeurs est importante, on peut regrouper
les valeurs du caractère en intervalles de la forme [𝑎; 𝑏[ , disjoints deux à deux , appelés :Classes ou
classes de modalités.
L’effectif d’une classe : [𝑎; 𝑏[, est le nombre d’individus de la population étudiée, dont les modalités
appartiennent à [𝑎; 𝑏[.
𝑎+𝑏
Le centre de classe est le réel : 𝐶𝑖 = , l’amplitude d’une classe est le réel : 𝑎𝑖 = 𝑏 − 𝑎 et la
2
𝑛𝑖
densité d’une classe est le réel : 𝑑𝑖 = 𝑎 .
𝑖
Remarque
Les données représentent l’ensemble des individus observés
Les statistiques sont les résultats produits par la statistique, un ensemble de données
numériques.
Collecter les données : C’est les rassembler, les dépouiller, les regrouper et les présenter sous
forme de tableaux
Analyser les données : C’est les mettre en ordre logique ou les réduire
2
Institut National de Recherche et d’Action Pédagogiques
[Link]
Interpréter les résultats ou données : C’est déduire des conclusions à partir des résultats
obtenus.
Les données peuvent varier d’un moment à un autre, d’un objet à un autre, d’un lieu à un
autre. On parle pour cela de variable statistique
Exercice1 Dans une classe de 3ème, on demande à 16 élèves :« Combien de jours par semaine bossez-
vous les mathématiques ? »
Réponses recueillies : 3 ;0 ;0 ;2 ; 0 ;0 ;2 ;0 ;0 ;2 ;0 ;3 ;0 ;0 ;1 ;0
a-Quelle est la population étudiée ? Quel est le caractère étudié. Donne sa sature
b-Dresse un tableau regroupant tous les effectifs et toutes les fréquences.
c-Détermine le pourcentage des élèves qui travaillent les mathématiques 3 fois par jour.
II- Caractéristiques ou paramètres statistiques
Activité
Je retiens :
Mode ou dominante: Le mode, noté : 𝑀0 (pour un caractère quantitatif discret), est la valeur
(ou la modalité) du caractère qui correspond à l’effectif le plus grand.
Dans le cas d’un caractère quantitatif continu, on parle (dans ce cours) seulement de classe modale :
classe qui correspond au plus grand effectif.
NB : Une série statistique peut avoir un ou plusieurs modes
Moyenne : Une série statistique quantitative discret ( 𝑥𝑖 ; 𝑛𝑖 ), d’effectif total N, est donnée par
le tableau suivant : Modalité 𝑥𝑖 du caractère 𝑥1 𝑥2 … 𝑥𝑝
Effectif 𝑛𝑖 𝑛1 𝑛2 … 𝑛𝑝
On appelle moyenne de la série ( 𝑥𝑖 ; 𝑛𝑖 ), le nombre réel noté : 𝑋̅ tel que :
𝑛1 . 𝑥1 + 𝑛2 . 𝑥2 +⋯+ 𝑛𝑝 . 𝑥𝑝 1
𝑋̅ = , soit : 𝑋̅ = ∑𝑝𝑖=1 𝑛𝑖 . 𝑥𝑖
𝑁 𝑁
Si les valeurs sont regroupées en classes [𝑎; 𝑏[, on calcule la moyenne en choisissant comme valeurs
𝑎+𝑏
du caractère, les centres des classes : 𝑥𝑖 = et comme effectifs, les effectifs des classes.
2
Exemple Dans une classe de 22 élèves, il y a 4 filles et 18 garçons. Lors d’un devoir, les 4 filles
obtiennent 13,7 de moyenne et les 18 garçons obtiennent 12,8 de moyenne. La moyenne de la classe
4×13,7 +18 ×12,8
est donc : 𝑋̅ = = 12,96.
4+18
Médiane :
La médiane 𝑀𝑒 d’une série, dont les valeurs du caractère sont discrètes et rangées dans l’ordre
croissant, est la valeur partageant la population en deux groupes de même effectif.
𝑁
La classe médiane, est la première classe pour laquelle l’effectif cumulé croissant dépasse 2 ou la
𝑁
fréquence cumulée croissante, dépasse 50 % (𝐸𝐶𝐶 ≥ ou 𝐹𝐶𝐶 ≥ 50%)
2
Pour calculer la médiane 𝑀𝑒 , dans le cas d’une variable statistique discrète, dont les données sont non
condensées :
On ordonne toutes les modalités 𝑥𝑖 par ordre croissant et on calcule l’effectif total N ;
𝑁+1
Si N est impair, alors la médiane 𝑀𝑒 = 𝑥𝑖 , où 𝑥𝑖 est la modalité de rang : 2
3
Institut National de Recherche et d’Action Pédagogiques
[Link]
𝑥𝑖 + 𝑥𝑖+1 𝑁
Si N est pair, alors la médiane 𝑀𝑒 = , où 𝑥𝑖 est la modalité de rang : et 𝑥𝑖+1 est
2 2
𝑁
la modalité de rang : 2 + 1 . [ 𝑥𝑖 ; 𝑥𝑖+1 [est appelé : Intervalle médian
Exemples a) Série 1 : 5, 12, 13, 14, 15, 16, 18, 22, 25, 27, 31
𝑁+1 11+1
On a 𝑁 = 11 ; 2 = 2 = 6 .Donc 𝑀𝑒 est la 6ème modalité : 𝑀𝑒 = 𝑥6 = 16
b) Série 1 : 5, 12, 13, 14, 15, 16, 18, 22, 25, 27, 31, 35
𝑁 12 𝑁 12
On a 𝑁 = 12 ; 2 = 2 = 6 ; 𝑥6 = 16 et 2 + 1 = 2 + 1 = 7 ; 𝑥7 = 18 . Donc :
𝑥6 + 𝑥7 16 +18
𝑀𝑒 = = = 17
2 2
Pour calculer la médiane 𝑀𝑒 dans le cas d’une variable statistique discrète, dont les données sont
condensées, on calcule les effectifs cumulés croissants (ou fréquences cumulées croissantes).
La médiane 𝑀𝑒 est donc la première modalité 𝑥𝑘 dont le premier effectif cumulé croissant (ou FCC)
𝑁
est supérieur ou égal à 2
Exercice Le tableau ci-dessous indique l’âge des jeunes élèves dans un collège de Brazzaville :
Age 12 13 15 16 19 20
Jeunes élèves 2 3 2 1 1 1
1) Quelle est la population étudiée ? Quel est le caractère étudié ? Donner sa nature.
2) Déterminer : le mode, la moyenne et la médiane de cette série statistique
Solution
1) La population étudiée, est les 10 jeunes élèves dans un collège de Brazzaville
Le caractère étudié est l’âge. C’est un caractère quantitatif discret.
2) L’effectif le plus élevé étant 3, alors le mode est : 𝑀0 = 13
1 2×12+3×13+2×15+1×16+1×19+1×20
La moyenne est : 𝑋̅ = 𝑁 ∑6𝑖=1 𝑛𝑖 . 𝑥𝑖 = ⇒ 𝑋̅ = 14,8
10
Age : 𝑥𝑖 12 13 15 16 19 20
Effectif : 𝑛𝑖 2 3 2 1 1 1
ECC 2 5 7 8 9 10
𝑁
𝐸𝐶𝐶 ≥ 2 ⇔ 𝐸𝐶𝐶 ≥ 5 ⇒ 𝑀𝑒 = 13
Exercice Un éleveur a pesé les œufs pondus par ses poules durant une semaine : Ses relevés sont
indiqués dans le tableau suivant :
Masse (en g) [44; 48[ [48; 52[ [52; 56[ [56; 60[ [60; 64[
Nombres d’œufs 18 25 30 14 8
Calculer la médiane de cette série statistique.
3𝑁
𝐸𝐶𝐶 ≥ 4 ⇔ 𝐸𝐶𝐶 ≥ 11,25 ⇒ 𝑄3 = 15
Remarque : Une médiane n’est toujours pas une modalité du caractère
Une médiane peut ou ne pas être unique.
Deux séries différentes peuvent avoir la même moyenne et deux médianes différentes (ou la même
médiane et deux moyennes différentes).
4
Institut National de Recherche et d’Action Pédagogiques
[Link]
Etendue
L’étendue d’une série statistique, est la différence entre la plus grande et la plus petite valeur de la
série valeur : 𝐸 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
Plus l’étendue est grande, plus les valeurs sont dispersées.
Remarque : On ne parle d’étendue que dans le cas d’un caractère quantitatif.
Ecart absolu moyen ou écart moyen absolu
Une série statistique quantitative discret ( 𝑥𝑖 ; 𝑛𝑖 ), d’effectif total N et de moyenne 𝑋̅, étant donnée.
L’écart absolu moyen de X, est la moyenne arithmétique de la valeur absolue des écarts à la moyenne
𝑛1 |𝑥1 −𝑋̅|+ 𝑛2 |.𝑥2 −𝑋̅|+⋯+ 𝑛𝑝 |.𝑥𝑝 −𝑋̅ | 1
𝑒𝑚 = , soit : 𝑒𝑚 = 𝑁 ∑𝑝𝑖=1 𝑛𝑖 . |𝑥𝑖 − 𝑋̅|
𝑁
L’écart absolu moyen signifie que les valeurs du caractères s’écartent en moyenne de 𝑒𝑚 de la
moyenne.
III-Représentations graphiques
Les représentations graphiques permettent de visualiser le résumé statistique que nous donnent la
distribution de fréquences absolues, de fréquences relatives, de fréquences ou effectifs cumulés.
Les graphiques utilisés, dépendent de la nature du caractère
3-1 -Cas de caractère qualitatif : Les graphiques qu’on peut utiliser sont :
3-1-1 –Le digramme circulaire ou Camembert: C’est un graphique constitué d’un cercle divisé en
secteurs, dont les angles au centre sont proportionnels aux effectifs ou fréquences.
𝑛
L’angle𝛼𝑖 d’une modalité d’effectif 𝑛𝑖 , est donné en degrés par : 𝛼𝑖 = 𝑁𝑖 × 360° = 𝑓𝑖 × 360°
𝑛𝑖
On peut aussi utiliser le diagramme semi circulaire (avec𝛼𝑖 = × 180° = 𝑓𝑖 × 180°)
𝑁
3-1-2 –Le digramme en tuyaux d’orgue ou diagramme en barres : C’est un graphique qui, à chaque
modalité d’un caractère qualitatif, associe un rectangle de base constante, dont la hauteur est
proportionnelle à l’effectif ou à la fréquence. Les rectangles sont en général disjoints (séparés),
verticaux ou horizontaux.
3-2 -Cas de caractère quantitatif : Les graphiques qu’on peut utiliser sont :
3-2-1 –Le digramme en bâtons : C’est un graphique qui, à chaque variable quantitative discrète,
associe un segment (bâton), dont la hauteur est proportionnelle à l’effectif ou à la fréquence.
3-2-2 –L’histogramme : C’est un diagramme composé de rectangles contigus (collés), dont les
hauteurs sont proportionnelles aux effectifs ou aux fréquences et dont les bases sont déterminées par
les intervalles (classes).
Lors que les classes n’ont pas la même amplitude, pour construire l’histogramme, il est nécessaire de
𝑛 𝑓
calculer, pour chaque classe, la densité de classe : 𝑑𝑖 = 𝑎𝑖 (ou 𝑑𝑖 = 𝑎𝑖 pour l’histogramme des
𝑖 𝑖
fréquences), puis affecter à chaque rectangle, une hauteur proportionnelle à la densité.
Dans le cas d’un caractère dont les valeurs sont groupées en p classes, on adjoint deux classes
[𝑎0 ; 𝑎1 [ et [𝑎𝑝 ; 𝑎𝑝+1 [ affectées de l’effectif nul (0). On trace, alors sur le même graphique que
l’histogramme (ou le diagramme en bâtons, dans le cas d’un caractère quantitatif discret), une ligne
5
Institut National de Recherche et d’Action Pédagogiques
[Link]
𝑎𝑖 +𝑎𝑖+1
polygonale joignant les points d’abscisses : et d’ordonnées 𝑛𝑖 , appelée : Polygone des effectifs
2
ou polygone des fréquences.
Le polygone des effectifs cumulés croissants (ECC), est la ligne polygonale obtenue en joignant les
points ayant pour abscisses, les limites supérieures de chaque classe et pour ordonnées les ECC.
Le polygone des effectifs cumulés décroissants (ECD), est la ligne polygonale obtenue en joignant les
points ayant pour abscisses, les limites inférieures de chaque classe et pour ordonnées les ECD.
𝑁
Graphiquement, la médiane est l’abscisse du point(𝑥𝑖 ; 2 ), intersection de ces deux polygones : 𝑀𝑒 =
𝑥𝑖 : N : effectif total.
Exercice2 Un éleveur a pesé les œufs pondus par ses poules durant une semaine : Ses relevés sont
indiqués dans le tableau suivant :
Masse [44; 48[ [48; 52[[52; 56[ [56; 60[ [60; 64[
(en g)
Nombre 18 25 30 14 8
s d’œufs
1) Quelle est la population étudiée ? Quel est le caractère étudié ? Donner sa nature.
2) Déterminer la classe modale,
3) Calculer la moyenne de cette série statistique.
4) Représente cette série statistique par un histogramme