Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
CHAPITRE 0 : INTRODUCTION
0.1 OBJECTIFS DU COURS
Au terme de ce cours l’étudiant sera capable :
De rassembler, d’organiser et d’analyser des observations
numériques ; de présenter de manière claire, à l’aide des tableaux ou
des graphiques les données souvent nombreuses et désordonnées
recueillies sur terrain.
L’analyse essaie de résumer un tableau de données à l’aide d’un petit
nombre de valeurs caractéristiques ; c’est ce que l’on fait par exemple
quand on calcule le salaire moyen, le prix moyen des marchandises, la
taille moyenne des personnes d’une tribu donnée…
D’identifier l’instrument ou la méthode statistique qui convient à
l’analyse d’une situation qui relève d’une des sciences économiques,
informatiques, médicales, pédagogiques…
0.2 ROLE DE LA STATISTIQUE
Autrefois réservée à quelques spécialistes, les méthodes statistiques ont
fait irruption dans tous les secteurs de notre vie de tous les jours.
Actuellement, c’est tout le monde qui s’y intéresse, ceux qui les créent
(spécialistes) aussi bien ceux qui les appliquent. Les sciences
économiques et commerciales, les sciences informatiques, les sciences
littéraires, les enseignants n’y échappent pas. De nos jours, la maîtrise
des principes statistiques apparaît comme une nécessité absolue dans
tous les domaines de la vie.
Cependant, sur le plan théorique comme sur le plan pratique, il ne
faudrait pas exagérer les possibilités de la statistique. En aucun cas aussi
le statisticien ne peut se substituer en chercheur ou en praticien. Tout en
soulignant les limites de la statistique, nous devons la considérer comme
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 1
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
un outil dont il faut se servir, un outil qui permet dans certains cas de
faciliter singulièrement la tâche au chercheur mais en tant que telle ne
contient pas de solution à un problème.
0.3 QUELQUES CONCEPTS DE BASE
0.3.1 la statistique et les statistiques
Dérivé du substantif latin « Status » qui signifie « état ». Le terme
«statistique », en français comme en anglais possède deux significations
distinctes : statistique et statistiques.
a) statistique (au singulier)
Est l’ensemble des méthodes scientifiques qu’on utilise pour recueillir,
traiter, réduire, présenter, analyser, et interpréter les données pour faire des
déductions et tirer des conclusions à partir des données numériques.
b) Statistiques : (au pluriel),
Est l’ensemble de données numériques relatives à un groupe d’individus
(être, objets, évènements ou faits). En d’autres termes, ce sont des
dénombrements, des inventaires qui fournissent des renseignements d’ordre
administratif aux Etats.
EXEMPLE : nombres d’étudiants dans une institution d’enseignement
supérieur (statistiques des étudiants) ; nombre de décès dans un hôpital
(statistiques des décès) , les salaires des enseignants dans une école
(statistiques des salaires), etc…
0.3.2 Statistique descriptive et statistique inférentielle :
a) Statistique descriptive ou déductive : a pour but de résumer et de
présenter les données observées telle qu’on puisse en prendre
connaissance soit sous forme des tableaux, soit sous forme des
graphiques. En d’autres termes, elle se limite à décrire ou à analyser
un ensemble d’éléments donnés sans pouvoir tirer des conclusions
pour une population plus grande incluant cet ensemble.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 2
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
EXEMPLE : étudier le niveau intellectuel des étudiants en leur faisant passer
un test d’intelligence générale.
b) Statistique inférentielle ou inductive : ici, l’ensemble des données sur
lesquelles porte l’étude est considéré comme un échantillon
représentatif d’une population plus étendue que l’on tente d’induire,
d’inférer, de généraliser à partir des résultats observés sur un
échantillon, une connaissance de la population. Autrement dit, elle
permet d’étendre ou de généraliser dans certaines conditions les
conclusions obtenues à partir de l’échantillon sur la population où l’on
a tiré cet échantillon.
Très souvent, l’observation est l’expérimentation ne concernent qu’une
fraction des individus auxquels on s’intéresse réellement. Les
conclusions relatives à cette fraction, appelée << échantillon >> doivent
être généralisées autant que possible à l’ensemble des individus
formant la population.
Cette phase inductive comporte évidement certains risques d’erreur,
qui peuvent être mesurés en faisant appel à la théorie des probabilités.
0.3.3 Population et échantillon :
Lorsqu’on veut étudier des données relatives aux caractéristiques d’un
ensemble d’individus ou d’objets, comme la taille des congolais de 15 ans, le
nombre de décès dans tous les hôpitaux en RDC,… il est difficile, voire
impossible d’observer toutes les données, surtout si elle sont extrêmement
nombreuses. Au lieu d’examiner l’ensemble, qu’on appelle
« Population» ou «univers», on en examine une petite partie, qu’on
appelle «Echantillon».
a) population : est l’ensemble des cas possibles, ensemble d’éléments qui
possèdent les caractéristiques qu’on désire observer ou étudier.
Exemples :
- la taille de l’ensemble de la population congolais ayant 15ans
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 3
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
- L’ensemble de la population Kinoise possédant le groupe sanguin O.
Une population peut être finie ou infinie :
Population finie : lorsqu’on connait le nombre d’individus dans la
population. Ex. le nombre d’étudiants dans un auditoire.
Population infinie : lorsqu’on ne connait pas le nombre d’individus dans
la population. Ex. le nombre de poisons dans le lac Tanganyika.
b) Echantillon : est l’ensemble des cas réellement mesurés à partir
duquel on pourra tirer des conclusions que l’on désire généraliser sur la
population ou l’on a tiré cet échantillon.
Exemple :
- vérifier la performance de 50 élèves en grammaire dans une école
contenant beaucoup d’élèves ;
N.B. la plupart des jugements statistiques reposent sur un échantillonnage,
car la généralité et la validité des conclusions dépendent de la valeur des
échantillons choisis.
Donc, l’échantillonnage est un procédé par lequel on sélectionne un
échantillon.
Il faut que l’échantillon choisit puisse refléter toutes les caractéristiques
qu’on trouve dans la population où l’échantillon en question a été tiré :
c’est la représentativité de l’échantillon. Ensuite, il faut que l’échantillon
soit normalement assez grand (n ≥ 30).
0.3.4 Variable:
On appelle « variable » tout caractère sujet à prendre des états différents
suivant les individus, le temps ou le lieu d’observation.
Exemples : le sexe, la taille, le poids, le salaire, le groupe sanguin, l’âge, l’état
civil…
Les variables ne sont pas toutes de même nature : elles se distinguent
d’abord par :
La nature numérique ou non de leurs valeurs ;
La nature discrète ou non les unes par rapport aux autres
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 4
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
La statistique étudie donc une variable (c.à.d. une caractéristique) au sein
d’un ensemble d’éléments. Ex. les salaires des ouvriers d’une entreprise ;
la taille des individus d’une tribu donnée ; les prix des marchandises, etc.
Donc, salaires, taille, prix sont des variables, c.à.d. des termes Indéterminés
qui peuvent être remplacés par divers termes déterminés qui sont des
valeurs : 100m ; 1,50kg ; 300€ ; 4000$... sont respectivement des valeurs
pour les variables longueur, poids, salaire, prix…
La variable peut être quantitative ou qualitative :
La variable est qualitative lorsqu’elle peut être observée sans
quantification. Ex. le sexe ; la couleur ; l’état civil ; la beauté ; le niveau
socio-économique, etc. On l’appelle aussi variable catégorielle. Elle
correspond à des qualités, des attributs ; elle est toujours discrète.
Le variable quantitative : est celle qu’on peut mesurer, quantifier,
c.à.d. que les observations peuvent être notées sous forme numérique.
Ex. la température, le poids, la taille, le prix des marchandises, le salaire des
ouvriers, etc.
La variable quantitative peut être continue ou discontinue
La variable quantitative continue : est une grandeur qui peut prendre une
valeur quelconque de l’intervalle possible de variation. Ex. la taille d’un
individu peut être de 1,53 m ; 1,5378 m ; 1,540 m…
La variable quantitative discontinue : est une grandeur qui change par
saut ou résulte directement d’un simple dénombrement et qui sont des
nombres exacts, arrondis. Ex. nombre d’enfants dans une famille : O
enfants, 13 enfants ; le nombre d’étudiants dans l’auditoire : 53 étudies,
235 étudiants, 2500 étudiants, etc...
0.3.5 La nature des mesures :
La statistique descriptive et la statistique inférentielle demandent l’utilisation
de méthodes dont l’emploi exige un grand discernement. il convient de tenir
compte principalement du genre de mesures auxquelles on a affaire.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 5
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Mesurer veut dire : « assigner un nombre à un objet ou à un évènement
selon un règle logiquement acceptable : ».
Selon la règle utilisée, on distingue 4 niveaux de mesure auxquelles
correspondent 4 échelles de mesure :
1. L’échelle nominale :
- On substitue un nombre au nom du bien ou de la personne.
- Le nombre n’est donc ici qu’une simple étiquette, une façon simple de
désigner les objets, comme c’est le cas des numéros d’immatriculation
des voitures ; les numéros des joueurs de football.
- La seule règle qui préside dans cette échelle consiste à «attribuer un
nombre identique à des objets identiques et des nombres différents à des
objets différents ».
- Aucune opération mathématique ne peut être utilisée pour ces
nombres
2. l’échelle ordinale
- on l’obtient en classant les éléments par ordre de grandeur croissant ou
décroissant d’un des leurs attributs.
EXEMPLE : demander à un professeur de juger des étudiants en les notant :
Elite - très bon – bon –médiocre – mauvais. Dans le dépouillement, on
pourra attribuer le nombre 1 à élite, 2 à très bon, 3 à bon, 4 à médiocre et 5
à mauvais (ou le contraire).
- Deux situations se présentent comme suit :
Attribuer à chaque donnée un rang ;
Placer les données dans différentes catégories ou classes
hiérarchiques.
- Ici, comme dans l’échelle nominale, pas d’opérations mathématiques ;
- La seule- règle qui préside ici est que : << les nombres doivent
exprimer aussi la relation – plus petit que – plus grand que - >>.
3. L’échelle d’intervalle :
- on l’obtient lorsqu’on fait correspondre aux différences entre les nombres,
des différences entre objets.
Les zéros de l’échelle ne correspond pas à l’absence de la propriété chez
l’élément caractérisé par la mesure zéro. Donc, le zéro est arbitraire.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 6
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
- Dans ce cas ; on peut soustraire les données mais non les additionner,
les multiplier et les diviser. exemple, un étudiant qui a obtenu la note
zéro en statistique, ne signifie pas pédagogiquement qu’il ne connait
absolument rien du tout en statistique. tout comme la température 0
ne signifie pas absence de température.
4. l’échelle de rapport :
Rapports égaux entre les nombres représentent les rapports égaux
entre les objets.
Cela suppose l’existence d’un zéro absolu ; un exemple : de la distance
entre objet – objet se trouvant à 60 m du X est trois fois plus éloigné
que l’objet se trouvant à 20 m de X.
X………………….01 (20m)
X………………………………………………………02 (60 m)
Le point de départ Om (absence de longueur) est considéré et il est
effectivement absolu (= ne change pas)
N.B : les données mesurées dans une échelle métrique (d’intervalle et de
rapport) peuvent être transformées soit en données ordinales, soit en
données nominales.
Exemple, la taille mesurée peut-être transformée en rang (le plus grand
prend le rang 1) ou en catégorie (plus grand)
Masures ……… rangs …….. Catégories (ces transformations font perdre des
informations).
0.4 DOMAINES D’APPLICATION DE LA STATISTIQUE :
La science statistique est utilisée de nos jours dans beaucoup de domaines,
nous nous limiteront à citer quelques applications :
Recherche en éducation
Recherche en biologie et en médecine
Enquête de marché
Contrôle de fabrication ; recherche spatiales ; etc.
Les perfectionnements considérables intervenus dans le domaine des
machines à calculer (ordinateurs en particulier) ont contribué à étendre les
possibilités de la statistique.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 7
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
0.5 PLAN DU COURS
chapitre 0 : Introduction
chapitre 1 : Groupement et représentation des données statistiques
chapitre 2 : Mesure de la tendance centrale
chapitre 3 : Mesure de la dispersion
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 8
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
0.6 BIBLIOGRAPHIE
1. D’Agnelli, ‘’théorie et méthodes statistiques, applications
agronomiques’’ Belgique, Presses agronomiques de Gembloux, Vol 1,
1973.
2. D’Hainaut L., ’’Concepts et méthodes de la statistique’’ tome 1 et 2,
Bruxelles, édition Labor, 1978
3. Geller, ‘’Statistique’’ 4e édition’’, Paris, OCDL, 1983
4. Hagège, ‘’Initiation à la statistique’’, Paris, Masson, 1966
5. Murray, ‘’Théorie et application de la statistique’’, Paris, Série scaum,
1981
6. Schwartz, ‘’Méthodes statiques à l’usage de médecins et de biologistes’’
7. David Howell, ‘’méthodes statique en sciences humaines’’, De Boeck
Université, Bruxelles, 1998
8. Monjallon A, ‘’ introduction à la méthode statistique’’, Paris, Vuibert,
1969
9. Mialaret ‘’statistique à l’usage des éducateurs’’, paris, PUF, 1967
10. Calot, ‘’cours de statistique descriptive’’, Paris, Dunod, 1973
11. De ketele ‘’Initiation à la résolution des problèmes statistiques
posés à la psychologique’’ Cacay, Louvain, 1980
12. Christine P, ‘’statistique sans mathématiques pour les
psychologues’’ De Boeck, 2007.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 9
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
CHAPITRE I :
GROUPEMENT ET PRESENTATION DES
DONNEES STATISTIQUES
Habituellement, les données obtenues après enquête sur le terrain, se
présentent en un ensemble désordonné. Pour obtenir une description
concise et systématique d’un tel ensemble, la méthode la plus simple est
celle qui consiste d’abord à mettre en ordre des données recueillies en
désordre, ensuite établir soit une distribution des fréquences ou des effectifs,
soit une distribution des données groupées en classe.
Exemple : Soit un groupe des valeurs numériques expérimentales (points
obtenus par des étudiants à une épreuve sur 15O points), obtenues dans un
ordre quelconque :
123 126 127 122 120 119 121 124 125 127 120 123 122 121
119 125 125 124 122 121 120 126 125 119 123 122 121 127
124 119 119 125 124 120 122
La première tâche consiste à la mise en ordre des données.
La deuxième tâche consiste à établir une distribution des fréquences ou des
effectifs simples :
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 10
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
1.1 DISTRIBUTION DES DONNEES NON GROUPEES EN
CLASSES
Cotes (x) Pointage Effectifs ou
fréquences
(n) f
127 iii 3
126 ii 2
125 iiiii 5
124 iiii 4
123 iii 3
122 iiiii 5
121 iiii 4
120 iiii 4
119 iiiii 5
total N=35
Interprétation :
3 : trois étudiants ont obtenus 127/ 150 ; 123/150
2 : deux étudiants ont obtenus 126/150
120 : la note 120 a été obtenue par 4 étudiants
127 : la note 127 a été obtenue par 3
1.1.1 Description d’une distribution des données non groupées :
a) les limites exactes ou réelles d’une valeur :
Si les notes d’étudiants sont enregistrées aux millimètres près, la valeur de
124 par exemple, comprend théoriquement toutes les valeurs de 123,5 et
124,5. Ces nombres sont appelés << limites réelles ou exactes >>. Chaque
valeur a donc ses deux limites réelles : une limite inférieure exacte (lie) et
une limite supérieure exacte (lse).
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 11
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Côtes (x) n lie Lse
127 3 126,5 127,5
126 2 125,5 126,5
125 5 124,5 125,5
124 4 123,5 124,5
123 3 122,5 123,5
122 5 121,5 122,5
121 4 120,5 121,5
120 4 119,5 120,5
119 5 118,5 119,5
total N=35
On entend par limite réelle ou exacte << les valeurs extrêmes inférieures ou
supérieures d’une valeur ; compte tenu que ces valeurs s’étendent d’une
demi unité en dessous et au-dessous des nombres entiers ou arrondis>>
b) Les effectifs (ou fréquences) relatifs ou les proportions et les
pourcentages simples d’une valeur
Côtes (X) n lie lse p P
127 3 126,5 127,5 0,086 8,6
126 2 125,5 126,5 0,057 5,7
125 5 124,5 125,5 0,143 14,3
124 4 123,5 124,5 0,114 11,4
123 3 122,5 123,5 0,086 8,6
122 5 121,5 122,5 0,143 14,3
121 4 120,5 121,5 0,114 11,4
120 4 119,5 120,5 0,114 11,4
119 5 118,5 119,5 0,143 14,3
Total N= 35 ∑p = 1 ∑ P = 1 00
o Une proportion ou effectif relatif simple symbolisé par (p minuscule)
s’obtient en divisant l’effectif simple (n) d’une valeur par l’effectif total
de la distribution (N)
𝑛
𝑝=
𝑁
Où n : l’effectif simple d’une valeur ; N : l’effectif total de la distribution ou le
nombre total des données ; p= proportion simple d’une valeur.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 12
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
o La somme de toutes les proportions d’une distribution doit être égale à
1.
o Un pourcentage simple symbolisé par (P majuscule) s’obtient en
multipliant la proportion simple par 100.
P=px100
Où p : proportion simple d’une valeur ; P : pourcentage simple d’une valeur.
o La somme de tous les pourcentages simples doit être égale à 100
Interprétation
0.057 : c’est la proportion d’étudiants dont la note est 126.
14.3 : c’est le pourcentage d’étudiants dont les notes sont 125, 122 et 119.
c) Les effectifs, les proportions et les pourcentages cumulés d’une valeur
Au lieu de se contenter des effectifs, des proportions et les pourcentages
simples, on peut étoffer le tableau en calculant les effectifs, proportions et
les pourcentages cumulés en vue de répondre à un certain nombre de
questions.
Il y a deux sortes des effectifs, des proportions et les pourcentages cumulés :
croissants et décroissants.
On symbolise les effectifs, les proportions et les pourcentages
cumulés croissants et décroissants de la manière suivante :
Simple Cumulé croissant Cumulé décroissant
Effectif (ou n ou f ncc fcc ndc ou fdc
ou
fréquence)
Proportion(ou p p cc pdc
effectif relatif)
Pourcentage) P Pcc Pdc
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 13
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Les effectifs cumulés croissants et décroissants
X n ncc ndc
127 3 35 3
126 2 32 5
125 5 30 10
124 4 25 14
123 3 21 17
122 5 18 22
121 4 13 26
120 4 9 30
119 5 5 35
Total N=35
Pour calculer les effectifs cumulés croissants, il suffit d’additionner
successivement les effectifs simples en commençant par l’effectif
simple de la valeur inférieure (la dernière valeur), en faisant
correspondre à chaque valeur la somme de cet effectif simple et tous
les effectifs des valeurs inférieures.
Pour calculer les effectifs cumulés décroissants, il suffit d’additionner
successivement les effectifs simples en commençant par l’effectif
simples de la valeur supérieure (la première valeur) ; en faisant
correspondre à chaque valeur la somme de cet effectif simple et tous
les effectifs des valeurs supérieures
A partir de la distribution des effectifs cumulés croissants ou
décroissants, on peut répondre aux questions suivantes :
<< combien d’étudiants ont obtenu la note supérieure ou inférieure
à … ?>> ; « combien d’étudiants ont obtenu la note supérieure ou
égale à …, inférieur ou égale à … »
Pour répondre à ces questions, il faut respecter les règles
suivantes :
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 14
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Lorsque la question posée est introduite par l’expression << supérieure
à …>> ou << supérieure ou égal à …>> ; la réponse doit être consultée
dans la colonne des effectifs cumulés décroissants (ndc)
Lorsque la question posée est introduite par l’expression << inférieure
à …>> ou << inférieure ou égal à …>> ; la réponse doit être consultée
dans la colonne des effectifs cumulés croissants (ncc)
Exemples
1) combien d’étudiants ont obtenu la note :
a) supérieur à 123, 120, 126, 125
b) inférieur à 119, 121, 122, 124
C) supérieur ou égal à : 127, 125, 123
d) inférieur ou égal à : 119, 121, 122, 124
Les proportions cumulées croissantes et décroissantes
Pour calculer les proportions cumulées croissantes, il suffit
d’additionner successivement les proportions simples en commençant
par la proportion simple de la valeur inférieure (la dernière valeur), en
faisant correspondre à chaque valeur la somme de cette proportion
simple et toutes les proportions des valeurs inférieures.
Pour calculer les proportions cumulées décroissantes, il suffit
d’additionner successivement les proportions simples en commençant
par la proportion simple de la valeur supérieure (la première valeur),
en faisant correspondre à chaque valeur la somme de cette proportion
simple et toutes les proportions des valeurs supérieures.
A partir de la distribution des proportions cumulées croissantes
ou décroissantes, on peut répondre aux questions suivantes :
<< Quelle est la proportion d’étudiants qui ont obtenu la note
supérieure ou inférieure à … ?>> ; « Quelle est la proportion
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 15
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
d’étudiants qui ont obtenu la note supérieure ou égale à …, inférieur
ou égale à … »
Pour répondre à ces questions, il faut respecter les règles
suivantes :
Lorsque la question posée est introduite par l’expression << supérieure
à …>> ou << supérieure ou égal à …>> ; la réponse doit être consultée
dans la colonne des proportions cumulées décroissantes (pdc)
Lorsque la question posée est introduite par l’expression << inférieure
à …>> ou << inférieure ou égal à …>> ; la réponse doit être consultée
dans la colonne des proportions cumulées croissantes (pcc)
x n p pcc Pdc
127 3 0,086 1 0,086
126 2 0,057 0,914 0,143
125 5 0,143 0,857 0,286
124 4 0,114 0,714 0,400
123 3 0,086 0,600 0,486
122 5 0,143 0,514 0,629
121 4 0,114 0,371 0,743
120 4 0,114 0,257 0,857
119 5 0,143 0,143 1
TOTAL N= 35 ∑p=1
Exemples
1) Quelle est la proportion d’étudiants qui ont obtenu la note :
a) supérieur à 122, 123, 126, 127
b) inférieur à 119, 124, 120, 126
C) supérieur ou égal à : 119, 125, 123
d) inférieur ou égal à : 120, 121, 122, 123
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 16
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Les pourcentages cumulés croissants et décroissants
Pour calculer les pourcentages cumulés croissants, il suffit
d’additionner successivement les pourcentages simples en
commençant par le pourcentage simple de la valeur inférieure (la
dernière valeur), en faisant correspondre à chaque valeur la somme de
ce pourcentage simple et tous les pourcentages des valeurs
inférieures.
Pour calculer les pourcentages cumulés décroissants, il suffit
d’additionner successivement les pourcentages simples en
commençant par le pourcentage simple de la valeur supérieure (la
première valeur), en faisant correspondre à chaque valeur la somme de
ce pourcentage simple et tous les pourcentages des valeurs
supérieures.
A partir de la distribution des pourcentages cumulés croissants
ou décroissants, on peut répondre aux questions suivantes :
<< Quelle est le pourcentage d’étudiants qui ont obtenu la note
supérieure ou inférieure à … ?>> ; « Quelle est le pourcentage
d’étudiants qui ont obtenu la note supérieure ou égale à …, inférieur
ou égale à … »
Pour répondre à ces questions, il faut respecter les règles
suivantes :
Lorsque la question posée est introduite par l’expression << supérieure
à …>> ou << supérieure ou égal à …>> ; la réponse doit être consultée
dans la colonne des pourcentages cumulés décroissants (Pdc)
Lorsque la question posée est introduite par l’expression << inférieure
à …>> ou << inférieure ou égal à …>> ; la réponse doit être consultée
dans la colonne des pourcentages cumulés croissants (Pcc)
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 17
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
x n P Pcc Pdc
127 3 8.6 100 8.6
126 2 5.7 91.4 14.3
125 5 14.3 85.7 28.6
124 4 11.4 71.4 40
123 3 8.6 60 48.6
122 5 14.3 51.4 62.9
121 4 11.4 37.1 74.3
120 4 11.4 25.7 85.7
119 5 14.3 14.3 100
TOTAL N= 35 ∑P=100
Exemples
1) Quel est le pourcentage d’étudiants qui ont obtenu la note :
a) supérieure à 122, 125, 123
b) inférieure à 119, 124, 120, 126
C) supérieure ou égal à : 122, 123, 126, 127, 119
d) inférieure ou égal à : 120, 121, 122, 123
1.1.2 Exercices d’application :
Soit une distribution des données statistiques (taille en cm de 30 élèves
d’une classe du primaire) :
143 140 142 145 140 148 144 142 147 140 142 146 147
145 143 141 140 148 142 143 144 146 143 145 147 148
140 145 146 140
1) combien d’élèves ont la taille de 147 cm ? ; 142 cm ?
2) combien d’élèves ont la taille supérieure à 145 cm ;146 cm ; 143 cm ?
3) quelle est la proportion d’élèves dont la taille est inférieur à 147 cm, 140
cm, 148 cm ?
4) quel est le pourcentage d’élève qui a la taille de 145 cm, 147 cm, 143
cm ?
5) quel est le pourcentage d’élève dont la taille en inférieure ou égale à 145
cm , 148 cm , 149 cm , 139 cm ?
6) quelle est la proportion d’élèves dont la taille équivaut à 144 cm, 143 cm,
141 cm ?
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 18
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
1.2 DISTRIBUTION DES DONNEES GROUPEES EN CLASSES
Lorsque les valeurs de la variable sont trop nombreuses et lorsqu’il est
impossible de constituer un tableau aussi détaillé, on regroupe les données
en classes.
Il est déconseillé d’aller en déca de 5 classes et au-delà de 15 classes, pour
ne pas perdre certaines informations des distributions et pour ne pas rendre
les calculs très fastidieux.
1.2.1 Les étapes de groupements des données en classes :
1°) chercher les notes extrêmes de la distribution : Xh(= note la plus haute
ou la plus grande) et xb (= note plus basse ou la plus petite) ;
2°) calculer la marge de variation ou l’étendue de variation :
MV= (Xh- Xb)+1
3°) calculer l’intervalle de classe :
i = MV/ 15
On divise par 15 parce que le nombre de classes exigé doit en principe se
situer entre 10 et 20, selon certains statisticiens. Selon certains statisticien,
l’intervalle de classes doit en principes être un nombre impair enfin d’obtenir
une distribution sans virgules ;
Si la division de MV/15 donne un nombre impair sans virgule, on le
considère directement, si elle donne un nombre pair ou un nombre impair
avec virgule, on sera obligé de considérer le nombre impair sans virgule qui
vient directement après le quotient obtenu.
En prenant par exemple MV= 24 ; i=24/15=1,6 ; en l’arrondissant, on
obtient = 3 qui est un nombre impair immédiatement supérieur à 1,6
4°) construire les classes de la distribution :
Si par exemple ; l’intervalle de classe est 3 : on doit placer Xh au
centre et trouver la limite de gauche en soustrayant une unité à Xh ;
et la limite de droite en ajoutant une unité à Xh :
Xh-1 Xh Xh+1
Si i= 5 ; on aura :
Xh-2 Xh-1 Xh Xh+1 Xh+2
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 19
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Donc ; si l’intervalle de classe est 3, cela veut dire Que dans chaque
classe ; il y a 3 nombres. Si i=5 ; cela veut dire que dans chaque classe, il
y a 5 nombres ; etc.
5°) faire le pointage des observations afin de déterminer les effectifs
simples des distributions, ensuite les proportions et les pourcentages
simples, puis cumulés, etc.
Exemple : dans une étude portant sur 121 patients , on a déterminé pour
chacun d’eux la tension artériel systolique au mmhg près dont voici les
résultats :
155 149 162 149 153 145 151 156 144 151 169 151 149 155 146
157 164 150 135 147 155 144 180 166 141 131 151 132 139 153
139 156 143 146 159 155 165 171 160 159 144 145 158 160 175
166 163 147 153 147 167 145 159 152 144 148 152 134 143 148
140 151 142 160 133 143 122 157 136 152 198 146 146 138 150
140 151 149 141 156 150 161 157 168 154 143 152 145 151 133
144 136 146 154 139 152 138 162 130 142 151 127 149 141 157
158 150 158 154 134 142 142 148 151 158 150 148 154 148 145
137
1°) Xh = 198 et Xb= 122
2°) MV=(198 - 122 ) + 1 = 77
3°) i=77/15=5.13 ≈ 7 (nombre impair sans virgule immédiatement
supérieur à 5.13).
4°) appliquons la formule et construisons la première classe :
Xh-3 Xh-2 Xh-1 Xh Xh + 1 Xh+2 Xh + 3
195 196 197 198 199 200 201
La classe la plus haute sera constituée par les deux notes extrêmes : 195 et
201.
La classe qui suit sera obtenue en soustrayant à chaque note extrême de la
première classe l’intervalle de classe (7) : (195-7=188) et (201-7=194) et ainsi
de suite
La dernière classe de la distribution doit inclure la note la plus basse
(Xb=122) comme la première classe inclut la note la plus haute (Xh= 198).
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 20
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Nous trouvons ainsi les classes suivantes :
X POINTAGE n
195-201 ! 1
188-194 0
181-187 0
174-180 !! 2
167-173 !!!! 4
160-166 !!!!! !!!!! ! 11
153-159 !!!!! !!!!! !!!!! !!!!! !!!!! 25
146-152 !!!!! !!!!! !!!!! !!!!! !!!!! !!!!! !!!!! !! 37
139-145 !!!!! !!!!! !!!!! !!!!! !!!!! ! 26
132-138 !!!!! !!!!! ! 11
125-131 !!! 3
118-124 ! 1
TOTAL N=121
1.2.2 La description d’une distribution des données groupées en classe
a) les limites réelles ou exactes des classes
On obtient les limites exactes d’une classe ; en soustrayant la moitié de
l’unité à la borne inférieure de la classe et en ajoutant la moitié de l’unité à
la borne supérieure de la classe. La limite inférieure de la classe est
symbolisée par lie (= limite inférieure exacte) ; la limite supérieure de la
classe par lse (=limite supérieure exacte)
Pour cette distribution, on aura
Lie - lse
194.5 - 201.5
187.5 - 194.5
180.5 - 187.5
173.5 – 180.5
166.5 - 173.5
159.5 - 166.5
152.5 -159.5
145.5 - 152.5
138.5 - 145.5
131.5 - 138.5
124.5 - 131.5
117.5 -124.5
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 21
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
NB. Toutes les interprétations, soit effectifs simples ou cumulés, soit des
propositions simples ou cumulés, soit des pourcentages simples ou cumulés
se font en fonction des limites exactes des classes.
b) les points- milieux ou valeurs centrales des classes :
Les points-milieux sont des valeurs centrales des classes qui serviront à
calculer certains indices statistiques comme la moyenne, la variance, etc.
On obtient le point-milieux d’une classe en faisant la moyenne arithmétique
de deux bornes de la classe :
Exemple : (195 + 201)/ 2=198 ; (188+194)/2=191 ; (181+187)/2 = 184
Autrement dit ; on soustrait l’intervalle de classe au point –milieu de la
première classe et ainsi de suite. 198-7=191 ; 191-7=184 ; etc.
Le point-milieu est symbolisé par Xi.
X n Xi
195-201 1 198
188-194 0 191
181-187 0 184
174-180 2 177
167-173 4 170
160-166 11 163
153-159 25 156
146-152 37 149
139-145 26 142
132-138 11 135
125-131 3 128
118-124 1 121
N=121
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 22
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
C) Les effectifs, les proportions et les pourcentages simples et cumulés :
X n 𝑛𝑐𝑐 𝑛𝑐𝑑 p 𝑝𝑐𝑐 𝑝𝑐𝑑 p 𝑝𝑐𝑐 𝑝𝑐𝑑
195-201 1 121 1 0,0083 1 0,0083 0,83 100 0,83
188-194 0 120 1 0,0000 0, 9918 0,0083 0,00 99,18 0,83
181-187 0 120 1 0,0000 0,9918 0,0083 0,00 99,18 0,83
174-180 2 120 3 0, 0165 0,9918 0,0248 1,65 99,18 2,48
167-173 4 118 7 0,0331 0,9753 0,0579 3,31 97,53 5,79
160-166 11 114 18 0,0909 0,9422 0,1488 9,09 94,22 14,88
153-159 25 103 43 0,2066 0,8513 0,3554 20,66 85,13 35,45
146-152 37 78 80 0,3058 0,6447 0,6612 30,58 64,49 64,12
139-145 26 41 106 0,2149 0, 3389 0,8761 21,49 33,89 87,61
132-138 11 15 117 0,0909 0,1240 0,9670 9,09 12,40 96,70
125-131 3 4 120 0,2048 0,0331 0,9918 2,48 3, 31 99,18
118-124 1 1 121 0,0083 0,0083 1 0,83 0,83 100
TOTAL N= ∑p=1
121
A partir de ce tableau, on peut répondre aux questions suivantes :
1) Combien de patients dont les taux artériels sont : supérieurs à
175mmhg ,173mmhg ?
2) Combien de patients dont les taux artériels sont : supérieurs ou égaux
à 175mmhg, 127mmhg ?
3) Combien de patients dont les taux artériels sont : inférieurs ou égaux
173mmhg ?
4) Quelle est la proportion de patients dont les taux artériels sont :
supérieurs ou égale à 133 mmhg, 156mmhg, 135 mmhg ?
5) Quel est le pourcentage des patients dont les taux artériels sont :
inférieurs ou égale à 152mmhg, 189mmhg, 136mmhg ?
6) Interprétez : 73, 0, 3058,20.66
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 23
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
1.3 REPRESENTATION GRAPHIQUE DES DONNEES
STATISTIQUES
Le but poursuivi reste identique : celui d’augmenter la « lisibilité » d’un
ensemble des données numériques .Une représentation graphique
permettra souvent de capter d’emblée les principales caractéristiques d’une
distribution .Elle est beaucoup plus parlante que le procédé précédent.
1.3.1 Principe de représentation graphique :
Quel que soit le mode de représentation graphique utilisé, il est d’usage de
représenter les résultats sur l’axe horizontal (axe des abscisses) et les
fréquences ou effectifs, les proportions ou les effectifs relatifs et les
pourcentages simples ou cumulés sur l’axe vertical (axe des ordonnées).
5 ….…………………………………………………….…P(5 ,5) a comme coordonnée x=5 ;y=5
4 ……….………………………………. P(4,4) a comme coordonnée x=4,y=4
3 ……..………………… P(3,3) a comme coordonnée x=3,y=3
2 .…….……… P(2,2) a comme coordonnée x=2,y=2
1 …… P(1,1) a comme coordonnée x=1,y=1
0 1 2 3 4 5 X
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 24
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
1.3.2. Modes de représentation graphique
a) diagramme en bâtons ou linéaire :
o En abscisses sont placées les différentes valeurs de la variable et en
ordonnée ; les effectifs ; les proportions ou les pourcentages ;
o Soit à représenter graphiquement la répartition de nombre d’enfants
dans 8 familles :
Famille : 1 2 3 4 5 6 7 8
Effectifs familles : 20 22 27 12 7 4 2 1
(Y)
30 27
20 20 22 12
10 7 4 2 1
0 1 2 3 4 5 6 7 8 (X)
b) diagrammes à colonnes
Il est utilisé dans les mêmes conditions que même diagramme en bâtons
On remplace les bâtons par des colonnes rectangulaires de même largeur et
proportionnels aux effectifs ; aux proportions et aux pourcentages
(Y)
30 27
20 20 22 12 7 4
10 2 1
0 1 2 3 4 5 6 7 8 (X)
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 25
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
c) histogramme
On appelle << histogramme>> ; la représentation graphique d’une
distribution des effectifs ; des proportions et des pourcentages ; constituée
par le contour des rectangles ayant pour base chacun des points-milieux (xi)
de la variable et dont les surfaces sont proportionnelles aux effectifs ; aux
proportions et aux pourcentages des différentes classes. Donc ; on
représente les données statistiques par un histogramme ; lorsque celles-ci
sont regroupées en classes.
o Utilisé si la variable est quantitative continue ;
o Sur l’axe des abscisses ; les points-milieux des classes ;
o Sur l’axe des ordonnées ; les effectifs ; les proportions ou les
pourcentages simples des classes ;
o Chaque résultat individuel est représenté sous forme d’une surface
donnée par des dimensions d’un petit rectangle
o Le nombre total des résultats est représenté par la surface totale de
l’histogramme ;
o A titre d’exemple ; nous prenons l’histogramme de la distribution de
tensions artérielles de 121 patients (cfr supra)
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 26
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
f 30
c 20
f 10
0 121 128 135 142 149 156 163 170 177 184 191 198
d) Polygone des effectifs :
On obtient le << polygone>> des effectifs ; des proportions ou des
pourcentages en joignant les sommets des rectangles par des droits.
La surface de l’histogramme est égale à la surface du polygone de la
même distribution.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 27
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Polygone des effectifs
f 30
c 20 histogramme
f 10
0 121 128 135 142 149 156 163 170 177 184 191 198
e) Diagramme circulaire ou à secteur :
Utilisé si l’on veut représenter les différentes parties d’un tout ;
Le cercle est divisé en parties proportionnelles aux effectifs, aux
proportions et aux pourcentages considérés ;
Il suffira d’obtenir l’angle au centre en utilisant le calcul simple de
règle de trois ;
Ex : Soit, le nombre de patients dans une région donnée atteints par les
maladies suivantes :
- Cancer……465
- Diabète……372
- Hépatite……189
- Lèpre…… .…64
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 28
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Solution :
Maladies Nombre Calcul des Calcul des angles au
X n pourcentages centre
Cancer 465 465*100/1090=42.66 360*42.66/100=154°
Diabète 372 372*100/1090=34.13 360*34.13/100=123°
Hépatite 189 189*100/1090=17.34 360*17.34/100=62°
Lèpre 64 64*100/1090=5.87 360*5.87/100=21°
TOTAUX N=1090 100% 360°
Diabète
Hépatite
Cancer
Lèpre
Exercices d’application :
1) Soit le tableau qui représente le nombre de kilogrammes de blé et de maïs
produits de 2021 à 2022 : représenter graphiquement en diagramme de
colonnes et en bâtons.
1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 Années
200 185 225 250 240 195 210 225 250 230 235 Blé
75 90 100 85 80 100 110 105 95 110 100 Maïs
2) Si un étudiant se met à noter le nombre de véhicules qui passent à l’ISP
Kalemie chaque lundi, mercredi et samedi, il pourra observer éventuellement
une variabilité (quantitative, qualitative). Souligner l’élément correct.
3) La cigarette A est jugée meilleure que la cigarette B par 75% des fumeurs.
De quelle échelle s'agit-il ?
4) On fait passer un test de mathématique à 80 élèves du secondaire dont
voici les résultats :
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 29
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
68 84 75 82 68 90 62 88 76 93 75 85 59 71 93 60 73 88 79 73 61 65 75 87
74 62 95 78 63 72 60 68 74 69 77 94 96 78 89 61 75 95 60 79 83 71 75 71
65 76 85 78 97 67 62 79 65 80 73 57 88 78 62 76 53 74 77 85 75 76 63 72
81 73 67 86 85 86 86 88
a) Grouper ces données en classes
b) Répondez aux questions suivantes :
- Combien d'étudiants ont obtenu la note supérieure ou égale à 74; à 83; à
58.
- Quelle est la proportion d'élève dont les notes sont inférieures ou égales à
87; à 75; à 66
5) Les notes suivantes représentent les résultats à une épreuve de physique
subie par 100 étudiants d'une université locale :
26 36 44 42 38 48 42 44 46 30 38 50 48 46 48 50 50 50 32 38 50 40 44 40
46 50 46 40 44 42 46 42 34 36 48 38 40 50 44 50 48 34 40 48 48 50 54 52
52 54 48 50 52 46 54 52 64 66 62 64 62 56 58 52 52 52 52 52 56 54 62 64
60 58 54 60 58 62 60 60 58 56 54 56 58 76 60 56 50 48 42 46 44 50 48 70
66 54 56 55
a) Grouper ces données en classe
b) répondez aux questions suivantes :
- Combien ont obtenu la note supérieur à 54; à 43; à 58
- Quelle est la proportion d'étudiants dont la note est inférieure à 60.51; à
31; à 62;
- Quel est le pourcentage d'étudiants dont la note est supérieure ou égale à
57; à 29; à 46
6) Voici les résultats à un test d'embauche dans une entreprise locale sur 60
candidats : grouper ces données en classes.
105 130 118 118 124 125 118 114 92 120 130 122 104 142 136
128 118 118 110 134 108 116 118 130 116 118 128 116 108 110
120 140 152 128 118 118 126 122 124 104 143 122 148 102 124
110 132 118 93 110 132 125 116 135 142 138 152 120 134 100
Gouper ces données en classes
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 30
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
7) représenter graphiquement (diagramme linéaire) ces différentes données
(en tonne)
a) exploitation en or
année 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
% en 72 67 69 74 75 66 65 68 72 67 70
or
b) superficie de 5 océans (en million de km2)
océan indien
pacifique atlantique antarctique arctique
superficie 183 107 74 20 12
8) le tableau suivant montre la situation de famille des hommes et des
femmes (de plus de13 ans) aux Etats-Unis pour l’année 1958
Représenter ces données sur deux diagrammes à secteur
Situation de Homme Femme
famille (pourcentage du total) (pourcentage du total)
Célibataire 24,5 18,8
Marie 69,8 66,0
Veuf 3,9 12,8
divorcé 1,8 2, 3
13) la consommation mensuelle de litres d’essence d’un charroi
d’automobiles d’une entreprise :
140 118 110 116 128 130 132 116 142 112 128 114 108 124 152
94 130 138 128 120 118 116 100 128 136 120 140 130 128 132
104 98 132 118 138 118 116 143 122 110 122 142 118 120 142
118 138 164 150 132 144 125 149 157 146 158 140 147 136
142 147 136 142 147 135 153 140 135 161 145 168 144 152 148
173 146.
a) Grouper ces données en classe
b) trouvez la colonne de Xi, toutes les colonnes des cumulés.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 31
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
CHAPITRE : II
MESURES DE LA TENDANCE
CENTRALE
Avec un ensemble de données présentées sous forme d’une distribution des
fréquences ou sous forme graphique, l’intérêt se centre souvent sur une
description résumée des données par un ou deux nombres.
Plusieurs caractéristiques peuvent être examinées; les deux les plus
communément utilisées étant :
1) la tendance centrale;
2) la dispersion ou l’étalement ou encore la variation.
D’autres caractéristiques des distributions existent, telles que l’asymétrie, la
voussure…ne feront pas l’objet de notre étude compte tenu du temps nous
imparti. Parmi les caractéristiques de la tendance centrale, nous
distinguons : la moyenne, la médiane et le mode
2.1 LA MOYENNE :
Une moyenne est une valeur caractéristique ou représentative d’un ensemble
de données. Dans la mesure où cette valeur caractéristique a tendance à se
situer au milieu d’un ensemble de données rangées par ordre croissant, on
dit aussi que l’on a une «mesure de la tendance centrale»
On peut définir plusieurs types de moyennes, les plus courants étant la
moyenne arithmétique et la moyenne harmonique. Chacune d’elles présente
des avantages et des inconvénients, qui dépendent des données et de ce que
l’on veut en faire.
2.1.1 la moyenne arithmétique
La moyenne arithmétique est égale à « la somme des résultats
individuels de la distribution divisée par le nombre total des résultats dans
la distribution ». Elle est symbolisée par la lettre M ou µ (mu) ou encore× (x
barre)
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 32
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
On calcule la moyenne arithmétique d’un ensemble de N nombres
x1,X2,X3….Xn
x1 + x2 + x3 + ⋯ xn
𝑀=
N
Où x : les observations
N : nombre total des observations dans la distribution
a) cas de données non groupées en classes :
Soit l’âge de décès de 7 ouvriers : 34 64 68 70 74 46 50
X= 34+64+68+70+74+46+50 = 406 = 58 ans
7 7
b) Cas d’un tableau des effectifs (moyenne pondérée)
Il s’agit du cas où, toujours dans le cas des données non groupées, une
même valeur est représentée plusieurs fois, il faut la compter autant de fois
qu’elle a été observée, c’est-à-dire la multiplier par son effectif (n). Son
symbole Mp ou x
Xp= X1n1+X2 n2+X3n3+… +Xk nk
N
xp= moyenne pondérée
n1, n2, n3, nk : nombre d’observations par échantillon
x1, x2, x3, xk : valeurs correspondantes de la variable
Soient, les âges de 25 enfants sous-alimentés au centre nutritionnel
KATARINA BENI de Kahite :
12 13 9 9 7 9 12 9 8 7 8 11 10 10 11 12 13 8 10 11 9 10 10 11 11
Age (X) n nX
13 2 26
12 3 36
11 5 55
10 5 50
9 5 45
8 3 24
7 2 14
Total N=25 ∑nX=250
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 33
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
X = (13*2)+(12*3)+(11*5)+(10*5)+(9*5)+(8*3)+(7*2) = 26+36+55+50+45+24+14
2+3+5+5+5+3+2 25
= 250 = 10 ans
25
c) Cas de données groupées en classes :
Lorsque les données sont groupées en classes, il est facile d’en calculer la
moyenne arithmétique en considérant le point-milieu de chaque classe
comme valeur représentative de toutes les valeurs tombant dans cette
classe.
Les formules précédentes de la moyenne restent valables pour les données
groupées si on interprète Xi comme le centre de chaque classe. Pour calculer
la moyenne des données groupées en classes, on utilise la formule du point-
milieu.
Formule du point-milieu
∑ 𝑛𝑋𝑖
X= où : n : effectif de chaque classe
𝑁
Xi : point-milieu de chaque classe
N : total des observations de la distribution
Soit, l’exemple de tensions artérielles de 121 patients (cfr supra) :
X n Xi nXi
195-201 1 198 198
188-194 0 191 0
181-187 0 184 0
174-180 2 177 354
167-173 4 170 680
160-166 11 163 1793
153-159 25 156 3900
146-152 37 149 5513
139-145 26 142 3692
132-138 11 135 1485
125-131 3 128 384
118-124 1 121 121
N=121 ∑ 𝒏𝑿𝒊 = 𝟏𝟖𝟏𝟐𝟎
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 34
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
∑ 𝒏𝑿𝒊 𝟏𝟖𝟏𝟐𝟎
̅=
𝑿 = = 𝟏𝟒𝟗. 𝟕𝟓 𝒎𝒎𝒉𝒈
𝑵 𝟏𝟐𝟏
2.1.2. La moyenne harmonique :
La moyenne harmonique de N données X1, X2, X3, … Xn est « l’inverse de la
moyenne arithmétique des inverses de N données ».
Soient N données X1, X2, X3, … Xn leurs inverses sont1/X1,1/X2, 1/X3, …
1/Xn
Si nous appelons H la moyenne harmonique de N données, nous aurons la
formule suivante :
a) La formule de la moyenne harmonique simple
𝑁
H= 1 1 1 1
+ + +…+
𝑋1 𝑋2 𝑋3 𝑋𝑛
Exemple1 : Soit une série des nombre suivants :
3 5 6 6 7 10 12
𝑁 7 7
H= 1 1 1 1 =1 1 1 1 1 1 1 = 140+84+70+70+60+42+35 =
+ + + …+ + + + + + +
𝑋1 𝑋2 𝑋3 𝑋𝑛 3 5 6 6 7 10 12 420
7∗420 2940
= = 5.87
501 501
Exemple 2 : Une automobiliste va de Kalemie à Nyunzu à la vitesse de 60/h
et revient à la vitesse de 80 km/h. Quelle est sa vitesse moyenne ?
2 2 2∗40
H= 1 1 = 4+3 = = 68.57 𝑘𝑚/ℎ
+ 7
60 80 240
b) La formule de la moyenne harmonique pondérée :
𝑁
𝐻𝑝 = 𝑛1 𝑛2 𝑛3 𝑛𝑛
+ + +
𝑋1 𝑋2 𝑋3 𝑋𝑛
Exemple : un consommateur achète quatre produits de consommation
Courante en francs congolais :
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 35
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
- 3 kg de
sucre à 152fc le kg ;
- 2 kg de
viande à 500fc le kg ;
- 5 kg de
fruits à 250fc le kg ;
- 2 kg de
beurre a 800fc le kg.
X n H simple H pondérée
Denrées Prix le kg Pondération 1 /X n/X
Sucre 152 3 0,0066 0,020
Viande 500 2 0,0020 0,004
Fruits 250 5 0,0040 0,020
Beurre 800 2 0,0013 0,0025
Totaux 1702 N=12 0,00139 0,045
4 12
H simple = = 287.76𝑓𝑐 ; 𝐻 𝑃𝑜𝑛𝑑𝑒𝑟é𝑒 =0.045 = 266.66 𝑓𝑐
0.0139
c) La formule de la moyenne harmonique pondérée pour les données
groupées en classe
𝑁
𝐻𝑝 = 𝑛1 𝑛2 𝑛3 𝑛
+ + + ⋯ + 𝑋𝑖𝑛
𝑋𝑖1 𝑋𝑖2 𝑋𝑖3 𝑛
Exemple : le tableau ci-dessous représente la distribution des poids de 40
jeunes garçons (en kg) :
Poids(x) n xi 𝑛/𝑋𝑖
85-93 1 89 0,0112
76-84 4 80 0,05
67-75 7 71 0,0986
58-66 15 62 0,2419
49-57 13 53 0,2453
40-48 8 44 0,1818
31-39 7 35 0,2
22-30 2 26 0,0769
13-21 2 17 0,1176
4-12 1 8 0,125
Totaux N=60 1.3483
60 3216
H= pondérée = = 44.5 𝑘𝑔 𝑀= = 53.6𝑘𝑔
1.3483 60
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 36
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Exercices d’application
1) sur 100 nombres, 20 sont des 4 ;40 sont des 5 ;30 sont des 6 et le reste
sont des [Link] la moyenne arithmétique des 100 nombres.
2) Dans une usine ayant 80 employés, 60 gagnent 3 dollars par heure et 20
gagnent 2 dollars par heure. Déterminer le gain moyen par heure.
3) Calculer a)la moyenne arithmétique et la moyenne harmonique des
données suivantes : 5 8 4 7 11 9
2.2 LA MEDIANE
La médiane est le point sur l’échelle des résultats en dessous et au-dessus
duquel il y a exactement 50% des cas. Elle est symbolisée par Md.
2.2.1 Cas des données non groupées en classes :
Il importe de travailler toujours sur les données rangées par ordre de
grandeur, soit croissante, soit décroissante.
a) Cas du nombre impair
Où : x : représente la valeur médiane
Md=X (N+1)/2 (N+1) /2 : Le rang qu’occupe x sur l’échelle
des valeurs
N: nombre d’observations dans la série
ex : Soient, les données suivantes : 8 2 17 5 10 9 7
Solution :1) ranger les données : 2 5 7 8 9 10 17
2) appliquer la formule : Md=X (7+1)/2=X8/2=X4é𝑚𝑒 rang sur
l’échelle des valeurs.
3) situer la médiane sur l’échelle des valeurs
2 5 7 8 9 10 17 Donc ; la médiane est égale à 8
b) cas du nombre pair :
Md= (X(N/2+N /2+1)/2
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 37
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Ex :Soient les données suivantes : 12 13 10 7 20 18 9 15
Solution :
1) ranger les données : 7 9 10 12 13
15 X n 𝑛𝑐𝑐 𝑛𝑐𝑑 18 20
2) appliquer la formule : Md=(X
(8/2+8/2+1)/2=(X4+X5)/2=
X9/2=X4. 5é𝑚𝑒 . Rang sur l’échelle des valeurs
3) situer la médiane sur l’échelle des valeurs :
7 9 10 12 13 15 18 20
1é 2é 3é 4é 4é 3é 2é 1é
Donc, la médiane est égale à 12+13/2=25/2=12.5.
C) Cas des données groupées en classe :
Les étapes :
1) calculer les effectifs cumulés croissants ou décroissants ;
2) diviser l’effectif total par 2, pour situer la valeur médiane (N/2) ;
3) situer la valeur N /2 dans la colonne des effectifs cumulés,
5) appliquer la formule ci-après :
𝑁
−𝑛𝑑
2
Md=lie + 𝑖
𝑛𝑤
Où : lie : limite inferieure exacte
nd : effectif cumule croissant de la classe immédiatement
inférieure à celle possédant la fréquence la plus élevée
nw : effectif simple de la classe possédant la fréquence la plus
élevée
i : intervalle de classe de la distribution.
N : effectif total de la distribution.
Exemple : dans une étude portant sur 121 patients de plus de 50 ans, on a
déterminé pour chaque d’eux, la tension artérielle systolique au mmhg près.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 38
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
195-201 1 121 1
188-194 0 120 1
181-187 0 120 1
174-180 2 120 3
167-173 4 118 7
160-166 11 114 18
153-159 25 103 43
146-152 37 78 80
139-145 26 41 106
132-138 11 15 117
125-131 3 4 120
118-124 1 1 121
N=121
N/2=121 /2=60.5 ;
i =7 ;
lie =145.5 ;
nd =41 ;
nw= 37
Classe modale : 146 -152
60.5−41
Md=152.5+ . 7 = 149.19𝑚𝑚ℎ𝑔
37
2.3 LE MODE OU LA DOMINANTE
2.31 Définition
Pour les données nominales : le mode est :
- Dans une échelle nominale : la modalité la plus fréquente ;
- Dans une échelle supérieure : la valeur la plus fréquente de l’échelle.
Pour les données groupées en classe : le mode est :
-Dans une échelle nominale : la modalité issue du le groupement la plus
fréquente :
-Dans une échelle supérieure : on distingue :
a) le mode brut : est le point –milieu (Xi) de la classe possédant la
fréquence le plus élevée ;(symbolisé par Mo)
Exemple : soient deux tableaux des effectifs A et B suivants :
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 39
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
A)
x n Xi
41-43 4 42
38-40 7 39
35-37 15 36
32-34 15 33
29-31 3 30
Mo= (36+33) /2= 34.5
Donc, une distribution unimodale car, les classes portant les
effectifs simples les plus élevés se suivent.
On doit faire la moyenne arithmétique de leurs points-milieux
B)
x n Xi
26-28 7 27
23-25 15 24
20-22 10 21
17-19 15 18
14-16 4 15
Mo=24 et 18
Donc, une distribution bimodale car, les classes portant les effectifs
simples les Plus élevés ne se suivent pas.
On ne doit pas faire la moyenne arithmétique de leurs point- milieux,
mais on Considère les deux points –milieux comme étant deux modes
séparés.
b)le mode dérivé : se calcule à partir de la moyenne et du médian de la
même distribution (symbolisé par Mod)
Mod = 3 médianes - 2moyennes
Ce mode dérivé donne une estimation plus précise du vrai mode.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 40
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Exemple,
X n Xi nXi 𝑛𝑐𝑐
41-43 2 42 84 56
38-40 4 39 156 54
35-37 8 36 288 50
32-34 10 33 330 42
29-31 12 30 360 32
26-28 9 27 243 20
23-25 7 24 168 11
20-22 3 21 63 4
17-19 1 18 18 1
N=56 ∑𝑛𝑋𝑖
∑𝑛𝑋𝑖 1710
M= = = 30.54
𝑁 56
𝑁
−𝑛𝑑 28−20
Md=lie + 2
.i=28.5+ . 3 = 30.5
𝑛𝑤 12
Mod = 3(30.5)-2(30.54) = 91.5-61.08 = 30.42
Mo =30 (=point-milieu de la classe possédant l’effectif simple le plus
élevé).
2.3.2 Mode des données non groupées en classe :
Soit la distribution des données suivantes : 23 17 15 13 22 17 23 20 22 17
15 22 17 13 12 13 12
Il faut ranger les données en ordre de grandeur croissante ou
décroissante
12 12 13 13 13 15 15 17 +17 +17+ 17 20 22 22 22 23 23
Le mode est 17, car c’ est la valeur qui se répète plusieurs fois (4 fois).
2.3.3 Mode des données groupées en classe :
Comme pour le calcul de la médiane. On calcule le mode par deux
formules :
Celle de la limite inférieure exacte et celle de la limite supérieure exacte.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 41
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
a)limite inférieure exacte :
𝒅𝟏
Mo=lie+ 𝒅𝟏+𝒅𝟐 .𝒊
Où : lie : limite inférieure exacte
d1 : différence entre l’effectif simple de la classe possédant l’effectif le plus
élevé et l’ effectif simple immédiatement inférieur ;
d2 : différence entre l’ effectif simple de la classe possédant l’effectif le plus
élevé et l’ effectif simple immédiatement supérieur :
Exemple : X n
41 –43 2
38-40 4
35-37 8
32-34 10
29-31 12
26-28 9
23-25 7
20-22 3
17-19 1
N=56
29-31 :c’ est la classe modale, parce que on y trouve l’ effectif simple
le plus élevé (=12).
lie=28.5
d1= (12-9)=3
d2 = (12-10)=2
i=3
Appliquons la formule :
A) limite inferieur exacte
𝑑1
MO = lie + i
𝑑1 − 𝑑 2
3
MO = 28.5 + 3 = 30.3
3+2
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 42
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
B) limite supérieure exacte
𝑑2
MO = lse - 𝑑2+ 𝑑 1 i
Où : lse : limites supérieures exactes
D1 : différence entre l’effectif simple de la classe possédant le mode et
l’effectif simple immédiatement supérieur ;
x n
41-43 2
38- 40 4
35- 37 8
32- 34 10
29-31 12
26- 28 9
23-25 7
20-22 3
17-19 1
N= 56
29 – 31 : c’est la classe modale ; parce que on y trouve l’effectif simple
le plus élevé (=12)
les =31.5
D1= (12-9)=3
D2= (12-10)=2
i=3
appliquons la formule
𝑑2
MO = lse - i
𝑑2+ 𝑑 1
2
MO = 31.5 - 3= 30.3
3+2
Exercices d’application :
1) Une épreuve de comptabilité est soumise à 60élèves de 3ème année
secondaire, section commerciale. Le maximum possible est de 50 points, les
résultats obtenus sont suivants :
30 38 17 35 20 12 28 27 13 29 27 32 19 30 16 34 26 24 30 25 29 20 26 32
29 38 28 27 39 35 25 23 35 29 49 20 32 28 30 12 39 43 46 32 29 39 41 10
24 28 27 16 33 42 10 26 30 44 15
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 43
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
a) Grouper ces données en classes ;
2) Un chercheur fait une étude sur les salaires des agents d’une entreprise.
Il obtient les résultats suivants (en dollar) :
143 142 140 144 142 141 142 143 144 145 141 142 143 145 144 144 143
146 143 143 143 142 144 144 142 141 141 143
Calculer la moyenne arithmétique, harmonique, le mode brut, le mode
dérivé.
3) Calculer la moyenne arithmétique, harmonique, médian, mode brut des
données statiques suivantes : 7 17 15 10 22 19 1519 10 19 22 19
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 44
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
CHAPITRE III
MESURES DE DISPERSION
3.1 INTRODUCTION
Une mesure de la tendance centrale seule ne suffit pas pour
donner une information exhaustive sur la distribution à laquelle on a affaire.
En effet, ses données peuvent se concentrer différemment autour de la
moyenne selon le cas. Pour connaître comment les données sont dispersées
autour de la moyenne, il faut connaitre l’indice de dispersion qui donne des
informations supplémentaires à celles données par l’indice de la tendance de
centrale.
Autrement dit, un ensemble de données numériques tend
généralement à s’étaler autour de la moyenne, que l’on appelle « dispersion
ou étalement ou encore variabilité des données ».
Il existe plusieurs mesures de la dispersion ; les plus courant sont « l’étendu
de variation, l’écart moyen, l’espace semi-interquartile, l’espace interdécile, le
coefficient de variation, la variance et l’écart-type ». Pour le cas de notre
cours, nous nous limiterons aux deux dernières, à savoir la variance et
l’écart-type.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 45
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
3.2 NOTION DE DISPERSION
Nous représentons graphiquement deux distributions A et B :
0 10 20 30 40 50 60 70 80
la courbe A présente une grande disparité. les individus extrêmes (0 et
80) sont bien loin du centre (40).
La courbe B quant à elle, présente une grande homogénéité. Les
individus extrêmes (20 et 60) sont trop rapprochés du centre (40).
Ces deux courbes ont le même centre, c.à.d. la même moyenne (40) ,
mais une variabilité différente , c.à.d. une dispersion différente. Celle
de A est grande, tandis que celle B est petite.
3.3 VARIANCE ET L’ECART-TYPE :
3.3.1 Notion d’écart à la moyenne
Nous savons déjà que la notion de dispersion implique la notion d’écart.
Dans le premier chapitre, nous avons vu l’écart entre les notes extrêmes
d’une distribution des données (Xh -Xb). De même, nous avons vu l’écart
entre le point – milieu et la moyenne de la distribution que nous avons
symbolisé par x=xi – M
x=xi – M
Exemple : soient, les résultats suivants obtenus par 10 étudiants à un test :
18 16 16 15 14 13 11 9 9 8
18+16+16+15+14+13+11+9+9+8 129
M= = = 12.9
10 10
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 46
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
X X
18 +5,1
16 3,1 +14,6 (écarts positifs)
16 3,1
15 2,1
14 1,1
13 0,1
11 -1,9
-14,6(écarts négatifs)
9 -3,9
9 -3,9
8 -4,9
Ces écarts positifs et négatifs sont une estimation de la place qu’occupe
chaque note par rapport à la moyenne.
Nous avons ainsi une idée complète de la dispersion. le but est de trouver
un indice ou une mesure qui synthétise ces informations.
Donc, un indice de dispersion est un nombre qui mesure la dispersion
des valeurs observées autour d’un paramètre de la tendance centrale telle
que la moyenne, la médiane et le mode. il s’exprime dans la même unité
que les observations et permet de comparer des séries statistiques de
même nature.
3.3.2 Définition
C’est sur les écarts au carré que se fonde la variance. C’est la mesure la plus
valable de dispersion des résultats, qu’on peut définir comme « la moyenne
des carrés des écarts ». Symbolisée par SD2 ou S2 ou σ 2 (sigma carré).SD2 et
s2 désignent souvent les variances des échantillons et σ2 désigne la variance
des populations des données.
N.B. Il faut retenir que toutes les formules utilisées pour calculer une
variance, sont identiques à celles de l’écart-type, la différence réside au
niveau de la racine carré qu’on ajoute sur la formule de la variance pour
trouver l’écart-type.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 47
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
3.3.3 CALCUL DE LA VARIANCE ET DE L’ECART-TYPE :
a) Cas des données non groupées en classes :
cas d’une série simple des données :
Dans ce cas, on peut utiliser deux formules pour arriver aux mêmes
résultats ou réponses :
Soit, l’ensemble des données dans une série : 10 5 4 4 3 2 7
1) Formule des carrées des écarts à la moyenne :
X 𝑥 =(X-M) 𝑥 2 =(X-M)2
10 +5 25
7 +2 4
5 0 0
4 -1 1
4 -1 1
3 -2 4
2 -3 9
∑𝑋 = 35 ∑ 𝑥 2 =44
∑𝑋 35
Calcule la moyenne arithmétique : M= 𝑁 = 7 =5
Calcul des écarts par rapport à la moyenne : 𝑥 =X-M
Elever au carré ces écarts à la moyenne : 𝑥 2 ou (X-M)2
Faire la sommation des 𝑥 2 (=44)
Diviser cette somme par l’effectif total de la distribution (N),
on obtient la variance de la distribution. σ2
∑𝑥2 44
= = 7 =6.285=6.3
𝑁
Calcul de l’écart-type : O=√σ2 =√6.3
= 2,509980079602227=2.5
2) Formule des résultats bruts :
X X2
10 100
7 49
5 25
4 16
4 16
3 9
2 4
∑𝑋 = 35 ∑X2 =219
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 48
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
(35)2
219= 219−175 44
σ = 2 7
= = = 6.2857 ≈ 6.3
7 7 7
σ= 2
√6 = √6.3 = 2.5
Cas d’un tableau des effectifs :
Ex : Soit l’ensemble des résultats suivants :
X n 𝒏𝑿 𝒙 𝒙𝟐 𝒏𝒙𝟐
3 2 6 -5 25 50
4 3 12 -4 16 48
5 7 35 -3 9 63
6 17 102 -2 4 68
9 25 225 +1 1 25
10 12 120 +2 4 48
11 6 66 +3 9 54
13 2 26 +5 25 50
𝑁 = 74 ∑𝒏𝑿 = 𝟓𝟗𝟐 ∑𝒏𝒙𝟐 = 𝟒𝟎𝟔
∑𝑛𝑋 592
Calcul de la moyenne arithmétique pondérée : M = = =8
𝑁 74
Calcul des écarts par rapport à la moyenne : 𝑥 = 𝑋 − 𝑀
Elever au carré les 𝑥 2
Multiplier chaque 𝑥 2 par son effectif correspondant n, puis faire la
somme :∑𝑛𝑥 2 =406
∑𝑛𝑥 2 406
Calcul de la variance :σ2 = = 5.49
𝑁 74
∑𝑛𝑥 406 2
Calcul de l’écart −𝑡𝑦𝑝𝑒 : σ√ 𝑁 = √ 74 = √5.49 = 2.34
Cas des données groupées en classes :
Soit, le temps de création à un stimulus auditif d’une intensité donnée qui a
été enregistré en millisecondes sur 50 étudiants de bac1 SCAD de l’ISP
Kalemie par un psychologue.
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 49
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
X n
195-199 1
190-194 2
185-189 4
180-184 5
175-179 8
170-174 10
165-169 6
160-164 4
155-159 4
150-154 2
145-149 3
140-144 1
N=50
Pour les données groupées en classes, le calcul de la variance se fait par la
formule des carrés des écarts à la moyenne.
La formule des carrés des écarts à la moyenne :
Calcul des points-milieux de la classe (Xi) ;
∑𝑛𝑥𝑖
Calcul de la moyenne arithmétique de la distribution :𝑀 = ;
𝑁
Calcul des écarts par rapport à la moyenne :𝑥 = 𝑋 − 𝑀 ;
Elever au carré ces écarts à la moyenne par son effectif
correspondant :n𝑥 2 . Puis faire la sommation : ∑𝑛𝑥 2 ;
∑𝑛𝑥 2
Calcul de l’écart− 𝑡𝑦𝑝𝑒: σ = √
𝑁
X n Xi 𝑛𝑥i 𝑥(𝑋𝑖 − 𝑀) 𝑥2 𝑛𝑥 2
195-199 1 197 197 26 676 676
190-194 2 192 384 21 441 882
185-189 4 187 748 16 256 1024
180-184 5 182 910 11 121 605
175-179 8 177 1416 6 36 288
170-174 10 172 1720 1 1 10
165-169 6 167 1002 -4 16 96
160-164 4 162 648 -9 81 324
155-159 4 157 628 -14 196 784
150-154 2 152 304 -19 361 722
145-149 3 147 441 -24 576 1728
140-144 1 142 142 -29 841 841
𝑁 = 50 ∑𝒏𝑿i= ∑𝒏𝒙𝟐
8540 = 𝟕𝟗𝟖𝟎
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 50
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
∑ 𝑛𝑋𝑖 8540
M= = = 170.8 = 171
𝑁 50
∑ 𝑛𝑋𝑖 7980
𝜎2 = = = 159.6
𝑁 50
∑ 𝑛𝑋2 7980
𝜎=√ =√ = √159.6 = 12.6
𝑁 50
3.3.3. Propriété et usage de l’écart-type :
a) Propriété de l’écart-type :
Par convention, l’écart-type est toujours positif ;
l’écart-type est exprimé dans la même unité que les valeurs de la
variable ;
il s’en suit qu’on ne peut pas comparer des écart-types des séries de
données de natures différentes ;
à titre indicatif, on peut dire souvent que la dispersion est :
- faible, si l’écart-type est inférieur à 15% de la moyenne
- forte, s’il est supérieur à 30% de la moyenne
- modérée ou moyenne, si elle se situe entre 15% et 30% de la
moyenne.
Comme la variance, l’écart-type est une variable intensive, c.-à-d. qu’il
ne dépend pas de la taille des groupes : si deux groupes de données de
même nature ont exactement la même dispersion, ils ont le même
écart-type, même si les nombres de données diffèrent d’un groupe à
l’autre.
b) Usage de l’écart –type :
On l’utilise dans les mêmes conditions que la variance ;
Il est utilisé de préférence à la variance quand il s’agit seulement de
décrire une distribution .par contre, la variance intervient surtout dans
l’analyse statistique ;
C’est la mesure de dispersion qui occupe une place centrale dans la
théorie statistique. Il présente l’avantage d’être exprimé dans la même
unité que les données de la variable : ses dimensions sont égales au carré
des dimensions des données ;
Sa faible valeur indique une accumulation ou concentration forte autour
de la moyenne et sa valeur grande, indique un étalement ou dispersion
très considérable autour de la moyenne ;
La variance et l’écart-type accompagnent la moyenne lorsque la
distribution est symétrique ou normal ;
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 51
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
Exercices d’application :
1) voici une distribution des données statistiques, Calculer la moyenne
arithmétique et la variance.
x n
90- 92 1
87-89 1
84-86 1
81-83 4
78-80 2
75-77 2
72-74 2
69-71 6
66-68 8
63-65 5
60-62 1
57-59 3
54-56 1
2) Voici les résultats de 90 étudiants de G1 SCA au cours de comptabilité :
82 74 81 67 75 62 73 62 94 78 67 79 77 68 86 71 69 73 50 83 73 76 95 74
93 60 65 75 87 76 54 71 61 63 76 78 60 72 60 72 97 74 62 60 85 79 60 79
78 88 75 88 80 75 89 65 62 65 65 96 61 90 75 88 72 71 84 90 76 78 66 93
68 73 77 76 68 75 95 80 70 90 58 75 59 63 57 85 83 82 85 78
a) Grouper ces données en classes ;
b) Calculer :
1°) le résultat moyen de l’auditoire en comptabilité ;
2°) le résultat médian de l’auditoire en comptabilité ;
3°) le résultat modal de l’auditoire en comptabilité ;
4°) le mode brut de l’auditoire ;
5°) l’écart-type de l’auditoire ;
3) soient, les données suivantes :
45 65 55 41 65 54 74 70 82 84 91 85 84 75 75 55 64 45 72 75 87 86 93 87
82 98 87 80 79 79 50 63 47 58 50 44 42 52 54 62 89 64 59 43 41 44 60 71
61 51 74 70 82 74 93 75 75 84 76 75 60 85 71 76 83 65 74 42 65 73 61 48
48 45 487
a) Grouper les données en classes ;
b) Calculer :
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 52
Interdiction formelle de photocopier ce syllabus sans l’accord de son auteur.
1) Moyenne arithmétique
2) La médiane ;
3) Le mode brut et mode dérivé ;
4) La variance et l’écart-type
4) une épreuve de comptabilité est soumise à 60 élevés de troisième
secondaire, section commerciale. Le maximum possible est 50 points. Les
résultats obtenus sont :
30 38 17 35 20 12 28 27 13 29 27 32 19 30 16 34 26 24 30 26 32 29 38 28
27 39 35 25 23 35 29 49 20 32 28 30 12 25 20 29 39 43 46 32 29 39 42 10
24 28 27 16 33 4242 10 26 30 44 15
a) Grouper ces données en classes ;
b) Calculer les trois indices centraux ;
4) soit, une distribution suivant (les poids des malade souffrant de
kwashiorkor) :
47 37 50 34 36 34 29 31 37 34 28 46 49 48 45 45 30 29 28 44 44 40 41 45
48 49 28 29 30 33 32 31 30 35 36 37 38 37 39 40
a) Combien de patients ont le poids :
1) Supérieur à 47 kg ?
2) Inférieur ou égal à 30kg ?
3) Inférieur à 36 kg ?
4) Supérieur ou égal à 48 kg ?
b) Quel est le pourcentage de patient dont le poids est :
1) Inferieur à 45kg ?
2) Inferieur à 37kg ?
3) Supérieur à 25kg ?
c) Quelle est la promotion de patients dont le poids est :
1) Inferieur à 43kg ?
2) Inferieur à ou égal à 50 kg?
Cours de statistique descriptive dispensé par Ass2. REMY BYEMBA/ISP-KALEMIE/2024-2025 Page 53