UNIVERSITE MAPON
FACULTE POLYTECHNIQUE
BSc II TS
COURS DE PROBABILITES ET STATISTIQUES
Pr. Dr. Ir J. KALENGA
March 9, 2021
Content
1
Introduction
Volume Horaire
Disposition
Méthodes d’enseignement et d’apprentissage
Méthodes d’Evaluation
Objectif généraux
Objectifs spécifiques
CONTENU DU COURS
CHAPITRE [Link] ET EXPOSTION DES DONNEES
POPULATION ET ECHANTILLON
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
Introduction
Volume Horaire 2
Volume horaire:
I THÉORIE : 30 HEURES
I TRAVAUX PRATIQUES (TP) : 20 HEURES
I TRAVAUX DIRIGÉS (TD) : 15 HEURES
I TRAVAUX PRATIQUES ENCADRÉS (TPE) : 10 HEURES
I TOTAL : 75 HEURES
I CRÉDITS : 3
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
Introduction
Disposition
3
Disposition:
I Prérequis : Ce cours nécessite une connaissance préalable des
mathématiques.
I Attitude à tenir: régularité et ponctualité
I TD chaque matin sur la matière de la fois passée
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
Introduction
Méthodes d’enseignement et d’apprentissage
4
Disposition:
I Le cours théorique est exposé ex cathedra en utilisant un vidéo
projecteur.
I Les notes (syllabus) et les diapositives sont mises à la
disposition des étudiants.
I Le cours théorique est accompagné des exercices d’application
(dans l’auditoire).
I Les exercices d’application seront implementé en Excel et
d’autres logiciels d’analyse de données.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
Introduction
Méthodes d’Evaluation 5
Méthodes d’Evaluation:
I Epreuve écrite : Questions théoriques et /ou exercices
numériques avec ou sans notes
Pondération des évaluations :
I Interrogations : 50%
I TD et TP : 50%
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
Introduction
Objectif généraux
6
Parmi les objectifs généraux du cours on peut citer principalement ce
qui suit :
I Lire avec un œil critique l’information chiffrée ;
I Comprendre et mener correctement des expériences, des
enquêtes et des travaux de recherche.
I Interpréter les résultats d’analyse statistique
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
Introduction
Objectifs spécifiques
7
A l’issue de ce cours l’étudiant doit être capable de :
I mener des enquêtes sur terrain par des sondages ou des
recensements ;
I délimiter une population selon ses caractéristiques ou variables
statistiques ;
I déterminer avec précision l’échantillon utilisé dans une étude ;
I faire correctement l’échantillonnage par des méthodes
indiquées ;
I récolter des données brutes sur terrain ;
I traiter les données brutes ;
I regrouper, synthétiser, classifier ces données ;
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
Introduction
Objectifs spécifiques
8
I présenter clairement les données traitées ;
I tracer les histogrammes et autres courbes de distribution
statistique ;
I analyser et interpréter les résultats ;
I comparer avec des modèles théoriques ;
I faire des prévisions ;
I prendre des décisions éclairées.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
Introduction
CONTENU DU COURS 9
PREMIERE PARTIE : STATISTIQUE DESCRIPTIVE
I Chapitre 1 Regroupement et exposition des données
I Chapitre 2 Mesures de tendance centrale et mesures de position
I Chapitre 3 Mesures de dispersion et mesures de forme
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
Introduction
CONTENU DU COURS 10
DEUXIEME PARTIE: PROBABILITE
I Chapitre 5 Théorie de probabilité
I Chapitre 6 Lois de probabilité
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
Introduction
CONTENU DU COURS 11
TROISIEME PARTIE: STATISTIQUE INFERENTIELLE
I Chapitre 7 Echantillonnage
I Chapitre 8 Estimation
I Chapitre 9 Test d’hypothèses
I Chapitre 10 Etude de deux variables statistiques
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
Introduction
BIBLIOGRAPHIE 12
I Dodge Y., (2003) - Premiers pas en statistique, Springer
Droesbeke J.-J. (1997) - Eléments de statistique, Université Libre
de Bruxelles
Ouellet G., (1998) - Statistiques et Probabilités, Mathématiques
au collégial, Edition Le Griffon d’argile, 481 pages.
Pirlot M., (2008) - Cours de Statistique, Faculté Polytechnique de
Mons, 109 p.
Yves Tillé, (2010) - Résumé du cours de Statistique Descriptive,
Université de Neuchatel, 172p.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
PREMIERE PARTIE : STATISTIQUE DESCRIPTIVE
CHAPITRE [Link] ET EXPOSITION DES DONNEES
[Link] ET ECHANTILLON
13
I En statistiques, on utilise le mot population dans son sens le plus
large;
On appelle population, tout ensemble sur lequel porte une étude
statistique;
Les éléments d’un tel ensemble s’appellent des individus ou unités
statistiques;
Il faut bien comprendre qu’une population peut être formée de
personnes, d’animaux, d’objets et même de faits. On dit aussi
que N est la taille de la population;
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
[Link] ET ECHANTILLON
14
I Lorsqu’une étude statistique porte sur une population très grande
ou difficilement accessible dans sa totalité, on choisira plutôt de
procéder à l’étude sur un échantillon.
On appelle échantillon, tout sous-ensemble de la population. On
dit aussi que n est la taille de l’échantillon.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
II. VARIABLES STATISTIQUES
15
I Une variable statistique un attribut ou une caractéristique que
possède chacun des individus observés.
Les différents états ou les différentes valeurs que peut prendre
une variable statistique s’appellent les modalités ou valeurs de
cette variable statistique.
On notera une variable statistique par une lettre majuscule X
(ou Y , ...) et ses modalités par la même lettre minuscule affec-
tée d’indices : x1 x2 , ...(ouyl , y2 , ...).
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
II. VARIABLES STATISTIQUES
16
Exemple: Un restaurant désire faire une enquête auprès de sa clien-
tèle. On décide donc qu’à chaque client qui viendra la semaine suiv-
ante, on lui demandera de remplir une petite carte où celui-ci indiquera
son sexe, son degré de satisfaction, son heure d’arrivée, le nombre de
personnes qui l’accompagnent et le montant de l’addition. Indiquer
quelle est la population concernée et l’échantillon choisi, quelles sont
les variables statistiques étudiées et quelles seraient les modalités ou
valeurs de celles-ci.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
II. VARIABLES STATISTIQUES
17
Solution:
Population : Ensemble des clients du restaurant.
Échantillon : Ensemble des clients qui viendront au restaurant au
cours de la semaine suivante.
Variables statistiques :
I X : sexe
I Y : degré de satisfaction
I T : heure d’arrivée
I V : ne nombre de personnes qui accompagnent le client
I W : montant de l’addition
Modalités des variables statistiques:
I Pour X : masculin, féminin
I Pour Y : très insatisfait, insatisfait, satisfait, très satisfait
I Pour T : [0, 24]
I Pour V : 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou plus
I Pour W : [0, 200]
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
II. TYPES DE VARIABLES STATISTIQUES
18
On distingue deux catégories de variables : Quantitatives et
qualitatives
I Variables quantitatives : variables qui s’expriment sous forme
numérique;
Nominale:Sexe, Etat matrimonial, couleurs des yeux
Ordinale:Mention au bac, Nveau d’etudes, seuil de gravité d’une
maladie
Discrete:Nombre d’enfant, Nombre de jours de congés
Continue: Age, Continue, Temperature
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
ÉTUDE D’UNE VARIABLE STATISTIQUE QUALITATIVE:Distribution d’une variable
statistique X 19
I Supposons que l’on fait une étude d’une variable statistique qual-
itative X dans une population formée de N individus ou dans un
échantillon formé de n individus;
L’ensemble des modalités de X est le suivant :x1 , x2 , ·, xi , ·, xk
Il est clair que k, le nombre de modalités différentes, ne peut pas
être supérieur à N ou à n.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Distribution d’une variable statistique X
20
Exemple 2: Soit l’étude de l’état civil des 40 employés de la compag-
nie SOLID. Ainsi, N = 40, et X représente la variable statistique qualita-
tive ou caractère : « état civil des employés de la compagnie SOLID».
Admettons pour le caractère X les modalités suivantes : Marié(e), céli-
bataire, divorcé(e), veuf (ve), religieux (se) L’étape suivante consiste
à recueillir l’information désirée ; dans le cas présent, l’état civil de
chacun des employés de la compagnie SOLID. Les premières infor-
mations ainsi recueillies forment ce qu’on appelle les données brutes.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Distribution d’une variable statistique X
21
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Distribution d’une variable statistique X
22
I Cependant, ces données brutes sont difficilement utilisables et
très difficiles à interpréter. On devra donc sacrifier le caractère
individuel de l’information pour obtenir un portrait d’ensemble de
l’état civil de la population concernée.
I Il faut donc condenser l’information pour en faire une
présentation aussi simple que possible.
I Pour chaque modalité xi, on calcule le nombre d’individus ayant
cette modalité en procédant ainsi : on dresse la liste de toutes
les modalités.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Distribution d’une variable statistique X
23
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Distribution d’une variable statistique X
24
I Lorsqu’on a complété ce dénombrement du tableau des
données brutes on obtient, en regard de chacune des modalités
xi le nombre d’individus associés à cette modalité ;
I on note ce nombre par ni et on l’appelle la fréquence absolue ou
effectif de xi . On a :
I 20 individus mariés
I 11 individus célibataires
I 6 individus divorcés
I 2 individus veufs
I 1 individu religieux
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Distribution d’une variable statistique X
25
I Ainsi, à chaque modalité xi on peut associer un effectif nt . L’ensemble
des couples (xi , ni ) est une fonction (au sens mathématique du
terme) que l’on nomme distribution de fréquences ou simplement
distribution de X : (Marié, 20), (Célibataire, 11), (Divorcé, 6), (Veuf,
2), (Religieux, 1)
Un tel ensemble de données est aussi appelé une série statis-
tique simple, c’est-à-dire ne concernant qu’une seule variable
statistique.
Une distribution de fréquences sera généralement donnée sous
forme de tableau. Lorsqu’il n’y a qu’une seule variable statistique
étudiée, on dit qu’il s’agit d’un tableau à une entrée ou tableau
à une dimension.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Distribution d’une variable statistique X
26
I La somme des effectifs est toujours égale au nombre d’individus
dans la population, ce que l’on note par :
X
ni = N
(Lire : « la somme des n¡ est égale à N »)
I Naturellement, dans le cas où on travaille sur un échantillon, on
a: X
ni = n
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Distribution d’une variable statistique X
27
Distribution de fréquences de l’état civil des employés de la
compagnie SOLID
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences relatives et taux
28
I Lorsqu’on considère un nombre en soi, par lui-même, sans
aucune base de comparaison, on dit qu’il s’agit d’un nombre
absolu.
I Il faut une base de comparaison, c’est-à-dire un autre nombre
auquel ce nombre sera comparé. En statistique, on compare
deux nombres en faisant la division de ceux-ci. On définit le
rapport ou le ratio de deux modalités xi et xj par :
ni
nj
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences relatives et taux
29
Par exemple :
I rapport( celibataire
mariee ) =
11
20 = 0.55
I C’est-à-dire qu’il y a 0,55 célibataire pour chaque personne
mariée ou, si on multiplie par 100, il y a 55 célibataires pour 100
personnes mariées dans cette population.
I Pour avoir une base de comparaison commune, il semble naturel
de comparer chacun des effectifs au nombre total d’individus.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences relatives et taux
30
On définit la fréquence relative ou proportion d’une modalité xi par :
I fi = nNi pour la population
I fi = ni
n pour l’echantillon
Par exemple :
Proportion de célibataires =11/40=0,275
On appelle pourcentage d’une modalité xi le nombre fi x100.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences relatives et taux
31
Distribution de l’état civil des employés de la compagnie SOLID
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences relatives et taux
32
I La modalité à laquelle est associée la plus forte fréquence relative
s’appelle le mode de la distribution.
La somme des fréquences relatives est toujours égale à 1.
fi = 1
N.B : En pratique, on limite la précision des fréquences relatives à
trois chiffres après la virgule décimale, quitte à arrondir le dernier
chiffre. Il y a d’autres types de comparaisons qui peuvent s’avérer
très utiles.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences relatives et taux
33
I Supposons que l’on veuille savoir si le divorce est un phénomène
d’importance dans la population étudiée. Il s’avère alors plus juste
de comparer cet effectif au nombre d’individus exposés à divorcer.
Cette fraction s’appelle le taux de divorce.
nombre de divorcés
taux de divorce = (1)
nombre de divorcés+nombre de mariés
6
= = 0.231 (2)
20 + 6
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences relatives et taux
34
En général, on définit le taux d’une modalité ou le taux d’un
événement par :
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Présentation graphique
35
I Toute l’information chiffrée que l’on possède se trouve dans le
tableau de distribution de fréquences.
I Il est cependant bien utile d’illustrer cette information en
représentant graphiquement la distribution de fréquences d’un
caractère.
I Une telle représentation graphique peut se faire par un
diagramme en colonnes (ou en rectangles, ou en tuyaux
d’orgue), par un diagramme à secteurs (ou diagramme
circulaire), ou par un diagramme figuratif (ou pictogramme).
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Présentation graphique
36
Diagramme en colonne:Distribution de fréquences de l’état civil des
employés de la compagnie SOLID
Figure: Diagramme en colonne
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Présentation graphique
37
Diagramme à secteurs
I Dans un diagramme à secteurs, on utilise un cercle que l’on
subdivise en autant de secteurs qu’il y a de modalités et où l’aire
de chacun de ces secteurs est proportionnelle au pourcentage
de la modalité correspondante.
I L’angle au centre pour chacun des secteurs est de fi x 360
degrés.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Présentation graphique
38
Diagramme figuratif ou pictogramme
I Dans un diagramme figuratif ou pictogramme, on utilise diverses
illustrations ou images pour donner une synthèse visuelle de la
distribution de fréquences.
Figure: Diagramme figuratif
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Présentation graphique
39
Exemple:
Dans un sondage réalisé auprès d’un échantillon de 450 personnes
âgées de 18 ans et plus et demeurant dans la région métropolitaine
de Québec, on a demandé si on croyait qu’il y a beaucoup de gens
mariés ou en union libre qui ne se séparent pas à cause des enfants.
131 personnes ont répondu « beaucoup », 249 « un peu », 43 de ce
nombre, « pas du tout » et 27 « ne peut pas préciser ». (Source :
Le Soleil, dimanche 11 septembre 1988.) Indiquer la population, la
variable concernée et le type d’échelle de mesure utilisée. Construire
un tableau de distribution de fréquences en y incluant une colonne de
fréquences relatives. Trouver le mode de la distribution. Représenter
graphiquement cette distribution par un diagramme en colonnes.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Présentation graphique
40
Solution :
I Population : Ensemble des personnes âgées de 18 ans et plus et
demeurant dans la région métropolitaine de Québec. L’échantillon
est extrait de cette population.
Variable : Opinion sur l’importance du nombre de gens mariés
ou en union libre qui ne se séparent pas à cause des enfants.
Échelle de mesure : C’est une variable statistique qualitative et
les réponses suggérées indiquent une échelle
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Présentation graphique
41
Solution :
I Distribution des gens de 18 ans et plus demeurant dans la région
métropolitaine de Québec selon leur opinion sur l’importance du
nombre de personnes mariées ou en union libre qui ne se sépar-
ent pas à cause des enfants
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Présentation graphique
42
Solution :
I Le mode de cette distribution est « un peu », ce qui permet de dire
qu’en général les gens concernés croient qu’il y aurait un peu plus
de séparations sans la présence des enfants dans un couple.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
43
Variable discrète ou continue :
I Une variable statistique quantitative est dite discrète si les valeurs
que peut prendre cette variable sont des valeurs isolées, générale-
ment entières.
Exemple 1 : Le nombre d’enfants d’une personne, le nombre
d’employés d’une usine, le nombre de votes recueillis par un député
sont des variables discrètes puisque les valeurs possibles de ces
entiers isolés les uns des autres.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
44
Variable discrète ou continue :
I Une variable statistique quantitative est dite continue si l’ensemble
des valeurs qu’elle peut prendre est un intervalle de l’ensemble
des nombres réels.
Exemple 2 : La température du corps humain est une variable
statistique continue puisque, a priori, si on la mesure en degrés
Celsius, elle peut prendre n’importe quelle valeur réelle dans l’intervalle
[36,42]. En général, les variables concernant les longueurs, les
surfaces, le temps, l’espace, la masse sont des variables contin-
ues.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
45
Ce n’est pas tant la nature de l’ensemble des valeurs d’une variable
statistique quantitative que le nombre de ses valeurs qui nous servira
de critère pour distinguer les diverses situations. On distingue trois
cas :
I les données rangées,
I les données condensées,
I les données regroupées en classes.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
46
Données rangées
I Le nombre N d’individus dans la population est petit (on
considère petit : N < 20).
I Exemple 1 : Carole vient de s’acheter un terrain et elle a noté,
en mètres, la hauteur des arbres sur ce terrain ; elle obtient les
données brutes suivantes :
12 11 14 7 9 4 21 11 8
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
47
Solution :
I On a : 4 7 8 9 11 11 12 14 21
- On appelle série chronologique ou série temporelle ou chronique,
un ensemble de valeurs d’une variable statiques quantitative ob-
servées dans le temps, habituellement à intervalle égaux.
- Pour une série chronologique, il est inutile de construire un tableau
de distribution de fréquences.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
48
Exemple 2 : Un journaliste sportif étudie la carrière du légendaire
joueur de hockey Maurice Richard. Il relève, notamment, le nombre de
buts marqués par le « Rocket » au cours de chacune des 18 saisons
jouées par celui-ci de 1942-1943 à 1959 -1960. On a, dans l’ordre :
5, 32, 50, 27, 45, 28, 20, 43, 42, 27, 28, 37, 38, 38, 33, 15, 17, 19.
Représenter graphiquement cette série chronologique.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
49
Solution :
Cette représentation graphique donne un effet visuel de la variation
de la variable « Nombre des buts marqués par saison ».
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
50
B.3. Données condensées
I Le nombre k de valeurs différentes de la variable est petit par
rapport à N ou n (N ou n > 20).
Exemple:
Déterminer la population et la variable. Construire un tableau de
distribution de fréquences incluant les fréquences relatives et les
pourcentages. Construire un diagramme en bâtons.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
51
Solution :
- La population, c’est l’ensemble des ménages de la région d’Ottawa-
Hull et on a prélevé un échantillon de 60 d’entre eux.
- La variable, que l’on note par X, c’est le nombre d’enfants dans
un ménage ; c’est une variable statistique quantitative discrète.
- De plus, le nombre de valeurs différentes (k = 8) est petit com-
parativement à la taille de l’échantillon (n = 60).
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
52
Distribution des ménages de la région d’Ottawa-Hull selon le nombre
d’enfants dans le ménage
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
53
Il faut noter que, lorsqu’on choisit de porter sur l’un des axes les
fréquences relatives en lieu et place des effectifs, le diagramme
garde le même profil.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
54
B.4. Données groupées en classes
I Le nombre k de valeurs différentes de la variable est grand avec
N ou n > 20. C’est sans doute le cas le plus fréquent.
I Une classe est un intervalle semi-ouvert que l’on notera
[bi − 1, bi [ où bi − 1 s’appelle la borne inférieure de cette ie
classe etbi la borne supérieure. Une valeur xi appartient à la
classe [bi − 1, bi [ si cette valeur a: ,- est supérieure ou égale à
bi-1 et inférieure à bi , ce qu’on exprime par:
bi−1 ≤ xi ≤ bi
On appelle milieu ou centre de la ie classe et on note par mi le
nombre suivant :
bi−1 + bi
mi =
2
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
55
On appelle largeur ou amplitude de la ie classe et on note par Li le
nombre suivant:
bi = bi − bi−1
I Lorsque le regroupement en classes est complété, on étudie la
variable statistique quantitative de la même manière qu’une
variable statistique qualitative.
I On construit un tableau de distribution de fréquences en
remplaçant la colonne des modalités par la colonne des classes
et en ajoutant la colonne mi des milieux de classes ;
I ce nombre mi deviendra la valeur représentant toutes les
données d’une même classe. On omet la colonne des
pourcentages pour conserver la colonne des fréquences
relatives.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
56
Exemple 1 : Aux Jeux intercollégiaux d’un pays d’Europe, au cours
d’examens de contrôle, on a noté la taille en centimètres de tous les
athlètes masculins participant à l’épreuve du saut en hauteur. Voici
les données brutes rangées dans un ordre ascendant :
Déterminer la population et la variable étudiée. Construire un tableau
de distribution de fréquence.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
57
Solution :
I La population est l’ensemble de tous les athlètes masculins
ayant participé à l’épreuve du saut en hauteur lors des Jeux
intercollégiaux d’un pays d’Europe.
I La variable statistique étudiée est la taille mesurée en
centimètres. Notons cette variable par X.
I L’étendue de la variable X est :
204, 8 − 171, 1 = 33, 7
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
B.ÉTUDE D’UNE VARIABLE STATISTIQUE QUANTITATIVE
58
Solution :
I Avec 55 données, il n’y a pas lieu de choisir un trop grand
nombre de classes ;
I un bon choix consisterait à choisir 7 classes de largeur 5 en
fixant la borne inférieure à 170 et la borne supérieure à 205.
I Bien sûr, un autre choix pourrait être fait et s’avérerait aussi
correct. Voici le tableau de distribution de fréquences de X.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Histogramme et polygone de fréquences
59
I Pour représenter graphiquement une distribution de fréquences
lorsque les données ont été regroupées en classes, on utilise
deux types de graphiques : l’histogramme et le polygone de
fréquences.
I L’histogramme est un diagramme en colonnes où les rectangles
sont juxtaposés. En effet, les modalités sont ici remplacées par
des classes et ces classes sont formées d’intervalles successifs
de sorte qu’il n’y a plus lieu maintenant de séparer ces
rectangles.
I Le polygone de fréquences est une ligne obtenue en joignant les
points milieux consécutifs des sommets des rectangles de
l’histogramme.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Histogramme et polygone de fréquences
60
Exemple : Tracer l’histogramme et le polygone de fréquences de la
distribution de l’exemple 1 du point I.4.4
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Histogramme et polygone de fréquences
61
Pour faciliter le tracé du polygone de fréquences, esquissons en
pointillé les rectangles de l’histogramme.
Le polygone de fréquences présente certains avantages par rapport
à l’histogramme pour faire l’étude d’une distribution de fréquences,
du fait qu’il est simple à visualiser et plus approprié pour faire des
comparaisons.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Histogramme et polygone de fréquences
62
Exemple : Lors d’une enquête sur les chauffeurs de taxi de la région
de Montréal, on a prélevé un échantillon de 52 chauffeurs et on leur
a demandé leur kilométrage pour la journée d’hier. Voici les données
brutes :
Déterminer la population et la variable. Construire un tableau de distri-
bution de fréquences, un histogramme et un polygone de fréquences.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Histogramme et polygone de fréquences
63
I La population est l’ensemble des chauffeurs de taxi de la région
de Montréal ; on a prélevé un échantillon de 52 de ces chauffeurs
et la variable étudiée X est le kilométrage de la journée d’hier.
I C’est une variable statistique quantitative continue. On a 52
données toutes différentes, la plus petite étant 68,7 et la plus
grande 546,1.
I Pour regrouper en classes, on considère d’abord l’étendue de la
variable X, Soit : 546,1 - 68,7 = 477,4. Supposons que l’on
choisisse 5 classes de largeur 100 en prenant 50 comme borne
inférieure de la première classe.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Histogramme et polygone de fréquences
64
On aurait alors :
On remarque qu’il y a ainsi deux classes avec des effectifs
relativement grands comparativement aux autres classes. Cela
détaille certes moins bien la distribution de la variable X
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Histogramme et polygone de fréquences
65
I Cette manière de regrouper en classes révèle beaucoup mieux
la distribution de X. Cependant, on a alors deux classes
d’effectifs nuls avant la dernière classe d’effectif 1.
I Généralement, on n’admet pas de classe à effectif nul ;
I on termine alors la distribution avec une seule classe de largeur
150, soit la classe [400, 550[, de manière à récupérer la dernière
donnée qui est vraiment éloignée des autres données.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Histogramme et polygone de fréquences
66
Voici le tableau de distribution de fréquences de X :
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Histogramme et polygone de fréquences
67
* Dans le tracé de l’histogramme, il faut porter une attention parti-
culière au dernier rectangle, c’est-à-dire celui qui correspond à la
classe [400, 550[.
* Pour ce rectangle, ayant une base trois fois plus grande que
celle des autres, il faudra diviser sa hauteur (donc, la mesure de
l’effectif) par 3 pour respecter le principe de proportionnalité.
* Ce dernier rectangle aura pour base l’intervalle [400, 550 [et pour
hauteur 1/3.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Histogramme et polygone de fréquences
68
Distribution des chauffeurs de taxi de la région de Montréal selon leur
kilométrage pour la journée d’hier
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Histogramme et polygone de fréquences
69
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Histogramme et polygone de fréquences
70
Pour tracer le polygone de fréquences, on procède selon la même
technique où on considère le dernier rectangle comme étant formé
de trois rectangles de largeur 50.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences cumulées et ogive
71
* Dans le cas d’une variable statistique quantitative, on ajoutera au
tableau de distribution de fréquences une colonne des effectifs
cumulés ou des fréquences relatives cumulées.
* L’effectif cumulé d’une modalité, ou d’une classe, est formé de
la somme des effectifs de cette modalité, ou de cette classe, et
de ceux de toutes les autres modalités, ou classes, qui sont in-
férieures.
* Pour faciliter la comparaison de plusieurs distributions et de cer-
tains calculs dans les chapitres à venir, on choisit plutôt d’inclure
aux tableaux de distribution de fréquences la colonne des fréquences
relatives cumulées. On note les fréquences relatives cumulées
par Fi .
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences cumulées et ogive
72
* Pour représenter graphiquement la distribution des fréquences
relatives cumulées, on note, sur l’axe horizontal, les valeurs de
la variable et sur l’axe vertical, les fréquences relatives cumulées.
* Une telle courbe de fréquences relatives cumulées s’appelle une
ogive.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences cumulées et ogive
73
Exemple : À partir des données de l’exemple précèdent, refaire le
tableau de distribution de fréquences en y ajoutant une colonne des
fréquences relatives cumulées. Construire l’ogive. Trouver la propor-
tion de chauffeurs ayant un kilométrage de moins de 300 km. Trouver
la proportion de chauffeurs ayant un kilométrage de plus de 350 km.
Trouver la proportion de chauffeurs ayant un kilométrage entre 200 et
300 km.
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences cumulées et ogive
74
Solution
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences cumulées et ogive
75
* Pour trouver les proportions, on utilise la colonne des fréquences
relatives ou celle des fréquences relatives cumulées.
* Ainsi, pour trouver la proportion des chauffeurs ayant un kilomé-
trage de moins de 300 km, on peut additionner toutes les fréquences
relatives des classes inférieures à celle commençant à 300 km,
c’est-à-dire :
0, 038 + 0, 096 + 0, 135 + 0, 212 + 0, 250 = 0, 731
* ou encore, trouver le résultat directement dans la colonne des
fréquences relatives cumulées à la ligne correspondant à la classe
se terminant à 300 km.
* Pour trouver la proportion des chauffeurs ayant un kilométrage
de plus de 350 km, on peut additionner les fréquences relatives
de toutes les classes supérieures à celle se terminant à 350 km,
c’est-à-dire :
0, 077 + 0, 019 = 0, 096
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences cumulées et ogive
76
* ou encore, trouver le résultat en soustrayant de 1,000 la fréquence
relative cumulée à la ligne correspondant à la classe se terminant
à 350 km, soit :
1, 000 − 0, 904 = 0, 096
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES
CHAPITRE [Link] ET EXPOSITION DES DONNEES
Fréquences cumulées et ogive
77
* Pour trouver la proportion des chauffeurs ayant un kilométrage
entre 200 et 300 km, on peut additionner les fréquences relatives
de toutes les classes à partir de celle qui commence à 200 km
jusqu’à celle qui se termine à 300 km, c’est-à-dire :
0, 212 + 0, 250 = 0, 462
* ou encore, trouver le résultat en soustrayant de la fréquence rel-
ative cumulée à la ligne correspondant à la classe se terminant à
300 km la fréquence relative cumulée à la ligne correspond dont
à la classe se terminant à 200 km, c’est-à-dire :
0, 731 − 0, 269 = 0, 462
| Pr. Dr. Ir J. KALENGA |COURS DE PROBABILITES ET STATISTIQUES