0% ont trouvé ce document utile (0 vote)
47 vues20 pages

Stat Proba

Ce document présente un cours de statistique descriptive, abordant les méthodes de collecte, présentation et analyse des données. Il définit des concepts clés tels que population, échantillon, variable statistique, ainsi que les types de caractères statistiques. Le document explique également comment construire des tableaux statistiques et des représentations graphiques pour synthétiser les données.

Transféré par

Oumarou Tondé
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
47 vues20 pages

Stat Proba

Ce document présente un cours de statistique descriptive, abordant les méthodes de collecte, présentation et analyse des données. Il définit des concepts clés tels que population, échantillon, variable statistique, ainsi que les types de caractères statistiques. Le document explique également comment construire des tableaux statistiques et des représentations graphiques pour synthétiser les données.

Transféré par

Oumarou Tondé
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

UNIVERSITÉ VIRTUELLE DU BURKINA

FASO (UV-BF)

Faculté des Sciences fondamentales


Pure developper

COURS DE
STATISTIQUE ET PROBABILITÉ

Enseignant : Dr Cédric K. SOME

14 février 2021
CHAPITRE 1
STATISTIQUE DESCRIPTIVE

1.1 Généralités
La statistique est l’ensemble des méthodes mathématiques relatives à la collecte, la présen-
tation, l’analyse et à l’utilisation des données. Elle s’applique à la plupart des disciplines telles
que l’agronomie, la biologie, la démographie, l’économie, la linguistique, la psychologie etc. On
subdiviser la statistique en deux grandes branches à savoir :
– la statistique descriptive qui décrit, présente, résume, récapitule et analyse les données ;
– la statistique inductive (inférentielle) qui permet de conclure sur une « population » entière
à partir de l’étude d’un « échantillon ».
Dans ce chapitre, nous ne nous intéressons qu’à la statistique descriptive.

1.1.1 Vocabulaire
Définition 1.1.1
Une population est un ensemble d’éléments présentant des caractéristiques communes auxquels
se rapportent les données étudiées. Cette population peut être des être vivants, des objets, des
étudiants d’une université, des productions d’une usine, des entreprises d’un secteur donné ¨ ¨ ¨

Définition 1.1.2
On appelle individu ou unité statistique, chaque élément d’une population.

Définition 1.1.3 Un échantillon est toute partie sélectionnée d’une population.

Exemple 1.1.1
L’ensemble des étudiants de la deuxième année de l’ISGE est un ensemble statistique. Chaque
étudiant est une unité statistique. Si l’on divise la classe en des groupes, chacun de ces groupes
est un échantillon.

Définition 1.1.4
Un caractère statistique ou une variable statistique est une caractéristique (propriété) observée
ou mesurée sur les individus d’une population.

Exemple 1.1.2
Le chiffre d’affaires de l’entreprise, le revenu du ménage, l’âge de la personne, la catégorie
socioprofessionnelle d’une personne, le nombre de but marqué lors d’une rencontre de football,
le taux de natalité, la taille d’une personne etc.

1
1.1. Généralités

Définition 1.1.5
Une modalité est une valeur ou un état pris(e) par une variable statistique. Les modalités
correspondent donc à l’ensemble des valeurs possibles d’une variable statistique. L’ensemble de
ces valeurs est appelé le domaine de la variable.
On suppose que la variable prend toujours une seule valeur sur chaque unité.
Exemple 1.1.3
Dans l’exemple 1.1.1, on peut prendre comme caractère :
– l’âge d’un étudiant dont les valeurs peuvent être : 18 ans, 19 ans, 20 ans, 25 ans,... ;
– l’ethnie d’un étudiant qui peut avoir pour état (valeur) : Bissa, Dagara, Dioula, Mossi,
Sénoufo ...

1.1.2 Typologie des caractères


Les caractères sont classés en deux groupes qui sont : les caractères quantitatifs et les
caractères qualitatifs.
Définition 1.1.6
Une variable est dite qualitative quand les modalités sont des catégories ; c’est-à-dire ne sont pas
numériques. Ainsi le sexe, la situation matrimoniale, la catégorie Socioprofessionnelle, ¨ ¨ ¨ sont
des caractères qualitatives. On peut toujours rendre numérique une telle valeur en associant un
nombre à chaque modalité ; on dit alors que les modalités sont codées.
Exemple 1.1.4
Les modalités de la variable sexe sont masculin (codé M ou 1) et féminin (codé F ou 2).
Le domaine de la variable est tM, F u ou t1, 2u selon le cas.
Définition 1.1.7
Les variables qualitatives peuvent être subdivisées en deux groupes à savoir :
– les variables qualitatives nominales qui sont des variables qualitatives dont les modalités
ne peuvent pas être ordonnées ;
– les variables qualitatives ordinales sont des variables qualitatives dont les modalités peuvent
être ordonnées.
Le fait de pouvoir ou non ordonner les modalités est parfois discutable.
Exemple 1.1.5
Dans les catégories socioprofessionnelles, on admet d’ordonner les modalités : "ouvriers", "em-
ployés", "cadres". Si on ajoute les modalités "sans profession", "enseignant", "artisan", l’ordre
devient beaucoup plus discutable.
Définition 1.1.8
Une variable quantitative est dite :
– discrète si l’ensemble des valeurs possibles est dénombrable.
– continue lorsqu’elle peut prendre toutes les valeurs numériques possibles d’un ensemble
inclus dans R.
Remarque 1.1.1
Ces définitions sont à relativiser, l’âge est théoriquement une variable quantitative continue,
mais en pratique, l’âge est mesuré dans le meilleur des cas au jour près. Toute mesure est
limitée en précision !
Exemple 1.1.6
Les modalités de la variable « nombre d’enfants par famille » sont 0, 1, 2, 3, .... C’est une va-
riable quantitative discrète. Par contre le revenu, la taille et taux de natalité sont des variables
continues.

Ens : Dr Cédric K. SOME 2 Statistique et Probabilité


1.1. Généralités

1.1.3 Série statistique


Définition 1.1.9
On appelle série statistique la suite des valeurs prises par une variable X sur les unités d’ob-
servation.

Le nombre d’unités d’observation est noté n.


Les modalités de la variable X sont notées x1 ; x2 ; ...; xn .

Exemple 1.1.7
On s’intéresse à la variable ’état-civil’ notée X et à la série statistique des valeurs prises par
X sur 20 personnes.
Le nombre d’unités d’observation est noté n “ 20.
En procédant à la codification suivante :

Table 1.1 – Codification


Célibataire Marié(e) Veuf(ve) Divorcé(e)
C M V D

Le domaine de la variable X est tC, M, V, Du.


Considérons la série statistique suivante :

Table 1.2 – Série statistique


M M D C D C M V V D M M M C C V C M D D

x1 “ M ; x2 “ M ; x3 “ D ; ¨ ¨ ¨ ; ; x20 “ D sont les modalités de X.

1.1.4 Tableaux statistiques


L’un des objectifs de la statistique est de résumé les données "brutes" recueillies sur une
population dans des tableaux appelés Tableaux statistiques.
L’avantage de ces tableaux est qu’ils permettent :
– la présentation des données de façon lisible ;
– de donner en ligne des informations relatives à chaque individu ;
– de donner en colonne des informations relatives aux critères étudiés

Exemple 1.1.8

Table 1.3 – Tableau statistique


Nom Prénom Age Sexe Série du BAC Opinion, sur la statistique
Zon Illa 19 F D très utile
ALy Ali 21 M A utile
Nia Prince 24 M F pas utile

Ens : Dr Cédric K. SOME 3 Statistique et Probabilité


1.1. Généralités

Considérons une population de n individus.


Soit X, un caractère étudier au sein de cette population.
X comporte k modalités notées : x1 , x2 , x3 , ..., xi , ..., xk que l’on peut noter aussi pxi qi“1,..,k .
Soit ni , le nombre d’individus de la population possédant la modalité xi . L’ensemble de ces
informations peut être consigné dans un tableau appelé tableau statistique à un caractère.

L’ensemble des modalités et des effectifs d’un caractère forment une distribution statistique
ou série statistique txi ; ni u

Règles générales de présentation d’un tableau statistique


La présentation d’un tableau statistique doit respecter un certain nombre de règles dont :
- l’attribution d’un titre : le titre se porte au-dessus du tableau. Il doit être précis, concis
et explicite ;
– la précision de l’unité utilisée : l’unité est placée en haut et souvent à droite ;
– Le tableau doit porter des intitulés de lignes et de colonnes clairement définis
– l’indication de la source des données : la source est placée en dessous du tableau et donne
la référence des informations utilisées ;
Exemple 1.1.9

Table 1.4 – Tableau statistique à un caractère


Modalités x1 x2 . . . xi . . . xk Total
Effectifs n1 n2 . . . ni . . . nk n

Fréquences absolues-fréquences relatives


Le nombre n, effectif total de la population est appelé taille de la population. Le nombre
d’individus présentant la modalité xi est noté ni ; on l’appelle aussi fréquence absolue. Suppo-
sons qu’il ait k modalités. En faisant la sommation des effectifs ni de ces modalités, on obtient
la taille de la population :
k
ÿ
ni “ n
i“1

La fréquence de la modalité xi (ou fréquence relative) est notée fi . Elle est la proportion
ni
fi “
n
La somme des fréquences vaut 1 :
k k k
ÿ ÿ ni 1 ÿ 1
fi “ “ ˆ ni “ ˆ n “ 1
i“1 i“1
n n i“1 n
Lorsque la variable est quantitative le tableau peut être complété par les valeurs cumulées.

Effectifs cumulés-fréquences cumulées


Les effectifs et fréquences donnent des renseignements sur une modalité donnée. Or, en
statistique, on cherche souvent à répondre à des questions du type : quel est l’effectif ou la
proportion de la population dont la modalité du caractère est inférieure ou supérieure à une
valeur donnée ? Les effectifs et fréquences cumulées permettent de répondre à cette question.

Ens : Dr Cédric K. SOME 4 Statistique et Probabilité


1.2. Caractère qualitatif nominal

1.1.5 Les représentations graphiques


Les graphiques permettent de donner une synthèse visuelle de la distribution d’une variable.
Les graphes apparaissent comme plus "parlants" que le tableau. Ils donnent, au sens propre,
une image des réalités observées
Les représentations graphiques sont spécifiques aux types de variables. Le choix des représen-
tations graphiques en dépend.

1.2 Caractère qualitatif nominal


1.2.1 Tableau statistique
Effectif-fréquence
Un caractère qualitatif nominal a des valeurs distinctes qui ne peuvent pas être ordonnées.
On note N le nombre de valeurs distinctes ou modalités. Les valeurs distinctes sont notées x1 ,
. . . , xi , . . . , xN . On appelle effectif d’une modalité ou d’une valeur distincte, le nombre de
fois que cette modalité (ou valeur distincte) apparaît. On note ni l’effectif de la modalité xi .
La fréquence fi d’une modalité xi est l’effectif divisé par le nombre total d’unités d’observation.
ni
fi “ ; i “ 1, ..., N
n

Présentation du tableau
Le tableau statistique dans le cas d’un caractère qualitatif nominal peut être donné par :

Table 1.5 – Tableau caractère qualitatif nominal


Modalité effectif frequence
n1
x1 n1 n
. . .
. . .
. . .
ni
xi ni n
. . .
. . .
. . .
nN
xN nN n

1.2.2 Représentation graphique


Le tableau statistique d’une variable qualitative nominale peut être représenté par deux
types de graphique. Les effectifs sont représentés par un diagramme en barres et les fréquences
par un diagramme circulaire

Le diagramme en barres
Les modalités sont représentées par des rectangles de bases constantes arbitrairement choi-
sies et de hauteur proportionnelle à l’effectif ou à la fréquence de la modalité. Les rectangles
sont espacés les uns des autres.

Ens : Dr Cédric K. SOME 5 Statistique et Probabilité


1.2. Caractère qualitatif nominal

Le diagramme circulaire ou en secteurs


C’est un disque découpé en secteurs. Chaque secteur correspond à une modalité et son angle
au centre est proportionnel à la fréquence de la modalité : θi “ 360fi degrés.
Remarque : Quelque fois on utilise des démi-disques ; dans ce cas les fréquences sont multi-
pliées par 180 pour avoir les angles au centre.
Exemple 1.2.1 Etude d’un exemple : Les crises alimentaires

Présentation des données et position du problème


En 2002, l’auteur a proposé aux étudiants de l’Ecole Supérieur d’Agriculture de Purpan
(ESAP) de réaliser une enquête de thème "Les crises alimentaires". Un prmier objectif
consiste à évaluer l’intérêt, le niveau de culture et le degré de sensibilité des étudiants pour de
tels problèmes d’actualité. Un deuxième objectif, corollaire du précédent, est d’en déduire, pour
l’équipe enseignante, une stratégie d’amélioration et de progrès tant au niveau de la formation
que de l’éducation.
Dans un cet exemple, nous n’aborderons que les deux questions très simples permettant
d’illustrer la description statistique de variables qualitatives.
Pour approfondir le dépouillement de l’enquête et voir si les réponses aux questions impor-
tantes de cette enquête pouvaient être liées à l’origine sociale de la famille, il a été demandé
d’indiquer la profession des parents (chef de famille). Après avoir parcouru les fiches des parti-
cipants, ce caractère intitulé CSP (Catégorie Socio-Professionnelle) a été recodé selon six (06)
modalités ou classes suivantes : Ouvrier, Employé, Agriculteur, Professions intermédiaires,
Chef d’entreprise, Retraité.
Deux cents soixante-dix-huit (278) étudiants ont répondu à l’enquête et on a obtenu les
résultats indiqués sur le tableau suivant.

Table 1.6 – Effectifs selon les CSP


CSP Ouvrier Employé Agriculteur Profession intermédiaire Chef d’entrprise Retraité
Effectifs 3 17 86 156 10 6

Question : Réaliser une analyse descriptive du caractère CSP.

Outils statistiques et notations


Nous ne nous intéressons ici qu’à la variable qualitative nominale.

Notation
Dans cet exemple, le critère CSP définit une variable qualitative X à 6 modalités (ou classes)
x1 , x2 , ..., x6 ; avec x1 “ ouvrier, x2 “ employé, x3 “ agriculteur, x4 “ professions intermédiaires,
x5 “ chef d’entreprise et x6 “ retraité.
L’ordre et le codage des modalités n’ont aucune importance.
La variable qualitative X est dite nominale.

Outil statistique
Pour décrire statistiquement une variable qualitative, on utilise les outils élémentaires de
distributions de fréquences absolues (effectifs) et relatives visualisées par des graphiques élé-
mentaires de son choix (diagrammes en bâtons, en barres, en secteurs, etc.). Les distributions
de fréquences absolues et relatives données par la Table1.6 sont :

Ens : Dr Cédric K. SOME 6 Statistique et Probabilité


1.2. Caractère qualitatif nominal

Table 1.7 – Fréquences absolues et relatives de la variable CSP


CSP Fréquences absolues Frequences relatives
Ouvrier 3 1%
Employé 17 6%
Agriculteur 86 31%
Professions intermédiaires 156 56%
Chef d’entreprise 10 4%
Retraité 6 2%
Totaux 278 100%

Représentations graphiques
Diagrammes en bâtons, en barres et en secteur

Ens : Dr Cédric K. SOME 7 Statistique et Probabilité


1.2. Caractère qualitatif nominal

Distribution des fréquences relatives

RETRAITE
CHEF D'ENTREPRISE
PROFESSION INTERMEDIAIRE
AGRICULTEUR
EMPLOYE
OUVRIER

0 10 20 30 40 50 60

Diagramme à barres de la variable CSP

Distribution des fréquences relatives


60
50
40
30
20
10
0
OUVRIER EMPLOYE AGRICULTEUR PROFESSION CHEF RETRAITE
INTERMEDIAIRE D'ENTREPRISE

Diagramme à bâtons de la variable CSP

Distribution des fréquences relatives

OUVRIER
EMPLOYE
AGRICULTEUR
PROFESSION INTERMEDIAIRE
CHEF D'ENTREPRISE
RETRAITE

Diagramme en secteur de la variable CSP

Ens : Dr Cédric K. SOME 8 Statistique et Probabilité


1.3. Caractère qualitatif ordinal

Commentaires
Il nous paraît superflu de commenter longuement des tableaux et graphiques très expres-
sifs par nature. Remarquons seulement que deux origines sociales se démarquent. La CSP
"professions intermédiaires" (56%) rassemble plusieurs professions. Cela peut expliquer ce fort
pourcentage En ce qui concerne la CSP "agriculteurs" (31%), il n’est pas étonnant de trouver
ce résultat dans l’échantillon enquêté puisqu’une forte proportion d’étudiants est issue de ce
milieu.

Exemple 1.2.2
Considérons le tableau donnant la répartition de la population active occupée selon la catégorie
socio-professionnelle (CSP) au Burkina Faso en 2000 :

CSP Effectif en millier


Agriculteurs et exploitant 5815
Artisans commerçant, chef d’entreprise 2267
Cadre, profession intellectuelles supérieures 1312
Professions intermédiaires 1739
Employés 2327
Ouvrier 4327

Donner la représentation en barres puis en secteurs de cette distribution

1.3 Caractère qualitatif ordinal


1.3.1 Tableau statistique
Effectifs-fréquences
Les valeurs distinctes d’une variable ordinale peuvent être ordonnées, ce qu’on écrit :

x1 ă x2 ă ¨ ¨ ¨ ă xi´1 ă xi ă ¨ ¨ ¨ ă xJ´1 ă xJ .

La notation x1 ă x2 se lit x1 précède x2 .


Si la variable est ordinale, on peut calculer les effectifs cumulés :
i
ÿ
Ni “ nk ; i “ 1, ..., J
k“1

avec N1 “ n1 ; NJ “ n.
On calcule également les fréquences cumulées par :
i
Ni ÿ
Fi “ “ fk ; i “ 1, ..., J
n k“1

Présentation du tableau statistique


Considérons une série statistique composé de modalités x1 , ¨ ¨ ¨ , xi apparaissant respective-
ment n1 fois, ¨ ¨ ¨ , ni fois. La forme du tableau statistique peut être :

Ens : Dr Cédric K. SOME 9 Statistique et Probabilité


1.3. Caractère qualitatif ordinal

Table 1.8 – Tableau caractère qualitatif ordinal


Modalité effectif effectif cumulé fréquence fréquence cumulée
x1 n1 N1 “ n1 f1 “ nn1 F1 “ nn1
. . . .
. . . .
. . . .
ÿi i
ÿ
ni
xi ni Ni “ nk n
Fi “ fk
k“1 k“1
. . . .
. . . .
. . . .
J
ÿ
nJ
xN nJ NJ “ n n
FJ “ fk “ 1
k“1

1.3.2 Représentation graphique


Pour les séries qualitatives, deux types de représentations graphiques sont les plus utilisées :
le diagramme en barre et le diagramme circulaire.

Le diagramme en barres
Les modalités sont représentées par des barres de hauteur proportionnelle à l’effectif ou à
la fréquence de la modalité.

Le diagramme circulaire
C’est un disque découpé en secteurs. Chaque secteur correspond à une modalité et son angle
au centre est proportionnel à la fréquence de la modalité : θi “ 360fi degrés.

Remarque 1.3.1
Quelque fois on utilise des démi-disques ; dans ce cas les fréquences sont multipliées par 180
pour avoir les angles au centre.
Revenons sur l’Exemple 1.2.1 intitulé « Crise alimentaire » et intéressons-nous à un
autre caractère.

Exemple 1.3.1
Dans l’exemple 1.2.1, nous nous intéressons à une autre question posée aux étudiants qui,
rappelons-le, deviendront, pour une bonne partie d’entre eux, ingénieurs dans des secteurs agri-
coles, agro-alimentaires, etc. Quel doit être selon eux, le degré de responsabilité des gouverne-
ments face à de telles questions de salubrité publique ? La réponse possible a été proposée sous
la forme d’une échelle croissante de 1 (très peu important) à 5 (très important, fondamental).
Le tableau 1.9 indique les résultats obtenus.

Table 1.9 – Effectifs selon l’opinion


Opinion 1 2 3 4 5
Effectifs 5 23 67 104 79

Question : Réaliser une analyse descriptive de la variable considérée.

Ens : Dr Cédric K. SOME 10 Statistique et Probabilité


1.3. Caractère qualitatif ordinal

Outils statistique et notations pour la variable "opinion"


Il s’agit ici d’une variable qualitative ordinal.

Notations
Le critère étudié est l’opinion relative à l’importance de la responsabilité que doivent assu-
mer les gouvernements face aux questions de sécurité alimentaire. Ce critère définit une variable
qualitative Y à p modalités ou classes : y1 , y2 , ¨ ¨ ¨ , yp .
Dans notre exemple p est égal à 5, les modalités proposées étant y1 “ très peu important, y2 “
peu important, y3 “ assez important, y4 “ important et y5 “ très important.
Cette fois, les modalités sont ordonnées selon un gradient (ici, gradient d’importance crois-
sante). La variable qualitative Y est dite ordinale (ou encore de type "échelle"). Les distributions
de fréquence, identiques à celles présentées pour une variable qualitative nominale, constituent
l’outil statistique. Il est important de remarquer la nuance entre les deux types de variables
nominales et ordinales. La présence d’un gradient dans la variable qualitative ordinale permet
d’enrichir les exploitations statistiques des cas concrets en assimilant la variable selon les cas
à une variable quantitative de type note ou rang ou mesure.

Outil statistique
L’analyse descriptive est réalisée de manière identique à la précédente. Rappelons que les
classes (ou modalités) étant ordonnées selon un gradient de codage de 1 (très peu important)
à 5 (très important), la variable qualitative peut être assimilée à une variable quantitative du
type « note sur 5 ». Le tableau des fréquences absolues et relatives donné par TABLE 1.9 se
présente sous la forme suivante :

Table 1.10 – Fréquences absolues et relatives de l’opinion


Opinion Fréquences absolues Fréquences relatives
1. très peu important 5 2%
2. peu important 23 8%
3. assez important 67 24%
4- important 104 37%
5. très important, fondamental 79 29%
TOTAUX 278 100%

Remarque 1.3.2
Les différentes représentations graphiques se font de façons analogues à celles du caractère CSP.
Donc ces représentations sont laissées à l’apprenant.

Exercice 1.3.1
On s’intéresse à la catégorie de lotissement au Burkina Faso. Une étude a permis de recenser,
sur un échantillon de 1000 détenteurs de terrain, le type de lotissement.

Table 1.11 – Fréquences absolues


Type Standing Economique Social moyen standing
Nombre 48 220 575 157

1. Compléter le tableau ci-dessus par les effectifs cumulés et fréquences cumulés.

Ens : Dr Cédric K. SOME 11 Statistique et Probabilité


1.4. Caractère quantitatif discret

2. Construire un diagramme en barre et un diagramme semi-circulaire des effectifs de cette


modalité.
3. Combien de personnes sur 1000 au Burkina ne peuvent pas avoir un terrain de type moyen
standing ?

1.4 Caractère quantitatif discret


1.4.1 Tableau statistique
Le tableau statistique pour ce caractère peut comporter les éléments essentiels comme suit :

Effectifs-fréquences
1. L’effectif cumulé croissant
ni Õ d’une modalité xi est le nombre d’individus de la population dont le caractère est
inférieur ou égal à xi . C’est la somme des effectifs des modalités de x1 à xi :
i
ÿ
ni Õ “ n1 ` n2 ` ··· ` ni “ nj
j “1

2. L’effectif cumulé décroissant


ni Œ d’une modalité xi est le nombre d’individus de la population dont le caractère est
supérieur ou égal à xi . C’est la somme des effectifs des modalités de xi à xk :

k
ÿ
ni Œ “ ni ` ni`1 ` ··· ` nk “ nj
j “i

3. La fréquence cumulée croissante


fi Õ et la fréquence cumulée croissantefi Œ d’une modalité xi se calculent de manière
analogue aux effectifs cumulés :
i
ÿ
fi Õ “ f1 ` f2 ` ··· ` fi “ fj
j “1

k
ÿ
fi Œ “ fi ` fi`1 ` ··· ` fk “ fj
j “i

Présentation du tableau (voir TABLE 1.12)

Ens : Dr Cédric K. SOME 12 Statistique et Probabilité


1.4. Caractère quantitatif discret

Table 1.12 – Tableau statistique de caractère quantitatif discrèt


M odalités ni ni Õ ni Œ fi % fi Õ % fi Œ %
x1 n1 n1 n f1 f1 100
x2 n2 n1 ` n2 n ´ n1 f2 f1 ` f2 100 ´ f1
.
.

xi ni ni´1 Õ ` ni ni´1 Œ ´ ni´1 fi fi´1 Õ ` fi fi´1 Œ ´ fi´1


.
.
.
xk nk nk´1 Õ ` nk nk´1 Œ ´ nk´1 fk fk´1 Õ ` fk fk´1 Œ ´ fk´1
Total n - - 100 - -

Exemple 1.4.1
Répartition des élèves d’une classe selon la note sur 20 obtenue dans une matière.

Table 1.13 – Repartition des élèves


Notes ni fi % ni Õ ni Œ fi Õ % fi Œ %
7 3 10, 00 03 30 10, 00 100
8 3 10, 00 06 27 20, 00 90, 00
9 2 06, 68 08 24 26, 68 80, 00
10 3 10, 00 11 22 36, 68 73, 32
11 3 10, 00 14 19 46, 68 63, 32
12 4 13, 33 18 16 60, 01 53, 32
13 4 13, 33 22 12 73, 34 39, 99
14 4 13, 33 26 08 86, 67 26, 66
15 3 10, 00 29 04 96, 67 13, 33
16 1 03, 33 30 01 100 03, 33
Total 30 100 - - - -

A partir du tableau peut-on lire (voir TABLE 1.13) :


– le nombre d’élèves ayant la moyenne (10) ?
– la proportion d’élèves ayant une note supérieure à 12 ?

1.4.2 Représentation graphique


Pour les caractères quantitatifs discrets, le diagramme différentiel est appelé diagramme
en bâton et le diagramme intégral courbe cumulative ou diagramme en escalier.
a) Le diagramme en bâton
Les modalités sont représentées par des segments verticaux de bases situées sur la valeur de
la modalité et de hauteurs égales à l’effectif ou à la fréquence de la modalité. Lorsqu’on rélie
entre elles les sommets des différents segments on obtient le polygone des fréquences ou des
effectifs.
b) Le diagramme en escalier

Ens : Dr Cédric K. SOME 13 Statistique et Probabilité


1.4. Caractère quantitatif discret

Les effectifs cumulés croissants respectivement les fréquences cumulées croissantes sont re-
présentées respectivement aux moyens de la fonction
$
& 0 si x ă x1
F1 pxq “ Ni` si xi ď x ă xi`1 , i “ 1, ¨ ¨ ¨ , J ´ 1 (1.1)
n si xJ ď x
%

et de la fonction de répartition
$
& 0 si x ă x1
F2 pxq “ F` si xi ď x ă xi`1 , i “ 1, ¨ ¨ ¨ , J ´ 1 (1.2)
% i
1 si xJ ď x
La fonction de répartition est définie de R dans r0; 1s
De façon analogue, les effectifs cumulés décroissants sont représentés par la
$
& n si x ď x1
F3 pxq “ Ni´ si xi ď x ă xi`1 , i “ 1, ¨ ¨ ¨ , J ´ 1 (1.3)
0 si xJ ď x
%

et les fréquences cumulées décroissantes sont définies par la fonction de répartition définie de
R dans r0; 1s par :
$
& 1 si x ď x1
F4 pxq “ Fi´ si xi ď x ă xi`1 , i “ 1, ¨ ¨ ¨ , J ´ 1 (1.4)
0 si xJ ď x
%

Exemple 1.4.2
Représentation de la répartition des employés d’une entreprise selon le nombre de personnes
habitant le ménage

Table 1.14 – Repartition des employés


xi ni ni Õ ni Œ fi % fi Õ % fi Œ %
1 10 10 200 5 5 100
2 30 40 190 15 20 95
3 80 120 160 40 60 80
4 40 160 80 20 80 40
5 34 194 40 17 97 20
6 6 200 6 3 100 3
ą6 0 200 0 0 100 0
Total 200 - - 100 - -

Exemple 1.4.3 : Nombre de grappe de raisin par souche


Lors d’une étude de qualité d’un vin du Sud-Ouest, on est conduit à examiner la productivité de la
vigne ; dans un premier temps, on s’intéresse au nombre de grappes par souche.
120 souches ont été tirées au hasard dans des parcelles semblables et on a compté le nombre de
grappes portées par chacune d’elles. On observe les résultats suivants :
15 ; 12 ; 20 ; 13 ; 17 ; 16 ; 15 ; 12 ; 20 ; 14 ; 19 ; 15 ; 13 ; 14 ; 16 ; 13 ; 19 ; 14 ; 15 ; 12
16 ; 13 ; 20 ; 14 ; 15 ; 17 ; 15 ; 19 ; 20 ; 14 ; 13 ; 17 ; 13 ; 19 ; 12 ; 12 ; 16 ; 15 ; 16 ; 18
12 ; 12 ; 16 ; 15 ; 19 ; 17 ; 14 ; 19 ; 16 ; 17 ; 19 ; 12 ; 14 ; 19 ; 13 ; 17 ; 12 ; 12 ; 16 ; 17
13 ; 18 ; 12 ; 12 ; 16 ; 17 ; 14 ; 18 ; 15 ; 15 ; 17 ; 17 ; 15 ; 13 ; 13 ; 13 ; 17 ; 12 ; 15 ; 13
14 ; 13 ; 18 ; 12 ; 14 ; 19 ; 13 ; 14 ; 19 ; 15 ; 14 ; 19 ; 18 ; 14 ; 19 ; 16 ; 16 ; 18 ; 18 ; 15
12 ; 17 ; 14 ; 18 ; 19 ; 15 ; 12 ; 17 ; 12 ; 12 ; 17 ; 16 ; 13 ; 16 ; 13 ; 12 ; 17 ; 17 ; 15 ; 17

Question : réaliser une analyse statistique descriptive des données observées

Ens : Dr Cédric K. SOME 14 Statistique et Probabilité


1.5. Caractère quantitatif continu

Approche statistique et notations


Nous distinguerons deux familles d’outils de statistique descriptive appropriées à cet exemple :
– les distributions de fréquences, tableaux et graphiques
– les paramètres statistiques.
On note n le nombre d’observations et X la variable statistique "nombre de grappes par souche (NGS)".
X ne prend que des valeurs entières. Entre deux valeurs distinctes successives aucune valeur n’est
possible. Par conséquent, X est une variable quantitative discrète.

Distribution des fréquences


Après avoir réalisé un tri de ces valeurs, on saisit dans un tableau l’ensemble des valeurs distinctes
prises par X. On observe toutes les valeurs distinctes de 12 à 20, soit 9 valeurs. Cette plage des valeurs
de xi sera dite "matrice des classes". On la nomme xi .

Table 1.15 – Fréquences absolues, relatives et cumulées de NGS


xi Fréquences absolues Fréquences relatives Fréquences cumulées croissantes
12 19 16% 16%
13 16 13% 29%
14 14 12% 41%
15 16 13% 54%
16 13 11% 65%
17 17 14% 79%
18 8 7% 86%
19 13 11% 97%
20 4 3% 100%

Représentations graphiques

Diagramme à barres DIAGRAGRAMME EN SECTEUR DES FREQUENCE Diagramme en batons des


ABSOLUES fréquences absolues
20
19
Axe : Nombre de grappes par souche

19 17
16 16
4
Fréquences absolues

18 13 19 14
13 13
17
8
16 8
Fréquences Absolues 16
15
4
14 17

13
14
12 NGS
13
16
0 5 10 15 20
Axe : Fréquences absolues

1.5 Caractère quantitatif continu


1.5.1 Tableau statistique
Effectifs et fréquences
Dans le cas des caractères quantitatifs continus, les modalités sont regroupées en classes. Le nombre
de classes ne doit être ni trop grand, ni trop petit. On peut considérer un nombre de classes compris

Ens : Dr Cédric K. SOME 15 Statistique et Probabilité


1.5. Caractère quantitatif continu

entre 5 et 10. On convient d’adopter le plus souvent, des classes d’intervalles fermés à gauche et ouverts
à droite. De plus ces classes s’emboîtent les unes dans les autres. Pour chaque classe rei ; ei`1 r on définit
les valeurs cumulées comme suit :
1. l’effectif cumulé croissant de la classe
Il s’agit de

ni Õ“ n1 ` n2 ` ¨ ¨ ¨ ` ni ;

c’est donc le nombre d’individus dont le caractère étudié prend une valeur strictement inférieure
à ei`1 ;
Il en suit que le nombre d’individus dont le caractère étudié prend une valeur strictement
inférieure à e1 est nul ;
2. la fréquence cumulée croissante de la classe
Elle est donnée par la relation :

fi Õ“ f1 ` f2 ` ¨ ¨ ¨ ` fi ;

c’est donc la proportion d’individus dont le caractère étudié prend une valeur strictement infé-
rieure à ei`1 ;
Il vient que la proportion d’individus dont le caractère étudié prend une valeur strictement
inférieure à e1 est nulle ;
3. l’effectif cumulé décroissant de la classe
Il s’agit de

ni Œ“ ni ` ni`1 ` ¨ ¨ ¨ ` nk ;

c’est donc le nombre d’individus dont le caractère étudié prend une valeur supérieure ou égale
à ei ;
Alors le nombre d’individus dont le caractère étudié prend une valeur supérieure ou égale à e1
est n.
4. la fréquence cumulée décroissante de la classe

fi Œ“ fi ` ni`1 ` ¨ ¨ ¨ ` fk ;

c’est donc la proportion d’individus dont le caractère étudié prend une valeur supérieure ou
égale à ei ;
Il vient que la proportion d’individus dont le caractère étudié prend une valeur supérieure ou
égale à e1 est 100%.
5. le centre de la classe
ei ` ei`1
Il est ci “ ; il est supposé être une valeur répresentative de la classe. On remplace sou-
2
vent l’étude d’une série continue par celle de la série classée associée c’est à dire, la série discrète
dont les modalités sont les centres des classes et les effectifs ceux des classes correspondantes ;
on dit qu’on discrétise la série continue.
6. l’amplitude ou étendue de la classe
Elle est donnée par ai “ ei`1 ´ ei
7. la densité de fréquence de la classe
fi
Elle est obtenue par di “ ; lors du regroupement des valeurs d’une série en classe, il n’est pas
ai
imposé que toutes les classes soient de même amplitude, par conséquent, on ne peut se contenter
des effectifs ou des fréquences de deux classes pour les comparer ; d’où l’utilisation de la densité.

Présentation générale du tableau

Ens : Dr Cédric K. SOME 16 Statistique et Probabilité


1.5. Caractère quantitatif continu

Table 1.16 – Présentation tableau


Classe ni ni Õ ni Œ fi % fi Õ % fi Œ %
re1 ; e2 r n1 n1 n f1 f1 100
re2 ; e3 r n2 n1 ` n2 n ´ n1 f2 f1 ` f2 100 ´ f1
.
.
.
rei ; ei`1 r ni ni´1 Õ ` ni ni´1 Œ ´ ni´1 fi fi´1 Õ ` fi fi´1 Œ ´ fi´1
.
.
.
rek ; ek`1 r nk nk´1 Õ ` nk nk´1 Œ ´ nk´1 fk fk´1 Õ ` fk fk´1 Œ ´ fk´1
Total n - - 100 - -

Exemple 1.5.1
Distribution des ouvriers d’une entreprise selon le salaire journalier en milliers de francs.

Table 1.17 – Distribution des ouvriers


Classe [0 ;2[ [2 ;5[ [5 ;7[ [7 ;10[ [10 ;20[ [20 ;25[ [25 ;30[ Total
ni 34 92 46 28 50 10 20 280

1. Compléter le tableau ci-dessus par les effectifs et fréquences cumulés.


2. Combien d’ouvriers ont un salaire de moins de 5000F
3. Quel est le nombre d’ouvriers ayant un salaire compris entre 10 000F et 25 000F ?

1.5.2 Représentations graphiques


Pour les caractères quantitatifs continus, le diagramme différentiel est appelé histogramme et le
diagramme intégral courbe cumulative.

Histogramme
On représente chaque classe rei , ei`1 r par un rectangle dont la base est l’intervalle rei , ei`1 s et la
surface est proportionnelle à l’effectif de la classe. La hauteur est égale à la densité de la classe.
En pratique, l’histogramme se construit suivant les cas :
1. Cas de classes d’amplitudes égales
Pour les classes d’amplitudes égales, les rectangles représentant chaque classe ont pour surface
si “ ai fi .

– ai est l’amplitude de la classe rei , ei`1 r


– fi est la fréquence associée à rei , ei`1 r
On représente donc la fonction F pxq “ fi si x P rei , ei`1 r.
On peut aussi construire l’histogramme des effectifs en remplaçant fi par ni puis le polygone
correspondant.
2. Cas de classes d’amplitudes différentes
Si les classes sont d’amplitudes différentes, on corrige les fréquences par
fi
di “ hi “
ai

Ens : Dr Cédric K. SOME 17 Statistique et Probabilité


1.5. Caractère quantitatif continu

La hauteur de chaque rectangle est égale à hi .


On construit l’histogramme en représentant la fonction F pxq “ hi si x P rei , ei`1 r.
On construit l’histogramme des effectifs en remplaçant hi par naii puis le polygone correspondant.

Exemple 1.5.2
Reprenons l’Exemple 1.4.3 et regroupons les modalités en classe d’amplitude 2. Nous établissons le
tableau suivant :

Table 1.18 – Tableau de distribution de la variable NGS regroupée classes


Classes Centres de classes Effectifs
[12 ;14[ 13 35
[14 ;16[ 15 30
[16 ;18[ 17 30
[18 ;20[ 19 21
[20 ;22[ 21 4

Représentation
Histogramme de la variable nombre de grappes par source (NGS)

Histogramme des effectifs


35

30 30

21

[ 12 14 [ [ 14 16 [ [ 16 18 [ [ 18 20 [ [ 20 22 [

Histogramme des effectifs de la variable NGS

Courbes cumulatives croissantes et décroissante des fréquences


La représentation des courbes cumulatives des fréquences suit le principe suivant :
– On trace la courbe cumulative décroissante, en considérant en abscisses les limites inférieures
des classes et pour ordonnées les fréquences cumulées décroissantes
– On trace la courbe cumulative croissante, en prenant en abscisses les limites supérieures des
classes et en ordonnées les fréquences cumulées croissantes.

Ens : Dr Cédric K. SOME 18 Statistique et Probabilité


1.5. Caractère quantitatif continu

Exemple 1.5.3
Considérons le tableau suivant donnant le nombre de personnes en fonction de leurs consommations
mensuelles en mètre cube (m3 ) d’eau :

Consommation d’eau(m3 ) [0 ;6[ [6 ;12[ [12 ;18[ [18 ;24[ [24 ;30[ [30 ;36[ [36 ;42[
Nombre de personnes 234 201 125 112 67 20 30
1. Compléter ce tableau par les effectifs cumulés et par les fréquences cumulées
2. Construire les polygones cumulatives correspondantes (à choisir judicieusement)
3. A travers les courbes, combien de personnes ont une consommation entre 6 et 30 ?

Ens : Dr Cédric K. SOME 19 Statistique et Probabilité

Vous aimerez peut-être aussi