Introduction à la statistique univariée
Introduction à la statistique univariée
OU
0.1 VOCABULAIRE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.1.1 Population . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.1.2 Individu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.1.3 Echantillion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.1.4 Caractère . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.1.5 Caractère quantitatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
0.1.6 Caractère qualitatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
0.1.7 Nature d’un caractère quantitatif . . . . . . . . . . . . . . . . . . . . . . 3
0.2 ETUDE DES CARACTERES . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
0.2.1 Modalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
-MB
0.2.2 Classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
0.2.3 Effectif d’une modalité ou d’une classe . . . . . . . . . . . . . . . . . . . 4
0.2.4 Fréquence d’une modalité ou d’une classe . . . . . . . . . . . . . . . . . . 4
0.2.5 Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
0.2.6 Notion de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
0.2.7 Etude des caractères quantitatif . . . . . . . . . . . . . . . . . . . . . . . 5
0.2.8 Série statistique et distribution statistique . . . . . . . . . . . . . . . . . 5
0.2.9 Effectif cumulés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
0.2.10 Fréquence cumulées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
0.2.11 Tableau cumulatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
0.2.12 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
0.3 REPRESENTATIONS GRAPHIQUES . . . . . . . . . . . . . . . . . . . . . . . 6
ISM
1
M. NDIAYE ISM-MBOUR Année 2017-2018
R
sociales, météo, enseignement ...
Elle a connu un développement important avec l’outil informatique. Elle constitue une aide
appréciable à la prise de décision tant au niveau politique, économique, que social.
Mais pour faire de la statistique, il est important connaitre la terminologie appropriée. C’est
pourquoi nous commençons par le vocabulaire
OU
0.1 VOCABULAIRE
Activité
Un professeur de mathématiques étudie les notes de ses 20 étudiants après l’examen du premier
semestre en DSG 1.
Voici la liste des notes obtenues par les étudiants :
10 - 7 - 5 - 9 - 13 - 11 - 16 - 17 - 14 - 13 - 16 - 8 - 6 - 10 - 8 - 11 - 10 - 12 - 7 - 9.
-MB
0.1.1 Population
L’ensemble sur lequel on recueille les données est appelé population.
les élèves de cette classe constituent la population statistique.
0.1.2 Individu
Tout élément de la population est appelé individu.
chaque étudiant de cette classe est un individu.
0.1.3 Echantillion
Lorsque l’effectif sur lequel on travail est trop grand il est préférable de tarvailler sur un
ISM
0.1.4 Caractère
Un caractère est toute information qu’on peut étudier sur la population.
Exemple
∗ Sur une population d’étudiants, on peut étudier :
- les caractères : âge , taille , nationalité, genre, situation matrimoniale ...
∗ Sur une population d’entreprises, on peut étudier
- les caractères : nombre d’employés, chiffre d’affaires de l’année 2017, capital ...
∗ Sur une population d’écoles, on peut étudier les caractères : nombre d’étudiants, taux de
réussite ...
Remarque
Un caractère est soit quantitatif soit qualitatif.
R
Un caractère est dit quantitatif s’il est mesurable ou s’il peut être exprimé à l’aide de chiffres
significatifs.
Exemple Sur une population d’étudiants, les caractères ”âge” et ”taille”.
OU
0.1.6 Caractère qualitatif
Il s’agit de tout caractère qui n’est pas mesurable.
Sur une population d’étudiant les caractères ”nationalité” et ”ethnie”, sport pratiqué sont
qualitatifs car ils ne peuvent pas être mesurés.
∗ Un caractère quantitatif est continu s’il prend peu ou pas de valeurs isolées. C’est-à-dire
lorsqu’il est susceptible de prendre toutes les valeurs d’un intervalle.
Exemple :Le tableau ci-dessous donne la répartition des joueurs de football d’une selection,
selon la taille en centimètre
ISM
0.2.2 Classes
R
Dans le cas d’un caractère continu, les modalités sont regroupées en classes. Une classe est
un intervalle du type [a; b[ , il est obtenu par regroupement des valeurs du caractère.
a+b
Le centre d’une classe [a; b[ est et l’amplitude est égale à b − a
2
OU
Exemple
ni
ISM
fi = × 100
N
.
1) Etablir le tableau statistique. On y fera figurer les effectifs de chaque modalité, les ECC
et ECD les fréquences (en pourcentage), les FCC et FCD.
2) Quel est l’effectif cumulé croissant de la note 9 ? Interpréter cette valeur trouvée.
R
3) Quelles est l’effectif cumulé croissant de la note 12 ? Interpréter cette valeur trouvée.
OU
Un caractère est une quantité ou une qualité susceptible de fluctuations ou encore une
grandeur à laquelle on peut attribuer plusieurs valeurs différentes. Pour ces raisons on est
amené è l’appeler souvent une variable. On pourra donc parler de variable discrète, variable
continue, variable qualitative.
R
Modalité M1 M2 M3 ··· Mp Total
Effectif n1 n2 n3 ··· np N
Fréquences f1 f2 f3 ··· fp 1
ECC n1 n1 + n2 n1 +n2 +n3 ··· N
OU
ECD N N − n1 N −n1 −n2 ··· np
FCC f1 f1 + f2 f1 + f2 + f3 ··· 1
FCD 1 1 − f1 1 − f1 − f2 ··· fp
0.2.12 Application
On choisit au hasard un groupe de 50 ’étudiants et on étudie leur répartition selon l’âge.
On a obtenu le tableau suivant :
Age 18
-MB
20 21 23 24
Effectifs 1 5 19 17 8
1) Quelle est la population étudiée ?
2) Préciser le caractère et sa nature.
3) Déterminer la moyenne des âges puis interpréter.
4) Déterminer le tableau des effectifs et fréquences (en pourcentge) cumulées croissants.
5) Déterminet le poucentage des étudiants dont l’âges est au plus égal à 21 ans.
Il est utilisé pour représenter les séries statistiques correspondant à un caractère quantitatif
à variable discrète ( si elle ne prend que des valeurs isolées, souvent entières ). Les bâtons sont
représentés par des segments de droite dont les longueurs sont proportionnelles :
- aux effectifs s’il s’agit d’un diagramme des effectifs,
- aux frÈquences s’il s’agit d’un diagramme des fréquences, - aux effectifs cumulés ( ECC ou
ECD ) s’il s’agit d’un diagramme des effectifs cumulés
Exemple :Le tableau ci-contre indique pour 130 entreprises le nombre de stagiaires par
entreprise. Dresser le diagramme à batons des effectifs.
Nombre de 1 2 3 4
Stagiaires
Nombre 40 45 30 15
d’entre-
prises
R
Polygones
Un polygone est associé à un diagramme à bâton et joint respectivement les sommets des
OU
bâtons
Exemple Déterminer le polygone des effectifs associé au tableau ci-dessous.
Nombre de 1 2 3 4 5 6
Stagiaires
Nombre 40 45 30 15 30 25
d’entre-
prises
-MB
0.3.2 Varaiable quantitative
Diagramme circulaire
Un diagramme qui a pour support disque découpé en secteurs. Chaque modalité est représentée
par un secteur dont l’aire est proportionnelle à l’effectif ou fréquence.
Il est utilisé pour la représentation d’un caractère qualitatif.
Remarque
Comme le rayon du disque est constant alors cela revient à dire que l’angle de chaque secteur
est proportionnel à l’effectif.
Exemple
Une enquête sur le niveau de satisfaction des usagers du transport en commun a donné les
résultats suivants
ISM
Niveau de satis- Pas satis- Peu satis- Assez Satisfait Très satis- trop satis-
faction fait fait satisfait fait fait
Effectifs 6 15 36 108 90 45
Angle au centre
Remarque
On peut aussi utiliser un diagramme semi-circulaire en prenant la place moitié d’un disque.
Dans un repËre plan, chaque modalité est représentée par une bande dont la hauteur est
égale à l’effectif de la modalité. Il est utilisé pour la représentation d’un caractère qualitatif.
Exemple : Faire le diagramme en barres avec l’exemple précédent.
R
repère d’axes orthogonaux, chaque classe est représentée par un rectangle dont :
- La base est proportionnelle à l’amplitude,
- La hauteur est telle que l’aire du rectangle est proportionnelle à l’effectif.
Exemple : On donne la répartition du personnel d’un hopital selon leur ancienneté :
OU
Ancienneté [0 ;5[ [5 ;10[ [10 ;15[ [15 ;20[ [20 ;30[ [30 ;35[
Effectifs 15 22 54 64 22 30
Réponse
Ancienneté [0 ;5[ [5 ;10[ [10 ;15[ [15 ;20[ [20 ;30[ [30 ;35[
Effectifs ni 15 22 54 64 22 30
Amplitude ai
Hauteur hi
-MB
Exemple : Reprendre le même exemple en considèrant le tableau suivant.
Ancienneté [0 ;5[ [5 ;15[ [15 ;20[ [20 ;30[ [30 ;35[ [35 ;40[
Effectifs 15 22 54 64 22 30
Réponse
Ancienneté [0 ;5[ [5 ;15[ [15 ;20[ [20 ;30[ [30 ;35[ [35 ;40[
Effectifs ni 15 22 54 64 22 30
Amplitude ai
Hauteur hi
Remarque
Lorsque toutes les classes ont la mm̂e amplitude, la hauteur d’une classe est égale l’effectif de
la classe(ou á la fréquence)
ISM
R
de ce chapitre.
OU
Définition
Soit X une variable discrète dont les modalités sont notées dans l’ordre croissant x1 , x2 , · · ·,
xp , d’effectifs respectifs n1 , n2 , · · ·, np et de fréquences respectives f1 , f2 , · · ·, fp .
La moyenne arithmétique, notée x est le réel défini par
n x + n 2 x2 + · · · + n p xp
∗ dans le cas d’une variable discrète x = 1 1
N
où N représente l’effectif total de la population.
On note également que x = f1 x1 + f2 x2 + · · · + fp xp les fi sont des fréquences.
-MB
n 1 c1 + n 2 c2 + · · · + n p cp
∗ dans le cas d’une variable continue, on a x =
N
les ci représentent les centres de classes.
En utilisant les fréquences ; on a x = f1 c1 + f2 c2 + · · · + fp cp
Interprétation
La moyenne est la valeur autour de laquelle tourne toutes les autres valeurs de la série.
Application
ISM
Exemple 1
Un sondage effectué auprès de 800 automobilistes a donné les résultats suivants
Dépenses mensuelles [30 ;70[ [70 ;110[ [110 ;150[ [150 ;190[ [190 ;230[ [230 ;270[
(en milliers de Francs)
Nombre d’automobilistes 62 156 264 148 98 72
Calculer la moyenne des dépenses mensuelles. Donnez-en une interprétation.
Exemple 2
La répartition des étudiants d’une classe, selon leur âges, est donnée par
18 - 20 - 17 - 17 - 17 - 16 - 20 - 18 - 18
18 - 19 - 19 - 19 - 18 - 18 - 18 - 19 - 18
18 - 18 - 17 - 16 - 16 - 17 - 20 - 17 - 17
Déterminer la moyenne puis donnez-en une interprétation.
0.4.2 Mode
Dans une enquête relative au moyen de transport, dans un groupe d’étudiants, on a obtenu
le tableau suivant
R
Moyens de transport Vélo Taxi train Moto A pied
Nombre d’élèves 7 10 2 5 6
Il est clair que dans ce cas on ne peut pas parler de moyenne. On pourra cependant se po-
ser la question de savoir quel est le moyen de transport le plus utilisé. C’est évidemment le taxi.
OU
On parle ainsi de mode.
Définition
Interprétation
Si l’on s’appui sur l’exemple précédent on peut dire, en terme d’interprétation, que la plu-
ISM
Applications
Exemple 1
Une enquête sur le niveau de satisfaction des usagers de la route a donné les résultats suivants.
Niveau de satisfaction Pas sa- Peu sa- Assez Satisfait Très sa- Trop sa-
tisfait tisfait satisfait tisfait tisfait
Effectif 6 15 36 108 90 45
Déterminer le mode et donnez-en une signification.
Exemple 2 La répartition des étudiants d’une classe, selon leur âges, est donnée par
18 - 20 - 17 - 17 - 17 - 16 - 20 - 18 - 18
18 - 19 - 19 - 19 - 18 - 18 - 18 - 19 - 18
18 - 18 - 17 - 16 - 16 - 17 - 20 - 17 - 17
Déterminer le mode puis donnez-en une interprétation.
R
Exemple 3
Revenons à l’exemple de dépenses mensuelles des automobilistes.
Dépenses mensuelles [30 ;70[ [70 ;110[ [110 ;150[ [150 ;190[ [190 ;230[ [230 ;270[
OU
(en milliers de Francs)
Nombre d’automobilistes 62 156 264 148 98 72
Déterminer la classe modale. Que constate-t-on ?
0.4.3 Médiane
Définition
On appelle médiane d’un caractère quantitatif la valeur qui laisse
autant d’observations à gauche que d’observations à droite
-MB
En d’autres termes c’est la valeur qui partage la population en deux groupes de mêmes effectifs
Méthode de détermination
∗ Cas discret
+ +1
2 2
l’observation de rang
2
Exemple 1
Soit la série de données : 4 − 4 − 5 − 6 − 6 − 7 − 8 − 8 − 9 − 9 − 10
Il s’agit d’une série d’effectif total impair. D’après la méthode de détermination, la médiane est
11 + 1
à la sixième position. C’est-à-dire l’observation de rang .
2
Exemple 2
On considère la série de données : 4 − 4 − 5 − 6 − 6 − 7 − 8 − 8 − 9 − 9 − 10 − 12
Ici l’effectif total est pair, 12. L’observation de rang six est 7 ; celle de rang sept est 8. Ainsi la
7+8
médiane est égale à = 7, 5
2
Exemple 3
Le tableau suivant indique pour 130 entreprises le nombre de stagiaires par entreprise.
Nombre de stagiaires 1 2 3 4
Nombre d’entreprises 45 40 30 15
Déterminer la médiane.
R
∗ Cas continu
OU
N
est le premier intervalle dont l’effectif cumulé croissant est au moins égal à dans le cas
2
des effectifs ou 50% dans le cas des fréquences.
Si l’on désigne par :Me la médiane,
Nm−1 l’effectif cumulé croissant correspondant à la classe [am−1 ; bm−1 [
Nm l’effectif cumulé croissant correspondant à la classe [am ; bm [
Alors une manière de déterminer la médiane consiste à appliquer la formule
Me − am b m − am
=
N Nm − Nm−1
-MB − Nm−1
2
Exemple
On donne la répartition du personnel d’un hopital selon leur ancienneté.
Ancienneté (ans) [0 ;5[ [5 ;15[ [15 ;20[ [20 ;30[ [30 ;35[ [35 ;40[
Effectif 15 22 54 64 22 30
Déterminer la médiane par calcul.
N
– Méthode graphique La médiane est l’abscisse du point d’ordonnée sur le polygone
2
des effectifs cumulés croissants ou alors l’abscisse du point d’ordonnée 50% sur le polygone
de fréquence cumulée croissantes.
ISM
Exemple
En considérant l’exemple précédant, déterminer la médiane par la méthode graphique.
Interprétation
Pour chacune des valeurs de la médiane trouvée, pour les exemples précédents, faire une
interprétation.
0.4.4 Quartiles
On distingue,
- Le premier quartile noté Q1 qui est la valeur laissant 25% des observations à gauche et 75%
des observations à droite.
- Le troisième quartile qui est la valeur qui laisse 75% des observations à gauche et 25% des
observations à droite.
Remarque
Il apparait donc d’après cette définition que le deuxième quartile est la médiane.
Exemple
Déterminer les quartiles des série statistique
R
Détermine les quartiles Q1 et Q3 de la série statistique suivante : 2 - 4 - 5 - 6 - 7 - 11 - 13 - 25
- 34 - 43 - 44 - 47 - 51
Réponse
1
L’effectif de la série est 13. Q1 est la valeur qui se trouve à la position × 13 = 3, 25. on arrodi
4
OU
par excès, soit la quatrième valeur de la série.
0.5.1 Etendue
L’étendue est la différence entre la plus grande et la plus petite valeur de la série. Elle
permet de rendre compte de la dispersion d’une série.
Une série est d’autant plus dispersée que son étendue est grande.
Exemple
On donne X : 10−30−30−50−50−70−70−90−90 et Y : 48−48−49−50−50−50−51−51−52
Les séries X et Y ont respectivement pour étendue 80 et 4.
On peut dire que la série X est plus dispersée que Y .
ISM
Remarque
L’étendue d’une série ne dépend que des valeurs extrémes de la série. Elle peut-être grande
sans que la série ne soit dispersée.Par conséquent, elle n’est pas souvent fiable pour mesurer la
dispersion.
0.5.4 Ecart-type
Soit X une variable discrète dont les mosalités sont notées dans l’ordre croissant x1 , x2 , · · ·,
xp , d’effectifs respectifs n1 , n2 , · · ·, np .
La variance notée v(X) est le réel positif, défini par
R
n1 x21 + n2 x22 + · · · + np x2p
v(X) = − (x)2
N
p
L’écart-typee noté σ(x) est défini par σ(x) = v(X).
OU
L’écart-type est très adapté, mesurant la dispersion autour de la moyenne, est très adapté pour
mesurer la dispersion. Une série est d’autant plus dispersée que son écart-type est grand.
Pour deux série données, la plus dispersée est celle qui a l’ecart-type le plus grand lorsqu’elles
sont exprimées dans la même unité.
Si elles ne sont pas exprimées dans la même unité, on compare leurs coefficient de variation qui
σ(X)
est défini par c(X) =
x
En général, une série est dite dispersée lorsque le c(X) dépasse 30%.
-MB
ISM