0% ont trouvé ce document utile (0 vote)
75 vues154 pages

Statistiques et Probabilités : Guide Complet

Le document présente un cours sur la statistique descriptive, abordant des concepts fondamentaux tels que la population, l'échantillon, les caractères qualitatifs et quantitatifs, ainsi que les méthodes de représentation des données. Il explique également comment organiser et analyser des données à l'aide de tableaux et de graphiques, en introduisant des notions comme l'effectif, la fréquence relative et les distributions statistiques. Enfin, des exercices pratiques sont proposés pour illustrer l'application de ces concepts.

Transféré par

yousraalawi8
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
75 vues154 pages

Statistiques et Probabilités : Guide Complet

Le document présente un cours sur la statistique descriptive, abordant des concepts fondamentaux tels que la population, l'échantillon, les caractères qualitatifs et quantitatifs, ainsi que les méthodes de représentation des données. Il explique également comment organiser et analyser des données à l'aide de tableaux et de graphiques, en introduisant des notions comme l'effectif, la fréquence relative et les distributions statistiques. Enfin, des exercices pratiques sont proposés pour illustrer l'application de ces concepts.

Transféré par

yousraalawi8
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Statistique et Probabilité

Professeures : I. SALHI & A. CHETOUANI


École Nationale de Commerce et de Gestion – Oujda
Années Préparatoires des Écoles Nationales de
Commerce et de Gestion
2024-2025
Semestre 2
Calendrier
Fin des cours : 3 Mai

Première 3 13-17
semaine 3 Février Devoir Examen
chapitres MAI

Note finale : (CC+CF)/2


Note CC : Devoir + Discipline (Présence effective +
Participation+ Préparation de TD…)
Chapitre1 : Séries statistiques simples

Généralités
Définition

La statistique descriptive est


un ensemble de méthodes
permettant de décrire et
d’analyser des données
(observations).
Son objectif est la connaissance
de l’état et de l’évolution d’un
phénomène donné.
L’analyse statistique consiste à
extraire l’information pertinente et
synthétique d’un ensemble
d’observations.
La statistique s’applique à la
plupart des disciplines :
économie, démographie, biologie,
la chimie … Partout où l’on
dispose de données!
Elle permet de :
De recueillir, de classer, de
présenter les données d’une
enquête ou d’une étude.
(Représentations en tableaux ou
par graphiques )
De traiter et analyser ces
données.
(Synthétiser les données sous
forme de paramètres :
moyenne, médiane, écart type
…)
De rechercher des liens entre
les données si l’étude est faite
sous l’angle de deux caractères.
Réaliser des prévisions
(Régression et corrélation)
D’interpréter, de critiquer les
données.
Tirer des conclusions logiques
Prendre des décisions qui
s’imposent à partir des
analyses effectuées. …
Terminologie
Population
C’est l’ensemble d’éléments sur
lesquels porte l’étude statistique
envisagée.
Ces éléments peuvent être des
êtres humains, des êtres vivants,
des objets.
Exemples
◼ Tous les élèves de l’ENCGO.
◼ Tous les salariés d’une entreprise.
◼ L’ensemble des ménages d’un quartier
◼ L’ensemble des voitures vendues en
2022
Echantillon
C’est un sous ensemble prélevé
de la population mère.
Pour des raisons du coût et du
temps, on est souvent amené à
faire l’étude statistique sur une
partie de la population.
Remarque
L’échantillon doit être représentatif.
Il doit posséder les mêmes
caractéristiques que l’ensemble de
la population
Définitions

▪ Recensement : étude de tous les individus


d’une population. Difficile à réaliser si la taille
des populations sont grandes pour des raisons
de coût et de temps.

▪ Sondage : étude effectuée sur l’échantillon. Le


recueil d’un échantillon à partir de la population
initiale se fait par des techniques statistiques,
appelées méthodes d’échantillonnage.
Individu ou unité statistique
C’est un élément quelconque
de la population ou de
l’échantillon.
Exemples
◼ Un étudiant de l’ENCGO;

◼ Une voiture vendue;


La taille

Elle représente le nombre


d’individus d’un échantillon
ou d’une population.
Le caractère ou variable
C’est l’aspect particulier que
l’on désire étudier.
Exemples
◼ Chiffre d’affaires

◼ Revenu

◼ Age

◼ Taille

◼ Nationalité …
Remarque
Un individu donné de la population
peut être étudié suivant un ou
plusieurs caractères.
Modalités d’un caractère

Ce sont les différentes


situations possibles d’un
caractère.
Exemples
◼ Soit le caractère Etat matrimonial.
Ses modalités sont :
Célibataire, Marié, Veuf, Divorcé.
◼ Soit le caractère Genre.

Ses modalités sont :


Féminin, Masculin
Remarques
◼ Un caractère peut présenter
plusieurs modalités.
◼ Un individu n’a qu’une modalité
et une seule d’un caractère.
Différents types de caractères
On distingue deux types de
caractères :
Caractère qualitatif
Caractère quantitatif
Caractère qualitatif :
Un caractère est dit qualitatif si ses
différentes modalités ne sont pas
mesurables (ne sont pas représentées
par des nombres)

Exemples
◼ Genre : masculin, féminin

◼ Nationalité : marocaine, camerounaise,


française, ….
Caractère qualitatif nominal
Le caractère est dit qualitatif
nominal lorsque les modalités ne
peuvent pas être ordonnées.

Exemples
◼ Secteur d’activité

◼ Marque des voitures


Caractère qualitatif ordinal
Le caractère est dit qualitatif
ordinal si les modalités peuvent
être ordonnées.

Exemple
◼ Diplômes obtenus

◼ Niveaux d’étude
Caractère quantitatif :
Un caractère est dit quantitatif si
ses différentes modalités sont
mesurables. (sont numériques)

Exemple
◼ Nombre d’enfants par ménage : 0, 1, 2, 3, 4, …
◼ Salaire mensuel (en DH) : 4500, 5000, 8000, …
◼ ….
Remarque
Le caractère quantitatif peut être:
discret ou continu
Caractère discret
Un caractère est dit discret, si ces
modalités sont dénombrables.

Exemple
▪ Nombre d’enfant par ménage.
▪ Le nombre de pièces d’un appartement.
▪ Le nombre de chèque impayés.
Caractère continu
Un caractère est dit continu, s’il
peut prendre n’importe quelle
valeur dans un intervalle donné de
nombres réels.
Exemple
▪ Chiffre d’affaires
▪ Salaire
▪ Poids
▪ …
Remarque
◼ Le caractère peut être appelé :
variable statistique.
◼ Dans ce cas, les différentes
modalités de ce caractère sont
appelées : valeurs de la variable
statistique.
Classe
Les valeurs des variables statistiques
continues sont généralement regroupées en
des intervalles appelés classes.
Pour chaque classe, on peut définir :
◼ Une limite inférieure : lim inf

◼ Une limite supérieure : lim sup

◼ L’amplitude de la classe = lim sup – lim inf

◼ Centre de la classe = (lim sup + lim inf)/2


Série statistique
◼ On appelle série statistique la suite
des valeurs prises par une variable
X sur les unités d’observation.
◼ Les valeurs (observations) de la
variable X sont notées par : o1, . . . ,
oi, . . . , on où n est le nombre total
des observations.
Exemple
◼ On s’intéresse à la variable "Etat civil "
notée X et à la série statistique des
observations prises par X sur 40
personnes.
◼ Considérons la codification des modalités
suivantes :
❑ C : célibataire
❑ M : marié
❑ V : veuf
❑ D : divorcé
◼ Les 40 observations collectées
constituant notre série statistique sont :
MMDCCMCCDCMCCMCDCCCD
CMCCDCMCCMDVMVDCDCCM
◼ On n a:
❑ o1 = M, première observation
❑ o2 = M, deuxième observation
❑ o3 = D, …
❑ o4 = C, …
❑ . . . .,
❑ o40 = M, la 40ième observation
Exercice

Déterminer la population étudiée dans les cas


suivants:

❑ On s’interroge par sur la situation socioéconomique


des marocains.
❑ Étudier les performances des employés d’une

entreprise.
❑ Étudier le taux de croissance du PIB des pays
africaines au fils du temps
❑ Étudier le profit des startups marocaines.
Exercice
Déterminer le type, la nature et les modalités de
chaque caractère :
❑ Nombre de personnes par ménages
❑ Secteur d’activité des entreprises.
❑ Degré de satisfaction d’un service (non-peu-très satisfait)
❑ Taux de croissance du PIB (Produit intérieur brut)
❑ Profit
❑ Opinion (d’accord oui/non)
❑ Les formes de contrat de travail
Chapitre1 : Séries statistiques simples

Distributions statistiques
et représentations
graphiques

1
Introduction

L’objectif de ce chapitre est de


déterminer comment on présente
l’information pour qu’elle soit
lisible et compréhensible.

2
Introduction
Généralement cette représentation
peut prendre deux formes :
Un tableau
Un graphique

3
Représentation en tableaux
statistiques

Soit X un caractère.
Notons par xi ses modalités.

4
Définition : Notion d’effectif ou de
fréquence absolue

On appelle effectif (ou fréquence absolue)


d’une modalité xi donnée, le nombre
d’individus possédant cette modalité.

5
L’effectif d’une modalité xi est noté
par ni
La somme des effectifs ni est égal
alors à l’effectif total n (taille) de la
population ou de l’échantillon.
r
n =  ni
i=1

Où r est le nombre de modalités xi

6
Définition : Notion de tableau
statistique
Les effectifs ni et les modalités xi peuvent
être regroupés dans un tableau appelé :
Tableau statistique ou
Série statistique ou
Distribution statistique

7
Ce tableau est dit :
A une seule dimension si on retient
un seul caractère.
A plusieurs dimensions si on en
retient plusieurs.

8
Exemple : Tableau statistique à une seule
dimension
Une étude statistique selon le caractère «Etat
matrimonial» des 40 salariés d’une entreprise a
fourni les informations suivantes :
◼ Population : tous les salariés de l’entreprise

◼ Taille : 40

◼ Individu statistique : un salarié

◼ Caractère étudié : état matrimonial

◼ Modalité : Célibataire (20 salariés), Marié (10),


Divorcé (8), Veuf (2).

9
On peut alors représenter ces informations dans
le tableau statistique suivant :

Modalités (xi) Effectifs (ni)


Célibataire 20
Marié 10
Divorcé 8
Veuf 2
Total 40
(20, 10, 8 et 2 sont des observations, on trouve 20 Célibataires, 10 Mariés ….
dans l’entreprise)

10
Exemple : Tableau statistique à deux
dimensions
Ajoutons à notre étude statistique le caractère « Genre »

Modalités Homme Femme Total marginal


Célibataire 12 8 20
Marié 4 6 10
Divorcé 3 5 8
Veuf 0 2 2
Total marginal 19 21 40

(On verra plus de détail sur les distributions à deux caractères dans le chp3).

11
Notion d’effectifs cumulés croissants
et décroissants
Dans le tableau statistique à une seule
dimension, on peut ajouter deux autres
colonnes qui contiennent les effectifs
cumulés croissants et décroissants.

12
Exemple :
Le tableau statistique suivant représente la répartition par
classe d’âge (en années) des 60 salariés d’une entreprise X :

Classe d’âge (xi) Effectif (ni)

[20 – 25[ 10

[25 – 35[ 20
[35 – 50] 30
Total 60

13
Exemple :
Le tableau statistique suivant représente la répartition par
classe d’âge (en années) des 60 salariés d’une entreprise X :

Classe d’âge (xi) Effectif (ni) E. C. C.

[20 – 25[ 10 10

[25 – 35[ 20 30
[35 – 50] 30 60
Total 60 -

14
Exemple :
Le tableau statistique suivant représente la répartition par
classe d’âge (en années) des 60 salariés d’une entreprise X :

Classe d’âge (xi) Effectif (ni) E. C. C. E. C. D.

[20 – 25[ 10 10 60

[25 – 35[ 20 30 50
[35 – 50] 30 60 30
Total 60 - -

15
Interprétation
Colonne des effectifs ni
Colonne des effectifs cumulés
croissants E.C.C.
Colonne des effectifs cumulés
décroissants E.C.D.

16
Notion de fréquence relative : fi

Afin de comparer des séries


statistiques, il est souhaitable de
ramener l’effectif total n à une somme
égale à 100 % des observations.
Ainsi, les effectifs des différentes
modalités seront remplacés par des
pourcentages appelés fréquences
relatives.

17
Notion de fréquence relative : fi
La fréquence relative, notée fi, de la
modalité xi est définie par le rapport
ni
fi =
n

▪ ni est l’effectif des individus possédant la
modalité xi
▪ n est la taille de la population ou de
l’échantillon.

18
Remarque
Souvent, on exprime la fréquence relative
en pourcentage :

ni
f i % = * 100
n

19
Notion de fréquences relatives
cumulées croissantes et décroissantes
Leur calcul se fait de la même façon que
celui des effectifs cumulés croissants et
décroissants.

Exercice
Calculer les fréquences relatives et les
fréquences relatives cumulées croissantes et
décroissantes de la distribution précédente.

20
Répartition par classe d’âge (en an) des 60 salariés d’une
entreprise X :
Classe d’âge Effectif
(xi) (ni)

[20 – 25[ 10

[25 – 35[ 20
[35 – 50] 30
Total 60

21
Répartition par classe d’âge (en an) des 60 salariés d’une
entreprise X :
Classe d’âge Effectif F.R.
(xi) (ni) (en%)

[20 – 25[ 10 16.67

[25 – 35[ 20 33.33


[35 – 50] 30 50
Total 60 100

22
Répartition par classe d’âge (en an) des 60 salariés d’une
entreprise X :
Classe d’âge Effectif F.R. F.R.C.C .
(xi) (ni) (en%) (en %)

[20 – 25[ 10 16.67 16.67

[25 – 35[ 20 33.33 50


[35 – 50] 30 50 100
Total 60 100 -

23
Répartition par classe d’âge (en an) des 60 salariés d’une
entreprise X :
Classe d’âge Effectif F.R. F.R.C.C . F.R .C.D.
(xi) (ni) (en%) (en %) (en %)

[20 – 25[ 10 16.67 16.67 100

[25 – 35[ 20 33.33 50 83.33


[35 – 50] 30 50 100 50
Total 60 100 - -

24
Interprétation
Colonne des fréquences relatives fi
Colonne des fréquences relatives
cumulées croissantes F.R.C.C.
Colonne des fréquences relatives
cumulées décroissantes F.R.C.D.

25
Représentation en graphiques
Les graphiques constituent un
modèle de présentation des données
statistiques sous formes de modèles
géométriques.
Ils synthétisent de façon visuelle et
immédiate les phénomènes étudiés.
La représentation graphique dépend
du type du caractère étudié.
26
Caractère qualitatif

De nombreuses représentations
peuvent être utilisées. Les plus
classiques sont :
◼ Les tuyaux d’orgues (ou diagramme
en barres, ou diagramme à bandes)
◼ Les diagrammes à secteurs (ou
camemberts) : graphiques
circulaires.
27
Les tuyaux d’orgue
Dans ce type de graphique :
◼ On place les modalités xi sur une droite
horizontale (non orienté!).
◼ On place les effectifs ni (ou les
fréquences fi) sur un axe vertical.
◼ La hauteur de chaque tuyau
représentant une modalité xi est
proportionnelle à l’effectif ni (ou fi).

28
Exemple
Le tableau suivant donne le nombre de
participants aux activités sportives universitaires
selon leur appartenance aux établissements de
l’UMP :
Modalités Effectif
xi ni
ENCG 80
ENSA 140
EST 30
FS 100
FSJES 130

29
On a :
◼ Population étudiée : les étudiants participants
aux activités sportives de l’UMP
◼ Taille : 480
◼ Caractère étudié : L’appartenance à un
établissement de l’université
◼ Individu : un participant
◼ Modalités : ENCG, ENSAO, EST, FS, FSJES

30
31
Remarques :
◼ L’ordre dans lequel sont présentés les
tuyaux d’orgue n’a pas d’importance.
◼ Il est préférable de laisser un espace
entre les tuyaux

32
Diagramme à secteurs
Dans ce type de graphique :
◼ L’effectif total est représenté par un
disque.
◼ Chaque modalité est représentée par un
secteur circulaire dont la surface est
proportionnelle à l’effectif ni (ou la
fréquence fi) correspondant.

33
34
Caractère quantitatif
Dans le cas d’une variable statistique,
on peut utiliser deux types de
représentations graphiques :
◼ Le diagramme différentiel
(Histogramme, diagramme en bâtons)
◼ Le diagramme cumulatif

35
Cependant il est nécessaire de
distinguer entre variable
continue ou discrète

36
Variable continue
Diagramme différentiel :
l’histogramme
❑ C’est un ensemble de rectangle
contigus.
❑ Chaque rectangle est associé à une
classe (modalité xi) et a une surface
proportionnelle à l’effectif ni (ou la
fréquence fi) de cette classe.
37
Attention !
Avant de tracer un
histogramme, il faut
distinguer si les classes
sont d’amplitudes égales ou
inégales

38
Classe d’amplitudes égales :
Ce cas ne pose aucune
difficulté ;
Il suffit de reporter sur l’axe
des ordonnées les ni (ou les fi)

39
Classe d’amplitudes inégales:
Dans ce cas on reporte sur l’axe
des ordonnées la densité di
définie par :
𝐧𝐢
𝐝𝐢 =
𝐚𝐢
où ni et ai sont resp. l’effectif et
l’amplitude de la classe xi.

40
Exemple1
◼ Le tableau suivant représente les notes
obtenues à un examen par des étudiants :

Notes Nbre des


xi étudiants ni
[0, 4[ 10
[4, 8[ 20
[8, 12[ 50
[12, 16[ 40
[16, 20] 20

41
Nombre des étudiants
60

50

40

30

20

10

0
[0, 4[ [4, 8[ [8, 12[ [12, 16[ [16, 20[

42
Exemple2
Le tableau suivant représente la répartition d’une population
de 1000 individus selon leur âge.
Tracer l’histogramme correspondant à cette série.
Age xi Nbre des individus ni
[0, 10[ 120
[10, 15[ 100
[15, 20[ 140
[20, 30[ 200
[30, 40[ 180
[40, 60[ 160
[60, 80] 100

43
On a :

Age xi ni ai di
[0, 10[ 120 10 12
[10, 15[ 100 5 20
[15, 20[ 140 5 28
[20, 30[ 200 10 20
[30, 40[ 180 10 18
[40, 60[ 160 20 8
[60, 80] 100 20 5
Total 1000 - -

44
Variable continue
Diagramme cumulatif : courbe
cumulative
On porte sur :
❑ l’axe des abscisses les limites
supérieures (ou inférieures) des
classes.
❑ l’axe des ordonnées, les fréquences
relatives cumulées (ou effectifs
cumulés).
45
Exercice
En utilisant les données de l’exemple 2 :
◼ Calculer les fréquences relatives

◼ Calculer les fréquences relatives


cumulées croissantes et décroissantes
◼ Tracer les courbes cumulatives croissante
et décroissante.

46
fi cumm fi cum
Age xi ni ai di fi en % lim sup lim inf
croi en % decroi en %

[0, 10[ 120 10 12 12 12 100 10 0

[10, 15[ 100 5 20 10 22 88 15 10

[15, 20[ 140 5 28 14 36 78 20 15

[20, 30[ 200 10 20 20 56 64 30 20

[30, 40[ 180 10 18 18 74 44 40 30

[40, 60[ 160 20 8 16 90 26 60 40

[60, 80] 100 20 5 10 100 % 10 80 60

Total 1000 - - 100 ordonnée ordonnée abscisse abscisse

47
répartition d’une population de 1000 individus selon leur âge :
100
%
90

80

70

60

50

44
40
36
30

20

10
An
0
0 10 20 30 40 50 60 70 80 90

fréquences cumulées croissantes fréquences cumulées décoissantes

48
Variable discrète
Diagramme différentiel : le
diagramme en bâtons
❑ On porte sur l’axe des abscisses les
valeurs discrètes du caractère.
❑ On porte sur l’axe des ordonnées les
effectifs ni (ou les fi).
❑ Puis, on trace des bâtons verticaux
dont la longueur est proportionnelle
aux ni (ou aux fi).
49
Exemple
◼ Le tableau suivant donne la répartition des
ménages d’une population suivant le
nombre d’enfants :
Nbre Nbre de
d’enfants xi ménages ni
0 480
1 1872
2 884
3 186
4 ou plus ≈ 4 18
50
Répartition des ménage selon le
Effectif
nombre d'enfants
2000

1500

1000

500

0 Nombre d’enfants
0 1 2 3 4
Variable discrète
Diagramme cumulatif ou courbe
cumulative

◼ On a les résultats suivant concernant


l’exemple précédent :

52
xi ni fi Fi CC %

0 ≈ [0, 1[ 480 13,95 13,95


1 ≈ [1, 2[ 1870 54,42 68,37
2 ≈ [2, 3[ 884 25,7 94,07
3 ≈ [3, 4[ 186 5,41 99,48
4 ≈ [4, n[ 18 0,52 100
Total 3440 100%

53
Remarque

◼ Le caractère étant discret, la dernière modalité


(4 et plus) sera assimilée à la modalité 4.
◼ On a par exemple :
❑ 68,37 % des individus ont moins de deux
enfants.
❑ 99,48 % des individus ont moins de quatre

enfants.

54
F(x) Diagramme des fréquences relatives cumulées croissantes en %
100
100 99,48
<
94,07
<
80
68,37
<
60

40

20 13,95
<
0 < Nbre d’enfants
0 1 2 3 4 5
Chapitre1 : Séries statistiques simples

Les indicateurs
statistiques

1
Introduction
Les représentations graphiques des
séries statistiques permettent de :
Donner une première synthèse des
informations contenues dans des
tableaux statistiques.
Visualiser l’aspect général du
phénomène étudié.

2
Cependant, elles restent insuffisantes :

si on veut mieux synthétiser les


séries statistiques.
si on veut effectuer des
comparaisons entre plusieurs
séries statistiques.

3
L’objectif de cette section est de
présenter des paramètres numériques
pour mieux synthétiser une série
statistique.

Ces paramètres sont appelés :

Indicateurs ou caractéristiques d’une


série statistique

4
Les caractéristiques d’une série
peuvent être classées en trois
catégories:

Les indicateurs de tendance


centrale ou de position.
Les indicateurs de dispersion.
Les indicateurs de forme.

5
Section A
Les indicateurs de
tendance centrale

6
Le mode : Mo
Définition
On appelle mode d'un caractère
qualitatif ou quantitatif toute
modalité ayant le plus grand
effectif (ou la plus grande
fréquence relative)

7
Exemple : caractère qualitatif
Soit la série suivante décrivant l’état
civil d’un échantillon :
(M,C,V,M,C,M,D,C,M,M)
On a Mo = M.
M est la modalité la plus fréquente.

8
Cas d’un caractère quantitatif
Pour déterminer le mode, on doit
distinguer les deux cas : variable
discrète ou variable continue.

9
Cas d’une variable discrète:
Le Mode correspond à la valeur xi
qui a :
L’effectif ni (ou la fréquence fi)
le plus élevé dans un tableau
statistique.
Le plus haut bâton dans un
diagramme en bâtons.

10
Cas d’une variable continue:
Il s’agit d’une classe où ni (ou fi) est
le plus grand.
Cette classe est appelée : classe
modale
Le mode Mo appartient forcément à
cette classe.
Mo est donné par le centre de la
classe modale.

11
Attention !
Il faut distinguer :
Si les classes sont d’amplitudes
égales : on retient les ni ou les fi.
Si les classes sont d’amplitudes
inégales: on retient les di. Dans ce
cas la classe modale est donnée par
celle qui a la plus grande densité.

12
Remarques:
Une série statistique peut avoir un
ou plusieurs modes. Elle est dite:
Série unimodale si elle possède un
seul mode.
Série bimodale si elle en possède
deux.
Série multimodale si elle en
possède trois ou plus.

13
La médiane : Me
Définition1
La médiane d’une série statistique
classée par ordre croissant est la
valeur du caractère (modalité) qui
partage les observations en deux
parties du même effectif.

14
Définition2
Me est la valeur d’une variable
quantitative telle que :
50% des individus ont des valeurs
du caractère inférieures à Me et
50% des individus ont des valeurs
du caractère supérieures à Me.

15
Calcul du Me
Pour calculer la médiane, on doit
distinguer les deux cas :
❑ variable discrète
❑ variable continue.

16
Cas d’une variable discrète :
Si le nombre des observations n est
impair (n=2p+1) alors la médiane
correspond à la (p+1)ème valeur de la série
ordonnée.
Exemple:
Soit la série des notes :
8,17,5,12,16,9,4,10,13
On classe d’abord la série :
4,5,8,9 ,10, 12,13,16,17
La médiane Me = 10
17
Si le nombre des observations n est pair
(n=2p), alors la médiane est donnée par le
centre d’un intervalle dit intervalle médian
dont les extrémités sont la pème et la
(p+1)ème valeurs de la série ordonnée.
Exemple:
Soit la série des notes : 10,15,8,9,12,6,14,11
On classe d’abord la série :
6,8,9, 10,11, 12,14,15
L’intervalle médian est [10, 11]
Donc Me = 10,5
18
Cas d’une variable continue :
Dans ce cas, le calcul de la médiane
se fait en trois étapes :
1. Déterminer le rang de la médiane;
2. Déterminer la classe médiane;
3. Calculer la valeur Me.

Procédons par un exemple :

19
Exemple
Le tableau suivant représente les salaires
journaliers des ouvriers d’une usine.
Salaires journaliers Effectifs cumulés
Effectifs ni
xi (en Dh) croissants
[50, 60[ 9 9
[60, 70[ 25 34
[70, 80[ 32 66
[80, 100[ 16 82
Total 82

Calculons la médiane de cette série.

20
Etape 1 : Déterminer le rang de la
médiane

◼ Le rang de la médiane est donné


par r = n/2.
◼ Dans notre exemple, on a : r = 41
◼ Donc la médiane correspond au
salaire du 41éme ouvrier.

21
Etape 2 : Déterminer la classe
médiane
▪ On utilise la colonne des effectifs
cumulés croissants.
▪ En effet, il s’agit de trouver la classe
à laquelle appartient le salaire j du
41iéme ouvrier. Pour cela, on classe
les individus par ordre croissant des
salaires ce qui revient à calculer la
colonne des effectifs cumulés.
22
Dans notre exemple on a :
• 34 ouvriers perçoivent moins de 70 Dh/j
• 66 ouvriers perçoivent moins de 80 Dh/j
• Donc le 41iéme ouvrier perçoit un salaire
journalier compris entre 70 et 80 Dh/j.

D’où la classe médiane est : [70,80].


Et Me  [70,80].

23
Etape 3 : Calculer la médiane
Me est calculée en utilisant la formule suivante:

Où:
• L1 est la borne inférieure de la classe médiane
• L2 est la borne supérieure de la classe médiane
• r est le rang de la médiane
• Eff cum(L1) est l’effectif cumulé correspondant à la classe
précédant la classe médiane
• Eff cum(L2) est l’effectif cumulé correspondant à la classe
médiane

24
Dans notre exemple, on a :
L1 = 70 ; L2 = 80 ; r = 41 ;
Eff cum(L1) = 34 ; Eff cum(L2) = 66

En appliquant la formule, on trouve:


Me = 72,19 Dh/j
Interprétation
On peut conclure que 41 ouvriers perçoivent
un salaire journalier ≤ à 72,19 Dh et 41
ouvriers perçoivent un salaire journalier ≥ à
72,19 Dh.
25
Remarque importante :
Souvent dans les calculs, on utilise les
fréquences relatives fi (en%) au lieu des
effectifs ni
Donc la formule pour calculer Me devient :

Exercice
Calculer la médiane de la série précédente en
utilisant les fréquences relatives.
26
Les quartiles
Définition
Ce sont les trois valeurs du caractère
qui partagent la population en quatre
sous populations de même effectif.
On les note par Q1, Q2 et Q3

27
Le 1er quartile Q1 est la valeur de la
série telle que 25% des observations
sont inferieures à Q1.
Le 2ème quartile Q2 est la valeur de la
série telle que 50% des observations
sont inferieures à Q2. On a : Q2 = Me.
Le 3ème quartile Q3 est la valeur de la
série telle que 75% des observations
sont inferieures à Q3.
28
Calculer des quartiles pour une variable
continue:

On les calcule de la même façon que la médiane :


 α % − F(Linf ) 
Qi = L inf + (Lsup − L inf )  
 F(L ) − F(L ) 
 sup inf 
• α % est le pourcentage associé au quartile Qi
• Pour 𝑄1 par exemple 𝛼 = 25%
• Linf et Lsup sont les limites inferieures et supérieures de la classe
correspondant à α %
• F(Linf) est la fréquence relative cumulée croissante qui précède la
classe du quantile.
• F(Lsup) est la fréquence relative cumulée croissante de la classe du
quantile.
29
Exemple

◼ Calculer le quartile 𝑸𝟏 de la série statistique


suivante puis interpréter.

Salaires journaliers
Effectifs ni
xi (en Dh)
[50, 60[ 9
[60, 70[ 25
[70, 80[ 32
[80, 100[ 16
Total 82

30
Exemple

Salaires
Effectifs Fréquences
journaliers xi (en FCC
ni
Dh) 𝒇𝒊 %
[50, 60[ 9 11 11
[60, 70[ 25 30,5 41,5
[70, 80[ 32 39 80,5
[80, 100[ 16 19,5 100
Total 82 100 __

Classe contenant
11% ≤ 25% ≤ 41,5%
le quartile 1

31
Exemple

◼ 𝑸𝟏 appartient à la classe [60, 70]


◼ 𝜶 = 𝟐𝟓%
◼ On remplace dans la formule

 α % − F(Linf ) 
Qi = L inf + (Lsup − L inf )  
 F(L ) − F(L ) 
 sup inf 

𝟐𝟓%−𝟏𝟏%
◼ 𝑸𝟏 = 𝟔𝟎 + 𝟕𝟎 − 𝟔𝟎 = 𝟔𝟒, 𝟔
𝟒𝟏,𝟓%−𝟏𝟏%
◼ 25% des ouvriers reçoivent moins de 64,6 DH/J.

32
Moyenne arithmétique : X
Définition
La moyenne arithmétique d’une série
statistique est égale au rapport de la somme
des valeurs observées par le nombre total
d’observations.
Une moyenne arithmétique est dite simple
ou non pondérée si à chaque valeur xi ne
correspond qu’une seule observation. On a :
1 n
X =  xi
n i =1
33
Exemple

Soit une classe de 10 étudiants. Les notes


obtenues dans une matière sont :
11-14-7-10,5-12-10-15-9-16-13
On a alors :
n
1 1 117,5
X = ෍ xi = 11 + 14 + 7 + 10,5 + 12 + 10 + 15 + 9 + 16 + 13 =
n 10 10
i=1
X = 11,75

34
Une moyenne arithmétique est dite
pondérée si à chaque valeur xi peuvent
correspondre ni observations. On a :

1 p p
X =  nixi avec  n i = n
n i=1 i =1

Où p est le nombre de modalités xi observées.

35
Exemple
Soient les notes suivantes : 8-10-10-13-14-10-14-13-9-8.
Le tableau statistique correspondant à cette série est :
Notes Effectifs ni*xi
On a alors :
xi ni
8 2 16 1 p
X =  nixi
9 1 9 n i =1
10 3 30
= (16 + 9 + 30 + 26 + 28)
1
13 2 26
10
14 2 28
X = 10,9
Total 10 109

36
Calcul de la moyenne arithmétique dans
le cas d’une variable statistique continue

Dans ce cas, on utilise la formule suivante :

p
1
X =  n i x ic
n i =1
Où xic représente le centre de la classe d’effectif ni

37
Exemple
Répartition des salaires journaliers (S. J.) des
ouvriers d’une usine.

S. J. ni xic ni*xic On a alors :


[50,60[ 9 55 495 p
1 5960
[60,70[ 25 65 1625 X =  n i x ic =
[70,80[ 32 75 2400 n i =1 82
[80,100[ 16 90 1440 X = 72,68
Total 82 5960

On peut conclure que 72,68 Dh est le salaire


journalier moyen des 82 ouvriers de l’usine

38
Remarques
La moyenne arithmétique peut être calculée
en utilisant les fréquences relatives fi. On a :
1 p p
ni
X =  n i x ic =  x ic
n i =1 i =1 n
p
X =  f i x ic
i =1

Il existe d’autres types de moyennes :


moyenne géométrique, moyenne harmonique
et moyenne quadratique (voir annexe)

39
Section B
Les indicateurs de
dispersion

40
Introduction
Les indicateurs de Dispersion mesurent la
variabilité ou l'étalement des données autour
d'une valeur centrale (comme la moyenne ou
la médiane).
Ils permettent de comprendre à quel point les
données sont dispersées ou concentrées.
Ils permettent aussi de comparer des séries
statistiques de même nature.

41
Variance; Ecart-type;
Coefficient de variation
Ce sont les indicateurs les plus
utilisés pour mesurer la dispersion
des données d’une série autour de
leur moyenne.
Ces paramètres sont liés entre eux.

42
La variance : V
C’est la moyenne arithmétique des carrés des écarts entre les
valeurs du caractère et la moyenne arithmétique. On a :
𝐩 𝐩
𝟏
𝐕 = ෍ 𝐧𝐢 (𝐱 𝐢 − 𝐱)𝟐 = ෍ 𝐟𝐢 (𝐱 𝐢 − 𝐱)𝟐
𝐧
𝐢=𝟏 𝐢=𝟏

De cette formule, on peut déduire la formule simplifiée


de V : 𝐩 𝐩
𝟏 𝟐 𝟐
𝐕 = ( ෍ 𝐧𝐢 𝐱 𝐢𝟐 ) − 𝐱 = (෍ 𝐟𝐢 𝐱 𝐢𝟐 ) − 𝐱
𝐧
𝐢=𝟏 𝐢=𝟏

Dans le cas d’une variable continue cette formule devient :


𝐩 𝐩
𝟏 𝟐 𝟐
𝐕 = ( ෍ 𝐧𝐢 𝐜𝐢𝟐 ) − 𝐱 = (෍ 𝐟𝐢 𝐜𝐢𝟐 ) − 𝐱
𝐧
𝐢=𝟏 𝐢=𝟏

43
Remarque
Plus la variance est élevée plus la dispersion
autour de la moyenne est élevée.
Puisque les écarts à la moyenne ont été
élevés au carré, la valeur de V est
généralement assez élevée.

44
L’écart type : σ
C’est la racine carrée de la variance. On a :

σ= V

Si σ est faible, on peut conclure que les


valeurs sont assez concentrées autour de la
moyenne.
Si σ est élevé, on peut conclure que les
valeurs sont plus dispersées autour de la
moyenne.
45
Remarques
L’écart-type est un outil intéressant pour
mesurer la dispersion d’une série autour
de la moyenne.
Il est exprimé dans l’unité de la variable
dont il mesure la dispersion des valeurs.
On ne peut pas l’utiliser pour comparer
la dispersion de deux séries exprimées
dans des unités différentes.

46
Coefficient de variation : CV
C’est un paramètre sans dimension. Il est égal
à l’écart-type divisé par la moyenne:

V 
CV = =
x x
Le coefficient de variation est généralement
utilisé pour comparer la dispersion de deux
séries.
Plus la valeur du coefficient de variation est
élevée, plus la dispersion autour de la moyenne
est grande.
47
Ecart absolu moyen,
Ecart absolu médian
L'écart absolu moyen est la moyenne de
la valeur absolue des écarts à la moyenne.
Autrement dit, c'est la distance moyenne à
la moyenne.
𝒏
𝟏
𝑬𝑨𝑴 = ෍ |𝒙𝒊 − 𝒙 ഥ|
𝒏
𝒊=𝟏

48
Ecart absolu moyen,
Ecart absolu médian
On peut calculer de la même manière
l'écart absolu médian qui est la moyenne
des écarts à la médiane.

𝒏
𝟏
𝑬𝑨𝑴𝒆 = ෍ |𝒙𝒊 − 𝑴𝒆|
𝒏
𝒊=𝟏

49
Section C
Les indicateurs de
forme

50
Introduction
En plus des indicateurs de dispersion et
de tendance centrale, on peut décrire
une variable statistique en caractérisant
la forme de sa distribution c-à-d l’allure
de la courbe des fréquences.

Les indicateurs de forme donnent une


idée sur l’asymétrie et l’aplatissement
d’une distribution.
51
Asymétrie
Une distribution est symétrique : 𝑴𝒆 =
𝒙 = 𝑴𝒐
Une distribution asymétrique à droite :
𝑴𝒐 < 𝒙 < 𝑴𝒆
Une distribution asymétrique à gauche :
𝑴𝒐 > 𝒙 > 𝑴𝒆

52
Coefficient d’asymétrie
skewness
1 𝑘
𝜇3 σ𝑖=1 𝑛𝑖 (𝑥𝑖 −𝑥ҧ )3
𝑛
Cas pondéré : 𝛾1 = =
𝜎3 𝜎3
1 𝑛
𝜇3 σ𝑖=1(𝑥𝑖 −𝑥ҧ )3
𝑛
Cas non pondéré : 𝛾1 = =
𝜎3 𝜎3
Interprétations :
Si 𝛾1 < 0, la distribution est asymétrique (étalée) à
gauche.
Si 𝛾1 = 0, la distribution est symétrique.

Si 𝛾1 > 0, la distribution est asymétrique (étalée) à droite.

53
Exemple

Une enquête a été mené auprès de1500 ménages d’une


région rurale par rapport à leurs nombres d’enfants. Le
tableau suivant correspond à la distribution observée du
nombre d’enfants des ménages:
Nombre 1 2 3 4 5 6 7 8 Total
d’enfants

Effectifs 380 455 245 230 100 75 10 5 1500

Calculer le coefficient d’asymétrie puis interpréter.

54
Exemple

𝒙𝒊 𝒏𝒊 𝒙 𝒊 𝒏𝒊 ഥ
𝒙𝒊 − 𝒙 ഥ)𝟑
(𝒙𝒊 − 𝒙 ഥ)𝟑
𝒏𝒊 (𝒙𝒊 − 𝒙

1 380 380 -1.67 -4.65 -1767


2 455 910 -0.67 -0.33 -136.5
3 245 735 0.33 0.03 7.35
4 230 920 1.33 2.35 540.5
5 100 500 2.33 12.65 1265
6 75 450 3.33 36.92 2769
7 10 70 4.33 81.18 811.8
8 5 40 5.33 151.42 757.1
Total 1500 4005 4247.25

55
Exemple

𝒙𝒊 𝒏𝒊 𝒙 𝒊 𝒏𝒊 ഥ
𝒙𝒊 − 𝒙 ഥ)𝟐
(𝒙𝒊 − 𝒙 ഥ)𝟐
𝒏𝒊 (𝒙𝒊 − 𝒙

1 380 380 -1.67 2.79 1060.2


2 455 910 -0.67 0.45 204.75
3 245 735 0.33 0.11 26.95
4 230 920 1.33 1.77 407.1
5 100 500 2.33 5.43 543
6 75 450 3.33 11.09 831.75
7 10 70 4.33 18.75 187.5
8 5 40 5.33 28.41 142.05
Total 1500 4005 3403.3

56
Coefficient d’asymétrie
skewness
1 𝑘
𝜇3 σ𝑖=1 𝑛𝑖 (𝑥𝑖 −𝑥ҧ )3
𝑛
Cas pondéré : 𝛾1 = = = 0.83
𝜎3 𝜎3
4247.25 4005
Où : 𝜇3 = = 2.83, 𝑥ҧ = = 2.67
1500 1500

3403
Et 𝜎 = = 1.5
1500

La distribution du nombre d’enfants des1500


ménages de cette région est étalée à droite.

57
Aplatissement

58
Coefficient d’aplatissement
1 𝑘
𝜇4 σ𝑖=1 𝑛𝑖 (𝑥𝑖 −𝑥ҧ )4
𝑛
Cas pondéré : β1 = =
𝜎4 𝜎4
1 𝑛
𝜇4 σ𝑖=1(𝑥𝑖 −𝑥ҧ )4
𝑛
Cas non pondéré : β1 = =
𝜎4 𝜎4
Interprétations :
Si β1 > 3, la distribution est plus pointue que la normale,
leptokurtique.
Si β1 = 3 , la distribution est normale.

Siβ1 < 3, la distribution est plus aplatie que la normale,


platykurtique.
59
Exemple

◼ On considère la distribution suivante:


6.77 7.19 8.40 8.43 9.10 9.21 9.42 9.53 9.75 9.77

9.97 10.43 10.82 11.04 11.13 11.25 11.89 12.03 12.44 13

◼ Calculer le coefficient d’aplatissement

60
Exemple

◼ 𝑥ҧ = 10.07
◼ 𝜎 2 = 2.64
◼ 𝜇4 = 17
𝜇4
◼ β1 = = 2.44
𝜎4
◼ La distribution est platykurtique, elle est plus
aplatie que la normale.

61
Remarque

◼ Pour calculer le coefficient d’asymétrie 𝛾1 et le


coefficient d’aplatissement β1 d’une variable
continue, on remplace les modalités 𝑥𝑖 par les
centres de classes 𝑐𝑖 .

1 𝑘
1 𝑘
σ𝑖=1 𝑛𝑖 (𝑐𝑖 −𝑥ҧ )3 𝜇4 σ𝑖=1 𝑛𝑖 (𝑐𝑖 −𝑥ҧ )4
𝜇3 𝑛
𝛾1 =
𝜎3
= 𝑛
𝜎3
, β1 = 𝜎4
=
𝜎4

62

Vous aimerez peut-être aussi