0% ont trouvé ce document utile (0 vote)
121 vues26 pages

Cours de Statistique

Ce document présente un cours de statistique descriptive, abordant les concepts fondamentaux tels que la population statistique, les types de variables, et les méthodes de présentation des données. Il explique également les indicateurs de position et de dispersion pour les variables quantitatives, ainsi que les tableaux statistiques et les représentations graphiques. L'objectif est de fournir aux étudiants une base solide en statistique pour analyser et interpréter des données.

Transféré par

Thë Kįng
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
121 vues26 pages

Cours de Statistique

Ce document présente un cours de statistique descriptive, abordant les concepts fondamentaux tels que la population statistique, les types de variables, et les méthodes de présentation des données. Il explique également les indicateurs de position et de dispersion pour les variables quantitatives, ainsi que les tableaux statistiques et les représentations graphiques. L'objectif est de fournir aux étudiants une base solide en statistique pour analyser et interpréter des données.

Transféré par

Thë Kįng
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Notes du cours de statistique descriptive

Pr : Moulay Hanafi AZZAT

Filière : SGE

Module : Statistique descriptive

Smestre : 1

Année universitaire : 2021 - 2022


0

Table des matières


1 Introduction 1

2 Généralités sur la statistique descriptive 1


2.1 Population statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.2 Types de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

3 Tableau statistique et représentation graphique 3


3.1 Tableau statistique : variable qualitative . . . . . . . . . . . . . . . . . . . . . . 4
3.1.1 Variable qualitative nominale . . . . . . . . . . . . . . . . . . . . . . . 4
3.1.2 Variable qualitative ordinale . . . . . . . . . . . . . . . . . . . . . . . 4
3.2 Tableau statistique : variable quantitative . . . . . . . . . . . . . . . . . . . . . 4
3.2.1 Variable quantitative discrète . . . . . . . . . . . . . . . . . . . . . . . 4
3.2.2 Variable quantitative continue . . . . . . . . . . . . . . . . . . . . . . . 5
3.3 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3.1 Graphes des variables qualitatives ou quantitatives discrètes . . . . . . . . 6
3.3.2 Graphes des variables quantitatives continues . . . . . . . . . . . . . . . 7

4 Variable quantitative discrète 7


4.1 les indicateurs de position . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4.1.1 Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4.1.2 Médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.1.3 Moyenne arithmétique . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.1.4 quantiles : Quartiles. . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2 Les indicateurs de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

5 Variable quantitative continue 12


5.1 Indicateurs de position . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.1.1 Le mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.1.2 La médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.1.3 La moyenne arithmétique . . . . . . . . . . . . . . . . . . . . . . . . . 14
5.1.4 Quantiles : Quartiles. . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
5.2 les indicateurs de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

6 Variable statistique à deux dimensions 18


6.1 Diagramme en nuage de points . . . . . . . . . . . . . . . . . . . . . . . . . . 18
6.2 Covariance et coefficient de corrélation . . . . . . . . . . . . . . . . . . . . . . 19
6.2.1 La covariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
6.2.2 Le coefficient de corrélation . . . . . . . . . . . . . . . . . . . . . . . 19
6.3 Droite de régression linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

7 Exercices 22

Pr: Moulay Hanafi AZZAT


1

1 Introduction
OBJECTIFS DU COURS
1. Acquérir une culture de base en statistique : Connaitre et Comprendre les mots clés en statis-
tique.
2. Maîtriser les outils et techniques de base : Savoir comment décrire une situation donnée.
3. Posséder le sens critique nécessaire : Interpréter les résultats obtenus.
• La statistique est la science qui a pour but la collecte, la présentation, la réduction, et l’analyse de
données.
• Les statistiques se sont des données chiffrées relatives à un phénomène étudié.
• Une statistique est la quantité calculée à partir de données.
Deux types de statistique :
1. La statistique descriptive : est un ensemble de méthodes pour décrire les données et dégager
l’ensemble de l’information qu’elles contiennent.
2. La statistique inférentielle : a pour but d’analyser les données collectées auprès d’une partie
de la population afin de tirer des conclusions concernant toute la population.

2 Généralités sur la statistique descriptive


2.1 Population statistique

Population : La population est un ensemble


d’objets ou de personnes sur lesquelles porte
une étude.

Remarque 2.1.

– Une population est dite finie si l’on peut déterminer avec précision le nombre d’éléments qui
la composent. Sinon, on parle de population infinie.
– Les éléments de la population ont une ou plusieurs caractéristiques communes.

Définition 2.1 (Individu). Les éléments qui composent une population sont appelés des Individus

Échantillon : L’échantillon est un sous-


ensemble de la population.

Remarque 2.2. L’échantillon doit être bien choisir pour pouvoir représente la population.

Pr: Moulay Hanafi AZZAT


2

Définition 2.2. La taille d’une population est le nombre d’individus qui la composent.

Définition 2.3. Une variable est un critère relatif auquel on observe les individus d’une population.

Définition 2.4 (Modalité). Une valeur que peut prendre un caractère s’appelle modalité.

Exemple 2.1. – La population statistique : les étudiants d’une faculté.


– L’individu : un(e)étudiant(e).
– La variable : le genre / la taille / le poids/...

Remarque 2.3. A chaque individu, on attribut une ou plusieurs variables qui peuvent être soit quanti-
tatives (si elles sont mesurables ; exemple : salaire, nb d’enfants par ménage, poids,...) ou qualitatives
(exemple : sexe, état matrimonial... ).

2.2 Types de variables


– La variable qualitative : on ne peut pas mesurer numériquement ses modalités.
Une variable qualitative peut être soit :
– Nominale : si ses modalités ne peuvent être naturellement ordonnées exemple : état matri-
moniale.
– Ordinale : si ses modalités peuvent être naturellement ordonnées exemple : satisfaction plus
ou moins grande après l’achat d’un produit.
– La variable quantitative : dont les valeurs sont mesurées numériquement.
On distingue deux sortes de variables quantitatives :
– Variable quantitative discrète : si les valeurs sont dans un ensemble dénombrable.
– Variable quantitative continue : si les valeurs sont dans un intervalle ou une réunion d’in-
tervalle.

Exemple 2.2 (Qualitative Nominale). L’état civil d’une personne : "célibataire", "marié", "divorcé",
"veuf".

Exemple 2.3 (Qualitative Ordinale). Le niveau de satisfaction d’un service : "pas satisfait", "moyen-
nement satisfait", "très satisfait".

Exemple 2.4 (Quantitative Discrète ). Le nombre de frères et soeurs : {0, 1, 2, 3, ...}

Exemple 2.5 (Qualitative Continue ). L’âge d’étudiants : [18, 22[; [22, 26[, ...

Remarque 2.4. Une variable est notée par une lettre majuscule et les valeurs qu’elle prend par des
lettres minuscules.

Pr: Moulay Hanafi AZZAT


3

Population
?
Echantillon
?
Variable
? ?
Qualitative Quantitative
? ? ? ?
Nominale Ordinale Continue Discrète
? ? ? ?

Couleur Mention Age Nb de stylos

Définition 2.5 (Effectif). L’effectif (ni ) est le nombre d’individus ayant une modalité (xi ).

Définition 2.6 (Fréquence). La fréquence (fi ) est la proportion de l’effectif d’une modalité par
rapport à l’effectif total(n) :
ni
fi =
n
Remarque 2.5.


k
X
fi = 1
i=1

– la fréquence s’exprime souvent en pourcentage(%).

Définition 2.7 (Effectif et Fréquence cumulés). – Soit Ni le ième effectif cumulé croissant asso-
cié à xi
i
X
Ni = nj
j=1

– Soit Fi la ième fréquence cumulée croissante


i
X
Fi = fj
j=1

3 Tableau statistique et représentation graphique


Pour présenter les données collectées dans un tableau statistique :
On associe, à chaque modalité prise par la variable, son effectif.
Pour les variables continues, les modalités sont des classes.

Pr: Moulay Hanafi AZZAT


4

3.1 Tableau statistique : variable qualitative


3.1.1 Variable qualitative nominale
X : L’état civil de 15 personnes.

Modalité (xi ) Effectif (ni ) fi % Fi %


Célibataire 6 40 40
Marié 3 20 60
Divorcé 4 27 87
Veuf 2 13 100
Total 15 100 Au plus

27% des personnes sont divorcées

40% des personnes sont célibataires

3.1.2 Variable qualitative ordinale


X : le niveau de satisfaction d’un service d’un échantillon de 20 personnes.

Modalité (xi ) Effectif (ni ) fi % Fi %


Pas satisfait 9 45 45
Moyennement satisfait 7 35 80
Très satisfait 4 20 100
Total 20 100 Au plus

45% des personnes ne sont pas satisfaites

35% des personnes sont moyennement satisfaites

20% des personnes sont très satisfaites

3.2 Tableau statistique : variable quantitative


3.2.1 Variable quantitative discrète
X : le nombre de frères et soeurs de 35 étudiants.

Modalité (xi ) Effectif (ni ) fi % Fi %


0 1 3 3
1 6 17 20
2 7 20 40
3 10 29 69
4 8 23 92
5 3 8 100
Total 35 100 Au plus

Pr: Moulay Hanafi AZZAT


5

3% des étudiants n’ont pas ni des frères ni des soeurs

29% des étudiants ont trois frères et soeurs

69% des étudiants ont au plus trois frères et soeurs

3.2.2 Variable quantitative continue


Pour les variables continues, on commence par ranger les valeurs en classes, ensuite pour chaque
classe, on compte le nombre d’individus dont les valeurs de la variable appartient à la classe, ce
nombre est l’effectif de la classe.
Nombre de classes (règle de STURGE)

– Le nombre de classes ne doit être ni trop petit (perte d’information) ni trop grand (le regrou-
pement en classes est inutile et de plus, certaines classes pourraient avoir des effectifs trop
faibles).
– En général le nombre de classes est compris entre 5 et 15 ; il dépend du nombre n d’individus.
– La formule de STURGE donne une valeur approximative du nombre k de classes :

k ≈ 1 + 3.22 × log10 (n)

Comment construire les classes ?

1. Déterminer le nombre de classes k


2. Calculer l’étendue e : où e = xmax − xmin
3. Diviser l’étendue par k, pour avoir une idée sur la valeur de l’amplitude a des classes :
e
a=b c+1
k
où b ke c est la partie entière inférieure de nombre ke .
4. Construire alors les classes : [xmin , xmin + a[....
5. S’assurer que chaque individu appartient à une classe et une seule.

Exemple 3.1. X : le poids (kg) d’un échantillon de 50 étudiants.


55 66 82 50 55 65 60 60 50 56
76 67 63 52 51 74 74 80 78 60
81 77 83 77 56 67 69 56 59 59
73 68 53 51 60 56 80 84 75 71
59 81 81 68 70 70 59 66 62 64

1. Le nombre k de classes est : k ≈ 1 + 3.22 log10 (50) ' 6


2. L’étendue e est : e = xmax − xmin = 84 − 50 = 34
3. L’amplitude a des classes est : a = b ke c + 1 = b 34
6
c+1=5+1=6
4. La première classe est : [xmin , xmin + a[= [50, 50 + 6[= [50, 56[

Pr: Moulay Hanafi AZZAT


6

X : le poids (kg) d’un échantillon de 50 étudiants.

Classes Effectif (ni ) fi % Fi %


[50, 56[ 8 16 16
[56, 62[ 12 24 40
[62, 68[ 8 16 56
[68, 74[ 7 14 70
[74, 80[ 7 14 84
[80, 86[ 8 16 100
Total 50 100 au plus

16% des étudiants pesent entre 50 et 56 kgs

24% des étudiants pesent entre 56 et 62 kgs

70% des étudiants pesent au plus 74 kgs

3.3 Représentation graphique


– Très souvent, on préfère des représentations graphiques.
– Les graphes apparaissent comme plus " parlants ".
– Ces représentations sont adaptées au type de variable étudiée : nominale, ordinale, discrète ou
continue.
Comment représenter graphiquement ?

– Sur l’axe des abscisses on représente les modalités (les valeurs de la variable)
– Sur l’axe des ordonnées on représente les effectifs ou les fréquences selon que l’on désire un
diagramme d’effectifs ou de fréquences.

3.3.1 Graphes des variables qualitatives ou quantitatives discrètes


Les deux types de graphiques sont les plus utilisées pour les variables qualitatives ou quantitatives
discrètes
Diagramme en bâtons :
Diagramme en secteurs :
A chaque modalité xi on associe un segment
Chaque modalité est représentée par un
de longueur proportionnelle à l’effectif (ou
secteur circulaire dont l’angle est
fréquence).
proportionnel à la fréquence
(αi = 360◦ × fi ) de cette modalité.

Pr: Moulay Hanafi AZZAT


7

3.3.2 Graphes des variables quantitatives continues


L’histogramme est formé par des rectangles dont les bases sont les classes et les hauteurs sont
les effectifs correspondants

Polygone :
Histogramme :
Après avoir ajouter aux extrémités de
A chaque classe, on associe un rectangle dont
l’histogramme deux rectangles fictifs de
la base est égale à l’amplitude de la classe et
hauteurs nulles et de mêmes bases,on joint,
dont la hauteur est l’effectif correspondant
par des segments, les milieux des sommets
des rectangles de l’histogramme.

4 Variable quantitative discrète


4.1 les indicateurs de position
Ici, il s’agit de faire une synthèse de l’information, par le chiffre ; et ce en calculant des para-
mètres dits : indicateurs de position, qui caractérisent l’ordre de grandeur des observations qui sont :
la moyenne arithmétique, le mode, la médiane et les quantiles : Quartiles.
Pour chaque type de variable statistique, un certain nombre de caractéristiques (ou indicateurs), per-
mettant de résumer de manière quantitative (et non plus qualitative) chaque variable.

Variable Position Dispersion


Qualitative Mode -
-Etendue
-Mode
-Variance
-Médiane
-Ecart-type
Quantitative -Moyenne
-Ecart-interquartile
-Quantiles (Q1 , Q3 )
-Coefficient de variation

4.1.1 Mode
Le mode, noté M o, d’une série statistique est la valeur de cette série, dont l’effectif (ou la fré-
quence) est plus grand que les effectifs (ou les fréquences) des valeurs voisines.

Remarques 4.1. – Le mode est défini pour tous les types de variables.
– Le mode n’est pas nécessairement unique, il se peut que :
– Pas de mode : {0, 1, 2, 3, 4, 5}
– Unimodale si elle admet un mode unique : {1, 2, 1, 3, 2, 0, 2}, ici M o = 2
– Bimodale si elle admet deux modes : {1, 2, 1, 3, 2, 0, 2, 1}, ici 1 et 2

Pr: Moulay Hanafi AZZAT


8

– Multimodale si elle admet plusieurs modes : {0, 1, 2, 3, 2, 0, 3, 2, 1, 4, 0, 4, 4}


– Pour une variable continue, la classe modale de la variable associée est la classe dont la
fréquence est la plus grande (le mode peut être défini comme le centre de cette classe modale).

Exemple 4.1 (Variable qualitative). X : L’état civil de 15 personnes

Modalité (xi ) Effectif (ni ) fi % Fi %


Célibataire 6 40 40
Mariée 3 20 60
Divorcée 4 27 87
Veuve 2 13 100
Total 15 100 Au plus

Le mode est : Célibataire

Exemple 4.2 (Variable quantitative discrète). X : le nombre de frères et soeurs de 35 étudiants.

Modalité (xi ) Effectif (ni ) fi % Fi %


0 1 3 3
1 6 17 20
2 7 20 40
3 10 29 69
4 8 23 92
5 3 8 100
Total 35 100 Au plus

Le mode est : 3

Exemple 4.3 (Variable quantitative continue). X : le poids (kg) d’un échantillon de 50 étudiants.

Classes Effectif (ni ) fi % Fi %


[50, 56[ 8 16 16
[56, 62[ 12 24 40
[62, 68[ 8 16 56
[68, 74[ 7 14 70
[74, 80[ 7 14 84
[80, 86[ 8 16 100
Total 50 100 au plus

Le mode est le centre de classe modale [56, 62[ :


56 + 62
Mo = = 59
2

Pr: Moulay Hanafi AZZAT


9

4.1.2 Médiane
La Médiane, notée M é, d’une série statistique, est la valeur de la série qui partage la population
en deux parties d’effectifs égaux. Par conséquent, on aura autant d’observations inférieures à M é
que d’observations supérieures à M é.
Détermination de la médiane :

Soit la série ordonnée (par ordre croissant) de n observations : {x(1) , x(2) , ..., x(n) }, alors la
valeur médiane est 
x( n+1 si n est impair

 )
 2

M é =

 x( n ) + x( n2 +1)
 2
 si n est pair.
2
Exemple 4.4 (La médiane). On considère la série statistique suivante :

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16


9 8 20 8 14 10 14 10 10 13 10 13 9 13 8 10

La série ordonnée est

x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8) x(9) x(10) x(11) x(12) x(13) x(14) x(15) x(16)
8 8 8 9 9 10 10 10 10 10 13 13 13 14 14 17

Le mode est : M o = 10
La médiane est :
x( n2 ) + x( n2 +1) x( 16 ) + x( 16 +1) x(8) + x(9) 10 + 10
2 2
M é = = = = = 10
2 2 2 2

4.1.3 Moyenne arithmétique


La moyenne arithmétique, notée x̄, d’une variable statistique X est la quantité
n k k
1X 1X X
x̄ = xi = ni xi = fi xi
n i=1
n i=1 i=1

où k est les nombre des modalités et n disigne la taille de la série ou l’effectif total.

Exemple 4.5. Soit la série statistique ordonnée suivante :


8 8 8 9 9 10 10 10 10 10 13 13 13 14 14 17

Le mode est : M o = 10
La médiane est :
x( n2 ) + x( n2 +1) x( 16 ) + x( 16 +1) x(8) + x(9) 10 + 10
2 2
M é = = = = = 10
2 2 2 2
La moyenne est :

Pr: Moulay Hanafi AZZAT


10

n
1X
x̄ = xi
n i=1
1
= (8 + 8 + 8 + 9 + 9 + 10 + 10 + 10 + 10 + 10 + 13 + 13 + 13 + 14 + 14 + 17)
16
8 × 3 + 9 × 2 + 10 × 5 + 13 × 3 + 14 × 2 + 17
=
16
176
=
16
= 11

4.1.4 quantiles : Quartiles.


Quartiles : Q1 , Q2 = M é, Q3

On souhaite répartir la population, rangée par ordre croissant de valeurs en 4 groupes de même
effectif 25% chacune.
Alors dans ce paragraphe, on s’intéresse sur le premier quartile Q1 et le troisième quartile Q3
Calcul de Q1

Pour calculer Q1 , on suit les étapes suivantes :


n
1. Si est un entier naturel, alors
4
x( n4 ) + x( n4 +1)
Q1 =
2
n
2. Si n’est pas un entier naturel, alors on prend le plus petit entier naturel supérieur ou égal à
4
n n
noté par d e, et
4 4
Q1 = x(d n4 e)

Calcul de Q3
Pour calculer Q3 , on suit les étapes suivantes :
3n
1. Si est un entier naturel, alors
4
x( 3n ) + x( 3n +1)
4 4
Q3 =
2
3n
2. Si n’est pas un entier naturel, alors on prend le plus petit entier naturel supérieur ou égal à
4
3n 3n
noté par d e, et
4 4
Q3 = x(d 3n e)
4

Pr: Moulay Hanafi AZZAT


11

Exemple 4.6. Soit la série statistique ordonnée suivante de taille n = 15


8 8 8 9 9 10 10 10 10 10 13 13 13 14 14
n 15
– Pour Q1 , on a == 3.75. Le plus petit entier naturel supérier ou égale à 3.75 est 4,
4 4
donc Q1 = x(d3.75e) = x(4) = 9.
3n 3 × 15
– Pour Q3 , on a = = 11.25. Le plus petit entier naturel supérier ou égale à
4 4
11.25 est 12, donc Q3 = x(d11.5e) = x(12) = 13.
Remarque 4.1. – La moyenne, prenant en compte toutes les valeurs observées, est très sensible
aux observations extrêmes
– Les courbes suivantes donnent une idée sur la forme d’une distribution quelconque :

4.2 Les indicateurs de dispersion


1. L’étendue est la valeur maximale moins la valeur minimale
e = xn − x1
2. L’écart-interquartile c’est la différence
IR = Q3 − Q1
3. La variance est donnée par la formule
1 Pn 1 Pk k
(xi − x̄)2 = ni (xi − x̄)2 = fi (xi − x̄)2
P
V (x) =
n i=1 n i=1 i=1
4. L’écart-type
p est donné par la formule
σx = V (x)
5. Le coefficient de variation est donné par
σx
Cv =

Remarques 4.2. – Si l’écart-type est faible, cela signifie que les valeurs sont assez concentrées
autour de la moyenne.
– Si l’écart-type est élevé, cela veut dire au contraire que les valeurs sont plus dispersées autour
de la moyenne.
– Le coefficient de variation, exprimé habituellement en pourcentage, sert de mesure d’homogé-
néité d’une distribution.
– Ainsi, plus le coefficient de variation est petit plus la distribution est homogène.
Exemple 4.7. Soit la série statistique suivante de taille n = 15

Pr: Moulay Hanafi AZZAT


12

10 13 8 10 9 10 9 14 10 8 13 8 13 10 14

Les indicateurs de position

1. M o = 10
2. M é = x( n+1 ) = x(8) = 10
2

3. x̄ = 10.6
n 15
4. Q1 , on a = = 3.75. Donc Q1 = x(4) = 9.
4 4
3n 3 × 15
5. Q3 , on a = = 11.25. Donc Q3 = x(12) = 13.
4 4
Les indicateurs de dispersion

1. e = x(n) − x(1) = 14 − 8 = 6
2. IR = Q3 − Q1 = 13 − 9 = 4
1
3. V (x) = 3(8 − 10.6)2 + 2(9 − 10.6)2 + 5(10 − 10.6)2 + 3(13 − 10.6)2 + 2(14 −
15
10.6)2 = 4.47

p √
4. σx = V (x) = 4.47 = 2.11
σx 2.11
5. Cv = = = 0.2
x̄ 10.6

5 Variable quantitative continue

Apr ès avoir d étermin é les in di cateur s d e p ositi on et les in di cateur s d e di s-

p er si on p our un e vari able qu antitative di s cr ete, d an s ce c h a pitr e, on va voir les

in di cateur s d e p ositi on pui s les in di cateur s d e di s p er si on p our un e vari able qu anti-

tative continu e, afin d e s avoir la differ en ce entr e eux au niveau d e d étermin ati on

( calcul).

5.1 Indicateurs de position


5.1.1 Le mode
Le mode pour une variable quantitative continue est le centre de la classe modale, c’est la classe
qui correspond à la plus grande fréquence.

Exemple 5.1.

Pr: Moulay Hanafi AZZAT


13

Classes Effectif (ni ) fi % Fi %


[150, 156[ 2 8 8
[156, 162[ 10 42 50
[162, 168[ 5 21 71
[168, 174[ 4 16 87
[174, 180[ 3 13 100
Total 24 100 au plus

Le mode est le centre de classe modale [156, 162[ :


156 + 162
Mo = = 159
2

5.1.2 La médiane
Dans le cas continue, toujours la médiane est la valeur qui partage exactement la population en
deux parties égales.
On a deux méthodes pour déterminer la médiane :

Graphe de F (x) :

Détermination graphique :
La médiane correspond à l’abscisse du point
de la courbe cumulative qui admet pour or-
donnée la valeur 0, 5 (ou 50%).

Pour cette série statistique, la médiane d’après le graphe de F (x) est M é = 13

Détermination par interpolation :


D’après le tableau statistique, on détermine la classe contenant la médiane M é ; c’est la classe
[ai−1 , ai [ telle que, Fi−1 ≤ 0, 5 < Fi où i ∈ {1, ..., k} avec k est le nombre de classes,
puis on détermine la médiane par interpolation linéaire. donc on a :
0.5 − Fi−1
M é = ai−1 + (ai − ai−1 ) ×
| {z } fi
amplitude

avec
– [ai−1 , ai [ : est la classe médiane
– (ai − ai−1 ) : étant son amplitude
– fi : est sa fréquence
– Fi−1 est la fréquence cumulée de la classe précédente

Exemple 5.2. Soit le tableau statistique d’une variable quantitative continue

Pr: Moulay Hanafi AZZAT


14

Classes Effectif (ni ) fi % Fi %


[a0 , a1 [= [10, 20[ 21 30 30
[a1 , a2 [= [20, 30[ 28 40 70
[a2 , a3 [= [30, 40[ 12 17 87
[a3 , a4 [= [40, 50[ 9 13 100
Total 70 100 au plus

La classe médiane est [20, 30[ car F (20) = 0.3 ≤ 0.5 < F (30) = 0.7.
Donc
0.5 − F1
M é =a1 + (a2 − a1 ) ×
f2
0.5 − 0.3
=20 + (30 − 20) ×
0.4
0.2
=20 + 10 ×
0.4
=25

Remarque 5.1. Si F (ai−1 ) = 0, 5. Alors

M é = ai−1

Exemple 5.3. Soit le tableau statistique d’une variable quantitative continue

Classes Effectif (ni ) fi % Fi %


[a0 , a1 [= [150, 156[ 2 8 8
[a1 , a2 [= [156, 162[ 10 42 50
[a2 , a3 [= [162, 168[ 5 21 71
[a3 , a4 [= [168, 174[ 4 16 87
[a4 , a5 [= [174, 180[ 3 13 100
Total 24 100 au plus

On a F (a2 ) = 0.5, donc M é = a2 = 162

5.1.3 La moyenne arithmétique


La moyenne arithmétique pour une variable quantitative continue rangée dans k classes est don-
née par :
k k
1X X
x̄ = ni xi = fi xi
n i=1 i=1

où les xi sont les centres des classes.

Exemple 5.4. Soit le tableau statistique d’une variable quantitative continue

Pr: Moulay Hanafi AZZAT


15

Classes centre xi Effectif (ni ) fi % Fi %


[10, 20[ 15 21 30 30
[20, 30[ 25 28 40 70
[30, 40[ 35 12 17 87
[40, 50[ 45 9 13 100
Total - 70 100 au plus

k
1X
x̄ = ni xi
n i=1
1 
= 21 × 15 + 28 × 25 + 12 × 35 + 9 × 45
70
1840
=
70
=26.3

ou bien
k
X
x̄ = fi xi
i=1
 
= 0.3 × 15 + 0.4 × 25 + 0.17 × 35 + 0.13 × 45
=26.3

5.1.4 Quantiles : Quartiles.


Quartiles : Q1 , Q2 = M é, Q3
Nous savons que la médiane divise la distribution en deux parties égales. Alors, les quartiles divisent
la distribution en quatre (4) parties égales.

Détermination graphique :
Graphe de F (x) :

1. Le premier quartile correspond à l’abs-


cisse du point de la courbe cumula-
tive qui admet pour ordonnée la valeur
0, 25 (ou 25%).
2. Le 3ème quartile correspond à l’abs-
cisse du point de la courbe cumula-
tive qui admet pour ordonnée la valeur
0, 75 (ou 75%).

Détermination par interpolation :

– D’après le tableau statistique, on détermine la classe contenant Q1 ; c’est la classe [ai−1 , ai [


telle que, Fi−1 ≤ 0, 25 < Fi où i ∈ {1, ..., k} avec k est le nombre de classes, puis on

Pr: Moulay Hanafi AZZAT


16

détermine le premier quartile Q1 par interpolation linéaire. donc on a :


0.25 − Fi−1
Q1 = ai−1 + (ai − ai−1 ) ×
| {z } fi
amplitude

– Alors, pour le troisième quartile Q3 , il est dans la classe [ai−1 , ai [ telle que, Fi−1 ≤ 0, 75 <
Fi , et on le détermine par :
0.75 − Fi−1
Q3 = ai−1 + (ai − ai−1 ) ×
| {z } fi
amplitude

Remarque 5.2.

1. Si F (ai−1 ) = 0, 25 on a
Q1 = ai−1
2. Si F (ai−1 ) = 0, 75 on a
Q3 = ai−1
Exemple 5.5.

Classes centre xi Effectif (ni ) fi % Fi %


[a0 , a1 [ = [10, 20[ 15 21 30 30
[a1 , a2 [= [20, 30[ 25 28 40 70
[a2 , a3 [ = [30, 40[ 35 12 17 87
[a3 , a4 [= [40, 50[ 45 9 13 100
Total - 70 100 au plus
La classe contenant Q1 est [a0 , a1 [= [10, 20[ car F (10) = 0 ≤ 0.25 < F (20) = 0.3.
Donc
0.25 − F0
Q1 =a0 + (a1 − a0 ) ×
f1
0.25 − 0
=10 + (20 − 10) ×
0.3
0.25
=10 + 10 ×
0.3
=18
La classe contenant Q3 est [a2 , a3 [= [30, 40[
0.75 − F2
Q3 =a2 + (a3 − a2 ) ×
f3
0.75 − 0.7
=30 + (40 − 30) ×
0.17
0.05
=30 + 10 ×
0.17
=33

Pr: Moulay Hanafi AZZAT


17

Exemple 5.6.

Classes Effectif (ni ) fi % Fi %


[40, 45[ 6 12 12
[45, 50[ 7 13 25
[50, 55[ 10 20 45
[55, 60[ 3 5 50
[60, 65[ 5 10 60
[65, 70[ 7 15 75
[70, 80[ 12 25 100
Total 50 100 au plus

– On a F (50) = 25%, donc Q1 = 50


– On a F (60) = 50%, donc Q2 = M é = 60
– On a F (70) = 75%, donc Q3 = 70

5.2 les indicateurs de dispersion


1. L’étendue est la valeur maximale moins la valeur minimale :
e = x(n) − x(1)
2. L’écart-interquartile c’est la différence
IR = Q3 − Q1
3. La variance est donnée par la formule
1 Pk k
ni (xi − x̄)2 = fi (xi − x̄)2
P
V (x) =
n i=1 i=1
où les xi sont les centres des classes [ai−1 , ai [.
4. L’écart-type
p est donné par la formule
σx = V (x)
5. Le coefficient de variation est donné par
σx
Cv =

Exemple 5.7.

Classes centre xi Effectif (ni ) fi % Fi %


[10, 20[ 15 21 30 30
[20, 30[ 25 28 40 70
[30, 40[ 35 12 17 87
[40, 50[ 45 9 13 100
Total - 70 100 au plus
1
21(15−26.3)2 +28(25−26.3)2 +12(35−26.3)2 +9(45−26.3)2 = 96.91

V (x) =
70

Pr: Moulay Hanafi AZZAT


18

6 Variable statistique à deux dimensions


L’étude statistique peut se porter sur deux variables présentes dans tous les membres de la popu-
lation. Ces deux variables sont représentés par X et Y . On peut utiliser l’information dont on dispose
pour étudier la liaison qui existe éventuellement entre ces deux variables.

Exemple 6.1.

– On observe simultanément sur un échantillon de 200 foyers, le nombre d’enfants X et le


nombre de chambre Y .
– On observe sur un échantillon de 20 foyers, le revenu mensuel X et les dépenses mensuelles
Y.
– On observe sur un échantillon de 100 étudiants, le nombre d’heures X passées à préparer
l’examen de statistique et la note Y sur 20 obtenue à l’examen par l’étudiant.

6.1 Diagramme en nuage de points


– Une étude simultanée sur deux variables quantitatives X et Y sur une population de n indivi-
dus a donné les différents points de mesures :

(x1 , y1 ), (x2 , y2 ), (x3 , y3 ), ..., (xn−1 , yn−1 ), (xn , yn )

– On représente une distribution statistique à deux variables quantitatifs par l’ensemble des points
Ai , de coordonnées (xi , yi ), i = 1, ..., n, chaque individu correspond à un point du plan.
– On appelle nuage de points l’ensemble des points Ai , de coordonnées (xi , yi ), i = 1, ..., n.
– La représentation graphique du nuage de points est essentielle pour déterminer s’il existe ou
non une relation entre les variables X et Y .

Exemple 6.2. Sur un échantillon de 15 étudiants, on a prélevé X la note sur 20 obtenue à l’examen
par l’étudiant, et Y le nombre d’heures passées à préparer l’examen de statistique par étudiant.

xi 9 10 11 7 14 16 12 5 2 1 16 17 13 14 8
yi 8 2 6 6 11 10 7 2 1 0 12 20 9 7 4

Pr: Moulay Hanafi AZZAT


19

6.2 Covariance et coefficient de corrélation


6.2.1 La covariance
Pour déterminer la droite de régression, on a besoin de calculer la covariance de X et Y donnée
par la formule suivante :
n
1X
Cov(X, Y ) = σxy = (xi − x̄)(yi − ȳ)
n i=1

– La covariance peut prendre des valeurs positives, négatives ou nulles.


– Une covariance positive indique que Y croit lorsque X croit ou décroit lorsque X décroit.
– Une covariance négative indique que Y croit lorsque X décroit ou décroit lorsque X croit.

6.2.2 Le coefficient de corrélation


Pour mesurer la force de la relation entre X et Y , on calcule r le coefficient de corrélation linéaire
par la formule suivantes :
σxy
r=
σx σy
Le coefficient de corrélation r a les propriétés suivantes :

−1 ≤ r ≤ 1
– r = 0 signifie qu’il n’existe pas de relation linéaire entre les variables X et Y .
– plus r est proche de +1(resp. de −1), plus les points du diagramme sont proches d’être alignés
sur une droite croissante(resp. décroissante).
Exemples de nuage de points et les valeurs de r

r ∈ [0.5; 0.69] : Corrélation directe


r ∈ [0.7; 0.99] : Corrélation directe forte
moyenne

Pr: Moulay Hanafi AZZAT


20

r ∈ [−0.69; −0.5] : Corrélation inverse


r = 1 : Corrélation directe parfaite
moyenne

r ∈ [−0.99; −0.7] : Corrélation inverse


r = −1 : Corrélation inverse parfaite
forte

r = 0 : Corrélation non linéaire X et Y sont indépendantes

Si r ∈ [0.1; 0.49], on dit que la corrélation est faible.

6.3 Droite de régression linéaire


– On cherche à étudier la liaison pouvant exister entre les variables X et Y . Pour ce, on repré-
sente dans un repère orthogonal le nuage de points.
– La forme de ce nuage nous renseigne sur la nature de la liaison entre X et Y et le type de
courbe qui ajustera le mieux, ce nuage.
– Dans ce chapitre, on s’intéresse au cas où cette courbe est une droite (ajustement linéaire ou
droite de régression linéaire).
– Pour déterminer l’équation de la droite d’ajustement on utilise, très souvent, la méthode des
moindres carrés (M.M.C.).

Pr: Moulay Hanafi AZZAT


21

– Cette méthode consiste à déterminer l’équation d’une droite telle que la somme des carrés des
distances entre les points du nuage et cette droite soit minimale.
L’objectif est de mettre en évidence l’existence d’une relation linéaire entre deux variables quan-
titatives (continues ou discrètes) de la forme :

Y = aX + b


– Y est la variable dépendante.
– X est la variable explicative.
– a est la pente de la droite, donnée par :
σxy
a=
V (X)

– b est l’ordonné à l’origine donné par :

b = ȳ − ax̄

Exemple 6.3. Soient deux variables X et Y telle que

xi 166 158 165 150 154 156 158 158 160 155
yi 66 58 65 50 54 56 58 58 60 55
– Les moyennes x̄ = 158 et ȳ = 58
– L’écart-types σx = 4.58 et σy = 4.58
1 P 10
– La covariance σxy = (xi − x̄)(yi − ȳ) = 21
10 i=1
σxy
– Le coefficient de corrélation r = =1
σx σy
σxy
– Les paramètres a = = 1 et b = ȳ − ax̄ = −100
V (x)
– La droite de régression est
Y = X − 100

Pr: Moulay Hanafi AZZAT


22

7 Exercices
Exercice 7.1. La nature des variables du questionnaire médical ci-dessous est :
1. Nom et prénom
2. Sexe
3. Age (ans)
4. Profession
5. Nombre d’incidents cardiaques antérieurs
6. Taille (en cm)
7. Poids (en kg)
8. Cholestérol (en g/l)
Exercice 7.2. Spécifier le type pour chacune de ces variables suivantes :
1. Nombres d’enfants dans une famille
2. Couleur des yeux
3. Catégorie socioprofessionnelle
4. Ville de naissance
5. Niveau de scolarité
6. Revenu
7. Langue maternelle
Exercice 7.3. Soit la liste suivante des prénoms d’un groupe d’étudiants suivis entre parenthèses
d’une indication du niveau de la langue française (A=moyen, B=Assez bien, C=Bien, D=Très bien) :
Said(B), Siham (A), Abdelatif(A), Youness(C), Hayat(A), Khadija(B), Latifa(D), Meriem(C), Has-
naa(B), Ibtissam(B), Zineb(A), Kamal(B), Laila(D), Hicham(C), Mostafa(D).
1. Quelle est la population étudiée ?
2. Quel est la variable étudiée ?
3. Indiquer la nature de la variable
4. Construire le tableau représentatif de cette distribution
5. Déterminer le mode de sette série statistique
6. Représenter la série statistique à l’aide d’un diagramme
Exercice 7.4. Soit la série statistique d’une variable quantitative discrète suivante :
8 8 8 9 9 10 10 10 10 10 13 13 13 14
1. Représenter la série dans un tableau statistique.
2. Représenter graphiquement la série à d’un diagramme.
3. Calculer les indicateurs de position et de dispersion de la série statistique.
Exercice 7.5. Dans un amphi, on préleve un échantillon de 30 étudiants, les resultats suivants pré-
cisent le nombre de stylos chez chaque étudiant
{3, 4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 0, 3, 4, 5, 2, 1, 3, 3, 4, 5, 2, 3, 0, 3, 2, 1, 4, 2}

Pr: Moulay Hanafi AZZAT


23

1. Déterminer la population étudiée


2. Déterminer l’échantillon étudié
3. Quelle est la variable étudiée ? déterminer sa nature
4. Quelles sont les modalités ?
5. Remplir le tableau statistique de la série
6. Représenter garphiquement la série
7. Déterminer les indicateurs de position
8. Déterminer les indicateurs de dispersion

Exercice 7.6. Les revenus (mensuels en dirhams) d’un ensemble de familles d’un quartier d’une ville
sont donnés comme suit :
Revenus [2000 ;2600[ [2600 ;3200[ [3200 ;3800[ [3800 ;4400[ [4400 ;5000[
Effectifs 142 116 154 100 38

1. Déterminer la population étudiée


2. Déterminer l’échantillon étudié
3. Quelle est la variable étudiée ? déterminer sa nature
4. Représenter la série dans un tableau statistique
5. Représenter graphiquement la série statistique
6. Tracer le polygone.
7. Calculer les indicateurs de position et de dispersion de la série statistique

Exercice 7.7. Dans une étude sur la durée d’attente(en mn) devant un arrêt de bus, un échantillon
de 50 étudiants choisis au hasard a donné :
24 27 33 21 27 19 23 23 24 19
27 30 44 27 24 34 18 20 21 15
33 27 20 32 28 27 22 17 30 42
21 25 25 29 25 24 32 31 28 20
29 40 23 37 29 15 21 28 24 23

1. Déterminer la population étudiée


2. Déterminer l’échantillon étudié
3. Quelle est la variable étudiée ? déterminer sa nature
4. Représenter la série dans un tableau statistique
5. Représenter graphiquement la série statistique
6. Calculer les indicateurs de position et de dispersion de la série statistique

Exercice 7.8. A la suite d’une enquête concernant le nombre de frères et soeurs des étudiants d’un
certain établissement, on a obtenu les donnés suivantes :

Pr: Moulay Hanafi AZZAT


24

0 1 1 5 8 6 7 2 2 2 4
2 1 0 4 1 3 3 3 2 1 3
7 5 2 3 6 4 9 6 4 1 2
3 5 0 2 4 3 5 2 5 2 3
1 2 1 0 2 8 4 4 2 4 0
3 3 2 1 1 2 3 2 1 3 3

1. Déterminer la population étudiée


2. Déterminer l’échantillon étudié
3. Quelle est la variable étudiée ? déterminer sa nature
4. Représenter la série dans un tableau statistique
5. Représenter graphiquement la série statistique
6. Calculer les indicateurs de position et de dispersion de la série statistique

Exercice 7.9. On considère deux variables X et Y dont on connaît quelques valeurs :

xi 10 11 14 15 20 25 46 50 59 70
yi 10 10 12 12 13 13 19 15 16 20

1. Calculer la moyenne arithmétique, la variance et l’écart-type de la variable X


2. Calculer la moyenne arithmétique, la variance et l’écart-type de la variable Y
3. Calculer la covariance σxy
σxy
4. Calculer le coefficient de corrélation r =
σx σy
5. Interpréter selon la valeurs de r
6. Déterminer l’équation de la droite de régression linéaire s’il y une correlation linéaire entre
X et Y : (Y = aX + b)

Pr: Moulay Hanafi AZZAT

Vous aimerez peut-être aussi