Beamer Statistique Descriptive PDF
Beamer Statistique Descriptive PDF
Statistique descriptive
Présenté par :
Pr.Abdelaziz Qaffou
Plan du cours
1 Introduction à la statistique descriptive
Introduction et vocabulaires statistiques
La collecte des données
Type de variables statistiques
Série statistique et distribution statistique
Exemples
2 Tableaux statistiques à un caractère
Effectif, fréquence, effectif cumulés et fréquences cumulées
Exemples
3 Représentations graphiques
Caractère qualitatif
Variable quantitative discrète
Variable quantitative continue
Exemples
4 Indicateurs numériques
Indicateurs de position
Indicateur de dispersion
Sommaire
1 Introduction à la statistique descriptive
Introduction et vocabulaires statistiques
La collecte des données
Type de variables statistiques
Série statistique et distribution statistique
Exemples
2 Tableaux statistiques à un caractère
Effectif, fréquence, effectif cumulés et fréquences cumulées
Exemples
3 Représentations graphiques
Caractère qualitatif
Variable quantitative discrète
Variable quantitative continue
Exemples
4 Indicateurs numériques
Indicateurs de position
Indicateur de dispersion
3/66 Abdelaziz Qaffou Statistique descriptive
Introduction et vocabulaires statistiques
Introduction à la statistique descriptive
La collecte des données
Tableaux statistiques à un caractère
Type de variables statistiques
Représentations graphiques
Série statistique et distribution statistique
Indicateurs numériques
Exemples
Introduction
La statistique est une méthode scientifique qui consiste à réunir des
données chiffrées sur des ensembles nombreux, puis à analyser, à
commenter et à critiquer ces données.
Il ne faut pas confondre la statistique qui est une science qui vient d’être
définie et une statistique qui est un ensemble de données chiffrées sur un
sujet précis.
Introduction
Le but de la statistique descriptive est de décrire des données (faire parler
les chiffres), c’est un résumé d’information sous forme de tableaux
statistiques, de représentations graphiques ou tirer des informations sur
des données statistiques à partir des indicateurs de position, de
dispersion, de forme et de concentration.
Mais le résumé néglige certaines aspects, c’est comme ça né la statistique
inférentielle (que d’autres auteurs l’appellent inférence statistique ou
statistique mathématique ou statistique paramétrique), pour savoir à quel
point l’on peut résumer sans perdre des informations essentielles et quel
est le meilleur résumé avec le moins d’erreurs.
Dans la statistique descriptive, on étudie une population qui est un
ensemble d’individus (ou unités statistiques) sur lesquels on effectue une
analyse statistique. La population est étudiée selon un ou plusieurs
caractères.
Vocabulaires statistiques
Population : ensemble des unités statistiques ou d’individus sur
lesquels on effectue une analyse statistique ;
Unité statistique (ou individu) : élément de la population sur lequel
porte l’observation ;
Echantillon : ensemble d’individus prélevés dans une population
déterminée ;
Caractère (critère ou variable statistique) : permet de décrire et de
classer la population.
Variable qualitative
Les variables qualitatives sont des variables qui ne sont pas représentées
par des nombres, on les appelle des caractères qui prennent des
modalités, on distingue trois type de variables qualitatives :
Nominale : celles qui prennent un nom (exemples : couleur des yeux,
profession, nationalité,...).
Ordinale : celles qui peuvent être classées, ordonnées ou
hiérarchisées (exemples : mention obtenu, niveau d’étude, niveau se
satisfaction,...).
Dichotomique : celles qui prennent seulement deux modalités
(exemples : sexe (masculin ou féminin), vrai ou faux, échecs ou
succès, oui ou non,...).
Variable quantitative
Les variables quantitatives sont des variables représentées par des
nombres et sur lesquels on peut faire des opérations arithmétique, elles
prennent des valeurs. On distingue deux types de variables quantitatives :
Discrète : celle qui ne prend qu’un nombre fini de valeurs, isolées
(exemples : nombre d’enfants par ménage, nombre de visites,...).
Continue : celle qui peut prendre une infinité de valeurs, ou bien
toutes les valeurs d’un intervalle. Généralement, tout ce qui est
mesurable est une variable quantitative continue, ces valeurs sont
regroupées en classes (exemples : la taille, le poids, la surface, la
température,...).
On appelle une série statistique la suite des valeurs prises par une
variable statistique x sur les unités d’observations. Le nombre d’unités
d’observation est noté n. Les individus qu’on note par xi sont présentés
sous forme d’une série statistique qu’on note par S = {x1 , x2 , ..., xn }, le
nombre total d’individus est n.
Dans une série statistique, les individus ne sont pas regroupés, ne sont pas
classés. Si on les regroupe par valeurs ou par modalités, on obtient une
distribution statistique. Le regroupement peut-être par modalités (pour
les variables qualitatives), par valeur (pour les variables quantitatives
discrètes) ou par classes (pour les variables quantitatives continues).
Lorsqu’on effectue une distribution par classes de valeurs, on peut choisir
des classes d’amplitudes égales ou d’amplitudes inégales.
S = {M, M, D, C , C , M, C , C , C , M, C , M, V , M, V , D, C , C , C , M}.
Dernier diplôme xi
Sans diplôme Sd
Primaire P
Secondaire S
Technicien T
Universitaire U
Sommaire
1 Introduction à la statistique descriptive
Introduction et vocabulaires statistiques
La collecte des données
Type de variables statistiques
Série statistique et distribution statistique
Exemples
2 Tableaux statistiques à un caractère
Effectif, fréquence, effectif cumulés et fréquences cumulées
Exemples
3 Représentations graphiques
Caractère qualitatif
Variable quantitative discrète
Variable quantitative continue
Exemples
4 Indicateurs numériques
Indicateurs de position
Indicateur de dispersion
16/66 Abdelaziz Qaffou Statistique descriptive
Introduction à la statistique descriptive
Tableaux statistiques à un caractère Effectif, fréquence, effectif cumulés et fréquences cumulées
Représentations graphiques Exemples
Indicateurs numériques
Fréquence
On appelle fréquence de la modalité ou valeur xi , le nombre fi tel que
fi = nni , parfois, on peut rencontrer le terme de fréquence relative pour les
fréquences.
Le pourcentage est une fréquence exprimée en pour cent, il est égale à
fi × 100.
17/66 Abdelaziz Qaffou Statistique descriptive
Introduction à la statistique descriptive
Tableaux statistiques à un caractère Effectif, fréquence, effectif cumulés et fréquences cumulées
Représentations graphiques Exemples
Indicateurs numériques
Effectifs cumulés
i
Les effectifs cumulés sont exprimés par : Ni = ∑ np .
p =1
Fréquences cumulés
i
Les fréquences cumulées sont exprimées par : Fi = ∑ fp .
p =1
Notation
k k
n = ∑ ni . et ∑ fi = 1.
i =1 i =1
Interprétation
Il y a 15 individus qui ont au plus un diplôme des études primaires,
ou bien 15 personnes qui ont moins de un diplôme secondaire.
Il y a 35 personnes qui ont au moins un diplôme secondaire ou bien
35 personnes plus de ont un diplôme primaire.
58% ont au plus un diplôme secondaire, ou bien 58% ont moins
d’un diplôme primaire.
70% ont au moins un diplôme secondaire, ou bien plus de 70% ont
un diplôme technicien.
21/66 Abdelaziz Qaffou Statistique descriptive
Introduction à la statistique descriptive
Tableaux statistiques à un caractère Effectif, fréquence, effectif cumulés et fréquences cumulées
Représentations graphiques Exemples
Indicateurs numériques
Sommaire
1 Introduction à la statistique descriptive
Introduction et vocabulaires statistiques
La collecte des données
Type de variables statistiques
Série statistique et distribution statistique
Exemples
2 Tableaux statistiques à un caractère
Effectif, fréquence, effectif cumulés et fréquences cumulées
Exemples
3 Représentations graphiques
Caractère qualitatif
Variable quantitative discrète
Variable quantitative continue
Exemples
4 Indicateurs numériques
Indicateurs de position
Indicateur de dispersion
24/66 Abdelaziz Qaffou Statistique descriptive
Introduction à la statistique descriptive Caractère qualitatif
Tableaux statistiques à un caractère Variable quantitative discrète
Représentations graphiques Variable quantitative continue
Indicateurs numériques Exemples
Caractère qualitatif
Il y a trois types de représentations graphiques pour un caractère
qualitatif soit nominal ou ordinal.
Diagramme en bâtons : à chaque modalité xi , on associe un bâton
de longueur hi proportionnelle à l’effectif ni ou à la fréquence fi .
Diagramme en barres : même principe que le diagramme en
bâtons.
Diagramme circulare : à chaque modalités xi , on associe un angle
αi avec αi = fi × 360.
Caractère nominal
On prend le caractère état civil de l’exemple précédent :
Valeurs (xi ) Effectifs (ni ) Fréquences (fi ) Pourcentage
C 9 0,45 45
M 7 0,35 35
V 2 0,10 10
D 2 0,10 10
Total 20 1 100
Figure 1
Caractère ordinal
On considère l’exemple du dernier diplôme obtenu :
Valeurs (xi ) Effectifs (ni )
Sd 4
P 11
S 14
T 9
U 12
Total 50
Figure 2
Figure 3
Figure 5
Sommaire
1 Introduction à la statistique descriptive
Introduction et vocabulaires statistiques
La collecte des données
Type de variables statistiques
Série statistique et distribution statistique
Exemples
2 Tableaux statistiques à un caractère
Effectif, fréquence, effectif cumulés et fréquences cumulées
Exemples
3 Représentations graphiques
Caractère qualitatif
Variable quantitative discrète
Variable quantitative continue
Exemples
4 Indicateurs numériques
Indicateurs de position
Indicateur de dispersion
38/66 Abdelaziz Qaffou Statistique descriptive
Introduction à la statistique descriptive
Tableaux statistiques à un caractère Indicateurs de position
Représentations graphiques Indicateur de dispersion
Indicateurs numériques
La classe modale est celle qui contient le plus grand effectif, c’est la classe
[16 ;19[, puis on utilise la formule suivante pour déterminer le mode :
ni − ni−1
Mo = xi + ai
(ni − ni−1 ) + (ni − ni +1 )
1 n
x̄ = ∑ xi
n i =1
1 k
x̄ = ∑ ni xi , avec k : nombre de modalités
n i =1
0, 5 − 0, 35
Me = 16 + 3 = 17, 28.
0, 70 − 0, 35
49/66 Remarque : La médiane n’est pasQaffou
Abdelaziz affectéeStatistique
par lesdescriptive
valeurs extrêmes.
Introduction à la statistique descriptive
Tableaux statistiques à un caractère Indicateurs de position
Représentations graphiques Indicateur de dispersion
Indicateurs numériques
Les quartiles
Les quartiles sont les valeurs d’une série ou d’une distribution statistique
rangés par ordre croissant qui partagent l’effectif total en quatre parties
égales, il existe trois quartiles, le premier quartile Q1 , le deuxième Q2 , qui
égale à la médiane et le troisième quartile Q3 .
Exemple
Si on prend la varaible discrète "nombre d’enfants par ménage", avec la
série statistique est :
S = {4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1, 3, 3, 4, 5}
On a n = 20 = 4 × 5 = 4p donc p = 5
En classant cette série, on obtient le tableau suivant :
Exemple
Nombre d’enfants Rang
0 1
1 2
1 3
1 4
2 (p ème valeur) 5 (rang p)
2 (p+1 ème valeur) 6 (rang p+1)
2 7
2 8
2 9
3 (2p ème valeur) 10 (rang 2p)
Exemple
Nombre d’enfants Rang
3 (2p+1 ème valeur) 11 (rang 2p+1)
3 12
3 13
3 14
4 (3p ème valeur) 15 (rang 3p)
4 (3p+1 ème valeur) 16 (rang 3p+1)
4 17
4 18
5 19
5 20
x(p) +x(p+1)
Q1 =
2 = 2+2
2 =2
x(2p) +x(2p+1)
Par conséquent, on a : Q2 = 2 = 3+3
2 =3
x(3p) +x(3p+1)
Q3 = = 4+4
2 = 4.
2
p − F (xi )
Si Qp ∈]xi , xi +1 ] alors Qp = xi + ai
F (xi +1 − F (xi ))
Exemple
En prenant la variable continue "quantité de lait vendu," on a :
Valeurs (xi ) Effectifs (ni ) Fréquences fi Fi+
[10 ;13[ 5 0,25 0,25
[13 ;16[ 2 0,10 0,35
[16 ;19[ 7 0,35 0,70
[19 ;22[ 3 0,15 0,85
[22 ;25[ 3 0,15 1
Total 20 1 —
Exemple
Pour le deuxième quartile Q2 = Me, on a 0,5 se trouve entre 0,35 et
0,70, donc la classe correspondante à 0,5 est [16; 19[, alors
Q2 ∈ [16; 19[= [xi , xi +1 [, d’où
xi = 16, ai = 19 − 16 = 3, F (xi ) = F (16) = 0, 35 et
F (xi +1 ) = F (19) = 0, 70, on remplace dans la formule, on obtient :
0, 5 − 0, 35
Q2 = 16 + 3 = 17, 28.
0, 70 − 0, 35
0, 75 − 0, 70
Q3 = 19 + 3 = 19.
0, 85 − 0, 70
58/66 Abdelaziz Qaffou Statistique descriptive
Introduction à la statistique descriptive
Tableaux statistiques à un caractère Indicateurs de position
Représentations graphiques Indicateur de dispersion
Indicateurs numériques
L’étendue
L’étendue est la différence entre la plus grande et la plus petite valeur de
la série statistique :
E = xmax − xmin
il mesure la dispersion de la population, sensible aux valeurs extrêmes.
L’intervalle interquartileL’étendue
L’intervalle interquartile (IIQ) est la différence entre le troisième et le
premier quartile :
IIQ = Q3 − Q1
il mesure la dispersion de la population en se concentrant autour de la
médiane, il élimine les valeurs extrêmes.
La variance
la variance est la somme des carrées des écarts à la moyenne divisée par
le nombre d’observations :
n
1
Pour une série statistique : V (x) = n ∑ (xi − x̄)2 variance simple.
i =1
Pour une distribution statistique :
1 k
V (x) = ∑ ni (xi − x̄)2 variance pondérée, k : nombre de modalités.
n i =1
1 k 2 1 k
V (x) = ∑ ni (ci − x̄) avec x̄ = ∑ ni ci .
n i =1 n i =1
L’écart-type
L’écart-type est la racine carrée de la variance :
p
σx = Var (x)
Le coefficient de variation
Le coefficient de variation est le rapport entre l’écart-type et la moyenne :
σx
CVx = × 100
x̄
il est exprimé toujours en pourcentage, il indique la dispersion par rapport
à la moyenne, peut être utilisé pour comparer plusieurs séries de données
exprimées en différentes unités.
1 n
emoy = ∑ |xi − x̄|.
n i =1
1 n
emoy = ∑ ni |ci − x̄|.
n i =1
Les moments
n
1
On appelle moment d’origine d’ordre r ∈ N, le paramètre : mr n ∑ xir .
i =1
n
Lorsque les observations sont groupées par classes, on a : mr n1 ∑ ni cir .
i =1
n
On appelle moment centré d’ordre r ∈ N, le paramètre : mr n1 ∑ (xi − x̄)r .
i =1
Lorsque les observations sont groupées par classes, on a :
n
1
mr n ∑ ni (ci − x̄)r .
i =1
Les moments généralisent la plupart des paramètres, on a en particulier :
pour r = 1 : m1 = x̄
pour r = 2 : m2 = V (x)
pour r = 3 et 4, on va les utiliser pour mesurer la symétrie et
l’aplatissement.