Statistiques Descriptives
Statistiques Descriptives
Descriptives
Jmaei Asma
Introduction
Termenologie
Types de variables
statistiques
Collecte des
données
Statistiques Descriptives
Représentation
graphique des
données
Indicateurs
statistiques Jmaei Asma
Couples de
variables
statistiques et Facultés des Sciences de Gabès
corrélation
Représentation
graphique du nuage
de points
A.U : 2024-2025
Ajustement linéaire
Jmaei Asma
1 Introduction
Introduction
Termenologie
Termenologie
Types de variables
statistiques Types de variables statistiques
Collecte des
données
Représentation
graphique des
2 Collecte des données
données
Représentation graphique des données
Indicateurs
statistiques
Couples de
variables 3 Indicateurs statistiques
statistiques et
corrélation
Représentation
graphique du nuage
de points
4 Couples de variables statistiques et corrélation
Ajustement linéaire
Représentation graphique du nuage de points
Ajustement linéaire
Statistiques
Descriptives
Couples de
variables Méthodes Statistiques
statistiques et
corrélation • On collecte des données.
Représentation
graphique du nuage
de points • On trie les données que l’on organise en tableaux,
Ajustement linéaire
diagrammes ...
• On interprète les résultats.
Statistiques
Descriptives • Population : Ensemble que l’on observe et qui sera soumis
Jmaei Asma à une analyse statistique. Chaque élément de cet ensemble
Introduction
est un individu ou unité statistique..
Termenologie
Types de variables
Exemple : Les étudiants de la FSG ...
statistiques
Collecte des
• Échantillon : C’est un sous ensemble de la population
données considérée. Le nombre d’individus dans l’échantillon est la
Représentation
graphique des
données taille de l’échantillon.
Indicateurs Exemple : La classe LGLSI2...
statistiques
Couples de
• Caractère : C’est la propriété ou l’aspect singulier que l’on
variables
statistiques et
se propose d’observer dans la population ou l’échantillon.
corrélation
Représentation
Un caractère qui fait le sujet d’une étude porte aussi le nom
graphique du nuage
de points de variable statistique.
Ajustement linéaire
Exemple : la couleur, le sexe, le poids, l’âge, la marque,
l’espèce, le prix, la surface ...
• Modalités : Les formes que prend le caractère.
Exemple : masculin, féminin ...
Statistiques
Descriptives 1 Variable quantitative : La variable peut être exprimée
Jmaei Asma numériquement. Dans ce cas, elle peut être discrète ou
continue.
Introduction
Termenologie • Elle est discrète si elle ne prend que des valeurs isolées les
Types de variables
statistiques unes des autres.
Collecte des Exemple : nombre d’enfants d’une famille.
données
Représentation
• Elle est dite continue lorsqu’elle peut prendre toutes les
graphique des
données valeurs d’un intervalle donné.
Indicateurs Exemple : le poids, l’âge ...
statistiques
2 Variable qualitative : La variable ne se prête pas à des
Couples de
variables valeurs numériques. Dans ce cas, elle peut être nominale ou
statistiques et
corrélation
ordinale.
Représentation
graphique du nuage
• Elle est nominale si ses modalités sont exprimées par des
de points
Ajustement linéaire
noms et non hiérarchisées.
Exemple : Couleur des yeux, Nationalité ...
• Elle est dite ordinale si elle traduit le degré d’un état sans
que ce degré ne puisse être défini par un nombre.
Exemple : Mention : Passable, Assez bien, Bien, Très Bien.
Statistiques
Descriptives
Jmaei Asma
Exemple
Introduction
Termenologie
Les notes sur 20 obtenus lors d’un devoir de probabilités et
Types de variables
statistiques statistiques dans une classe de la FSG sont les suivantes :
Collecte des 10, 8, 11, 9, 12, 10, 8, 10, 7, 9, 10, 11, 12, 10, 8, 9, 10, 9, 10, 11
données
Représentation
graphique des
données Tableaux statistiques :
Indicateurs On appelle tableau statistique un tableau dont la première
statistiques
colonne comporte l’ensemble des r observations distinctes de la
Couples de
variables variable X (modalités) rangées par ordre croissant et non
statistiques et
corrélation répétées ; nous les noterons xi , i = 1, ..., r . Dans une seconde
Représentation
graphique du nuage
de points
colonne, on dispose, en face de chaque valeur xi , le nombre de
Ajustement linéaire réplications qui lui sont associées. Ces réplications sont appelées
effectifs et notées ni . On utilise également les fréquences
fi = nni .
Statistiques
Descriptives L’effectif cumulé EC d’une modalité xi est le nombre
Jmaei Asma d’individus de la population présentant une modalité d’indice
Introduction
inférieur ou égal à i.
Termenologie
Types de variables
La fréquence cumulée croissantes FC d’une modalité xi est la
statistiques
propotion d’individus de la population présentant une modalité
Collecte des
données d’indice inférieure ou égale à i.
Représentation
graphique des La fréquence cumulée décroissantes FD d’une modalité xi est
données
Indicateurs
la propotion d’individus de la population présentant une
statistiques modalité d’indice supérieure ou égale à i.
Couples de
variables
Dans le cas des caractères continus, les valeurs sont mises en
statistiques et
corrélation
classes [xi , xi+1 [. Leurs valeurs extrêmes sont appelées bornes.
Représentation
graphique du nuage
L’amplitude de la classe ∆= borne supérieure - la borne
de points
Ajustement linéaire
inférieure.
Le point central est le milieu de la classe est ci = xi +x2 i+1 .
En cas de classes d’amplitudes différentes, la densité de
fréquence ∆fi i permet de comparer les effectifs ou les fréquences
d’une classe à l’autre.
Jmaei Asma (LGLSI2) Statistiques Descriptives A.U : 2024-2025 7 / 50
Collecte des données
Statistiques
Descriptives
Exemple
Jmaei Asma
1 Dans l’exemple précédant, les modalités sont 7, 8, 9, 10, 11
Introduction
Termenologie
et 12 (n = 20 et r = 6).
Types de variables
statistiques
Modalité : xi 7 8 9 10 11 12
Effectif : ni 1 3 4 7 3 2
Collecte des
données EC 1 4 8 15 18 20
Représentation
graphique des Fréquence : fi 0.05 0.15 0.2 0.35 0.15 0.1
données
FC 0.05 0.2 0.4 0.75 0.9 1
Indicateurs
statistiques FD 1 0.95 0.8 0.6 0.25 0.1
Couples de 2 Temps passé devant les écrans par 36 étudiants pendant
variables
statistiques et une certaine journée.
corrélation
Classe : [xi , xi+1 [ [0, 15[ [15, 30[ [30, 60[ [60, 120[ [120, 180[
Représentation
graphique du nuage Amplitude ∆i 15 15 30 60 60
de points
Ajustement linéaire Centre ci 7.5 22.5 45 90 150
Effectif ni 7 5 8 12 4
ni
Densité d’effectif ∆ i
0.466 0.333 0.266 0.2 0.06
Fréquence fi 0.194 0.140 0.222 0.333 0.111
Densité de fréquence ∆fi i 0.013 0.009 0.007 0.005 0.001
Statistiques
Descriptives
Remarque : Pour dresser le tableau statistique d’une variable
Jmaei Asma
quantitative continue, on pourra suivre les étapes suivantes :
1 Déterminer p le nombre de classes à considérer dans
Introduction
Termenologie
l’étude. Pour n l’effectif de la population ou de l’échantillon,
Types de variables
statistiques
on peut le calculer selon l’une des deux règles suivantes :
Collecte des Règle de Sturge : P = 1 +√3.3 ∗ log10 n.
données Règle de Yule : P = 2.5 ∗ 4 n.
Représentation
graphique des
données Avec p = l’entier naturel le plus proche de P.
Indicateurs
statistiques
2 Calculer l’étendue e = xmax − xmin .
Couples de
variables
3 Diviser l’étendue e par p le nombre de classes, pour avoir
statistiques et
corrélation
une idée sur la valeur de l’amplitude des classes que l’on
Représentation
graphique du nuage
notera a. on a, a = pe .
de points
Ajustement linéaire
4 On construit alors les classes
[xmin , xmin + a], ]xmin + a, xmin + 2a], ..., ]xmin + (p −
1)a, xmin + pa = xmax ]
5 S’assurer que chaque observation appartient à une et une
seule classe.
Jmaei Asma (LGLSI2) Statistiques Descriptives A.U : 2024-2025 9 / 50
Collecte des données
Statistiques
Descriptives Exemple
Jmaei Asma
Etude de la consommation aux 100 km de 20 voitures d’un
Introduction nouveau modèle :
Termenologie
Types de variables
statistiques
6.11, 6.05, 5.98, 5.77, 5.18, 5.66, 5.28, 5.11, 5.58, 5.49, 5.62,
Collecte des
5.33, 5.55, 5.45, 5.76, 5.23, 5.57, 5.52, 5.8, 6.0.
données
Représentation
Pour la méthode de Sturge P = 1 +√3.3 ∗ log10 20 = 5.293.
graphique des
données Pour la méthode de Yule P = 2.5 ∗ 4 20 = 5.287.
Indicateurs D’où le nombre de classe est p = 5. Nous avons xmin = 5.11 et
statistiques
xmax = 6.11, d’ou e = 1 et a = 15 = 0.2.
Couples de
variables
statistiques et
corrélation
Classe Effectifs ni Fréquences fi FC
Représentation
graphique du nuage
[5.11, 5.31] 4 0.2 0.2
de points
Ajustement linéaire
]5.31, 5.51] 3 0.15 0.35
]5.51, 5.71] 6 0.3 0.65
]5.71, 5.91] 3 0.15 0.8
]5.91, 6.11] 4 0.2 1
Total 20 1 -
Statistiques
Descriptives
Jmaei Asma
Exemple
Introduction
Pour un groupe de 15 étudiants, on a observé les valeurs des
Termenologie variables : Couleur des Yeux, Sexe, Mention au Bac.
Types de variables
statistiques
Collecte des
données Couleur des Yeux Sex Mention au Bac
Représentation V H P
graphique des B H AB
données
N H P
Indicateurs M H P
statistiques B F AB Couleur des Yeux Bleu Marron Noir Vert
Couples de V F P Effectif : ni 4 3 4 4
variables N H B Fréquence : fi 0.267 0.2 0.267 0.26
statistiques et M H AB Mention P AB B TB
corrélation B F P Effectif : ni 8 4 2 1
Représentation V F B Fréquence : fi 0.533 0.267 0.133 0.067
graphique du nuage
de points N F P
Ajustement linéaire B F TB
V H AB
N H P
M F P
Couples de
fréquences).
variables
statistiques et
corrélation
Représentation
graphique du nuage
de points
Ajustement linéaire
Collecte des
données
Représentation
graphique des
données
Indicateurs
statistiques
Couples de
variables
statistiques et
corrélation
Représentation
graphique du nuage
de points
Ajustement linéaire
Couples de
variables
statistiques et
corrélation
Représentation
graphique du nuage
de points
Ajustement linéaire
Statistiques
Descriptives
Remarque : Si les classes ne sont pas de même amplitude, on
Jmaei Asma
doit obligatoirement corriger les effectifs et les fréquences (c’est
Introduction à dire rendre les classes de même amplitude on prendra la plus
Termenologie
Types de variables petite amplitude) avant de :
statistiques
Couples de
Exemple
variables
statistiques et Temps passé devant les écrans par 36 étudiants pendant une
corrélation
Représentation
certaine journée.
graphique du nuage
de points Classe [xi ,xi+1 [ [0, 15[ [15, 30[ [30, 60[ [60, 120[ [120, 180[
Ajustement linéaire
Amplitude ∆i 15 15 30 60 60
Effectif ni 7 5 8 12 4
Les classes ne sont pas de même amplitude, il faut donc corriger
les données, la plus petite amplitude est a = 15.
Statistiques
Descriptives
La fonction cumulative souvent notée par F , est la fonction
Jmaei Asma
qui associe à tout nombre réel t la proportion F (t), des individus
pour lesquels on a observé une valeur de la variable plus petite
Introduction
Termenologie
ou égale à t.
Types de variables
statistiques
Collecte des
données
Représentation
graphique des
données
Indicateurs
statistiques
Couples de
variables
statistiques et
corrélation
Représentation
graphique du nuage
de points
Ajustement linéaire
Statistiques
Descriptives
- Mode : C’est la modalité qui admet l’effectif le plus élévé. Une
Jmaei Asma
série peut etre unimodale (un seul mode) ou plurimodale
Introduction (plusqu’un mode).
Termenologie
Types de variables
statistiques
Collecte des
Modalité : xi 7 8 9 10 11 12
données
Représentation
graphique des
Effectif : ni 1 3 4 7 3 2
données
Statistiques
Descriptives Données brutes : On considère la série ordonnée :
Jmaei Asma
Introduction
x1 ≤ x2 ≤ ... ≤ xn
Termenologie
Types de variables
statistiques .
Collecte des
données Si n est impair : Me = x n+1 .
2
Représentation
graphique des x n +x n+2
données 2
Si n est pair : Me = 2
2
.
Indicateurs
statistiques
Couples de Exemple
variables
statistiques et On considère les séries statistiques suivantes
corrélation
Représentation
graphique du nuage
6, 6, 6, 8, 9, 9, 12, 13, 13, 13, 17, 17, 17
de points
Ajustement linéaire
L’effectif total est impair n = 13 : la médiane est Me = x7 = 12.
7, 7, 8, 9, 10,11, 11, 14, 16, 16
L’effectif total est pair n = 10 : la médiane est
Me = x5 +x2
6
= 10+11
2 = 10.5
Statistiques
Descriptives Données classées dans un tableau :
Jmaei Asma
Introduction
xi 10 20 30 40 50 60
Termenologie
Types de variables
statistiques
ni 3 8 4 9 3 3
Collecte des effectifs cumulés 3 11 15 24 27 30
données
Représentation
graphique des
données
On a n = 30, donc n est pair d’où n2 = 15 et
Indicateurs
Me = x15 +x
2
16
= 30+40
2 = 35. x16 = 40 car le premier effectif
statistiques
cumulé supérieur ou égal à 16 est 24 et x24 = 40.
Couples de
variables
statistiques et
corrélation xi 10 20 30 40 50 60
Représentation
graphique du nuage
de points
ni 4 9 5 8 3 4
Ajustement linéaire
effectifs cumulés 4 13 18 26 29 33
On a n = 33 donc n est impair d’où n+1 2 = 17 et Me = x17 = 30
car le premier effectif cumulé supérieur ou égal à 17 est 18 et
x18 = 30.
Jmaei Asma (LGLSI2) Statistiques Descriptives A.U : 2024-2025 20 / 50
Indicateurs statistiques
Jmaei Asma
Les quartiles sont les valeurs de la variable qui partagent la
population en 4 groupes de même effectif.
Introduction
Termenologie
Q3 − Q1 est dit intervalle inter-quartile.
Types de variables
statistiques Les déciles sont les valeurs de la variable qui partagent la
Collecte des
données
population en 10 groupes de même effectif.
Représentation
graphique des Les centiles sont les valeurs de la variable qui partagent la
données
Indicateurs
population en 100 groupes de même effectif
statistiques
Couples de Exemple
variables
statistiques et
corrélation
On considère les séries statistiques suivantes
Représentation
graphique du nuage
6, 6, 6, 8, 9, 9, 12, 13, 13, 13, 17, 17, 17
de points
Ajustement linéaire
L’effectif total est impair (n = 13). Les quantiles sont
Q1 = 6+8 13+7
2 = 7, Q2 = Me = x7 = 12, Q3 = 2 = 10.
7, 7, 8, 9, 10,11, 11, 14, 16, 16
L’effectif total est pair (n = 10). Les quantiles sont
Q1 = 8, Q2 = Me = 10+11 2 = 10.5, Q3 = 14.
Jmaei Asma (LGLSI2) Statistiques Descriptives A.U : 2024-2025 21 / 50
Indicateurs statistiques
Statistiques
Descriptives
Jmaei Asma
Données classées dans un tableau :
Introduction xi 10 20 30 xi 40 50 60
Termenologie
Types de variables ni 3 8 4 ni 9 3 3
statistiques
Collecte des
effectifs cumulés 3 11 15 effectifs cumulés 9 12 15
données n 30
Représentation On a n1 = 2 = 2 = 15, donc n1 est impair d’où
graphique des
données
Couples de
variables .
statistiques et xi 10 20 30 xi 30 40 50 60
corrélation
Représentation ni 4 9 3 ni 1 8 3 4
graphique du nuage
de points effectifs cumulés 4 13 16 effectifs cumulés 1 9 12 16
Ajustement linéaire
n1
On a n1 = n−1 32
2 = 2 = 16 donc n1 est pair d’où 2 = 8 et on a
x8 +x9 20+20
Q1 = Me(S1 ) = 2 = 2 = 20, Q2 = Me = 30 et
Q3 = Me(S2 ) = 40+40
2 = 40.
Statistiques
Descriptives
Jmaei Asma
Introduction Exemple
Termenologie
Types de variables
statistiques
Les notes sur 20 obtenus lors d’un devoir de probabilités et
Collecte des statistiques dans une classe de la FSG.
données
Représentation
graphique des
données xi 7 8 9 10 1 12
Indicateurs
statistiques ni 1 3 4 7 3 2
Couples de
variables
EC 1 4 8 15 18 20
statistiques et
corrélation On a n = 20, donc n est pair d’où n2 = 10 et
Représentation
graphique du nuage
de points Me = x10 +x
2
11
= 10+10
2 = 10. x10 = 10 car le premier effectif
Ajustement linéaire
cumulé supérieur ou égal à 10 est 15 et x15 = 10.
Statistiques
Descriptives Exemple
Jmaei Asma
xi 7 8 9 10 xi 10 11 12
Introduction ni 1 3 4 2 ni 5 3 2
Termenologie
Types de variables
statistiques
EC 1 4 8 10 EC 5 8 10
n1
Collecte des
données
On a n1 = n2 = 20
2 = 10, donc n1 est pair d’où 2 = 5 et on a
x5 +x6 9+9
Représentation
graphique des
Q1 = Me(S1 ) = 2 = 2 = 9, Q2 = Me = 10 et
Q3 = Me(S2 ) = x5 +x = 10+11
données
2
6
2 = 10.5.
Indicateurs
statistiques
Couples de
variables
statistiques et Diagramme en boîtes :
corrélation
Représentation
graphique du nuage
de points
Ajustement linéaire
Statistiques
Descriptives
Remarque : Quand la variable est continue, le calcul se fait par
Jmaei Asma
approximation : on traite les variables par interpolation linéaire
comme si les effectifs étaient uniformément répartis à l’intérieur
Introduction
Termenologie
d’une classe.
Types de variables
statistiques
Exemple
Collecte des
données Classe [xi ,xi+1 [ [500, 700[ [700, 900[ [900, 1100[ [1100, 1300]
Représentation
graphique des
données
fréquence fi 0.21 0.34 0.25 0.2
Indicateurs
statistiques La fréquence maximale est 0.34, donc la classe modale est
Couples de [700, 900[. On a
variables
statistiques et
corrélation fi − fi−1
Représentation Mode = xi + a ∗
graphique du nuage
de points
(fi − fi−1 ) + (fi − fi+1 )
Ajustement linéaire
Statistiques
Descriptives
Exemple
Jmaei Asma
Application numérique : xi = 700, a = 200, fi = 0.34,
Introduction
Termenologie
fi−1 = 0.21 et fi+1 = 0.25, on a
Types de variables
statistiques
0.34 − 0.21
Collecte des Mode = 700 + a ∗ = 818.1818182
données (0.34 − 0.21) + (0.34 − 0.25)
Représentation
graphique des
données
Couples de
nouveau modèle :
variables
statistiques et
corrélation
Consommation en litre Effectifs ni Fréquences fi FC
Représentation
graphique du nuage
[5.11, 5.31] 4 0.2 0.2
de points
]5.31, 5.51] 3 0.15 0.35
Ajustement linéaire
]5.51, 5.71] 6 0.3 0.65
]5.71, 5.91] 3 0.15 0.8
]5.91, 6.11] 4 0.2 1
Total 20 1 -
Statistiques
Descriptives
Jmaei Asma
Exemple
Introduction
Termenologie
L’effectif maximale est 6, donc la classe modale est ]5.51, 5.71] .
Types de variables
statistiques
On a xi+1 = 5.71, a = 0.2 ,ni = 6, ni−1 = 3 et ni+1 = 3.
Collecte des
données 6−3
Représentation Mode = 5.71 − 0.2 ∗ = 5.61
graphique des
données
(6 − 3) + (6 − 3)
Indicateurs
statistiques La médiane est la solution de l’équation F (x ) = 0, 5. Pour la
Couples de
variables
déterminer, on commence par déterminer la classe médiane
statistiques et
corrélation
]xi , xi+1 ] qui vérifie F (xi ) ≤ 0, 5 et F (xi+1 ) ≥ 0, 5
Représentation
graphique du nuage
La médine Me (qui appartient à la classe médiane) est
de points
Ajustement linéaire
0.5 − F (xi )
Me = xi + (xi+1 − xi )
F (xi+1 ) − F (xi )
Statistiques
Descriptives
Jmaei Asma
Exemple
- Etude de la consommation aux 100 km de 20 voitures d’un
Introduction
Termenologie nouveau modèle. La classe médiane est ]5.51, 5.71] et on a
Types de variables
statistiques
0.5 − 0.35
Collecte des
données
Me = 5.51 + 0.2 ∗ = 5.54
Représentation
0.65 − 0.35
graphique des
données
Indicateurs
- Temps passé devant les écrans par 36 étudiants pendant une
statistiques certaine journée.
Couples de
variables
statistiques et [xi ,xi+1 [ [0, 15[ [15, 30[ [30, 60[ [60, 120[ [120, 180[
corrélation fi 0.194 0.140 0.222 0.333 0.111
Représentation
graphique du nuage FC 0.194 0.334 0.556 0.889 1
de points
Ajustement linéaire
La classe médiane est [30, 60[ et on a
0.5 − 0.334
Me = 30 + 30 ∗ = 52.432
0.556 − 0.334
Statistiques
Descriptives
Statistiques
Descriptives
Indicateurs
statistiques
Couples de
variables
statistiques et
corrélation
Représentation
graphique du nuage
de points
Ajustement linéaire
Statistiques
Descriptives
Jmaei Asma
- La moyenne
Introduction
Données brutes :
n
Termenologie 1X
Types de variables x̄ = xi
statistiques n i=1
Collecte des
données
Représentation
Données groupées pour caractère discret :
graphique des
données
r r
Indicateurs 1X X
statistiques x̄ = ni xi = fi x i
n i=1 i=1
Couples de
variables
statistiques et
corrélation
Données classées pour caractère continus : Il suffit de
Représentation
graphique du nuage
remplacer xi par ci
de points
Ajustement linéaire
r r
1X X
x̄ = ni ci = fi ci
n i=1 i=1
Statistiques
Descriptives
Jmaei Asma
Exemple
Introduction
Termenologie
On considère la serie suivante
Types de variables
statistiques 10, 8, 11, 9, 12, 10, 8, 10, 7, 9, 10, 11, 12, 10, 8, 9, 10, 9, 10, 11.
Collecte des
données
Représentation x̄ = 10+8+11+9+12+10+8+10+7+9+10+11+12+10+8+9+10+9+10+11
20
graphique des
données
= 9.7
Indicateurs
statistiques
Autrement
Couples de
variables Modalité : xi 7 8 9 10 11 12 Total
statistiques et
corrélation
Effectif : ni 1 3 4 7 3 2 n1 + ...n6 = 20
Représentation ni xi 7 24 36 70 33 24 n1 x1 + ... + n6 x6 = 194
graphique du nuage
de points Fréquence : fi 0.05 0.15 0.2 0.35 0.15 0.1 f1 + +f6 = 1
Ajustement linéaire
x̄ = 1∗7+3∗8+4∗9+7∗10+3∗11+2∗12
20
= 0.05 ∗ 7 + 0.15 ∗ 8 + 0.2 ∗ 9 + 0.35 ∗ 10 + 0.15 ∗ 11 + 0.1 ∗ 12 = 9.7
Statistiques
Descriptives
Exemple
Jmaei Asma
Classe : [xi , xi+1 [ [0, 15[ [15, 30[ [30, 60[ [60, 120[ [120, 180[ Total
Introduction Centre ci 7.5 22.5 45 90 150 -
Termenologie Effectif ni 7 5 8 12 4 n1 + ... + n5 = 34
Types de variables ni ci 52.5 112.5 360 1080 600 n1 c1 + ... + n5 C5 = 2205
statistiques
7∗7.5+5∗22.5+8∗45+12∗90+4∗150
Collecte des x̄ = 34 = 61.25
données
Représentation
graphique des
données Remarque :
Indicateurs
statistiques La médiane n’est pas influencée par les valeurs extrêmes de
Couples de la variable mais elle se prête mal aux calculs statistiques.
variables
statistiques et
corrélation
La moyenne est facile à calculer mais elle est fortement
Représentation
graphique du nuage
influencée par les valeurs extrêmes.
de points
Ajustement linéaire La somme des écarts à la moyenne est nulle
n
X
(xi − x̄ ) = 0
i=1
Statistiques
Descriptives On appelle étendue, la différence entre la plus grande et la plus
Jmaei Asma petite modalité du caractère : e = xmax − xmin .
Introduction - L’Ecart type : s Il mesure l’écart entre les données et leur
Termenologie
Types de variables
moyenne.
- La Variance : s 2 le carré de l’écart type.
statistiques
Collecte des
données
Représentation
Données brutes :
graphique des
données n n
1X 1X
Indicateurs s2 = (xi − x̄ )2 = x 2 − x̄ 2
statistiques n i=1 n i=1 i
Couples de
variables
statistiques et
corrélation
Données groupées pour caractère discret :
Représentation
graphique du nuage r r
de points 1X 1X
Ajustement linéaire s2 = ni (xi − x̄ )2 = ni x 2 − x̄ 2
n i=1 n i=1 i
Statistiques
Descriptives
Exemple
Jmaei Asma
Modalité : xi 7 8 9 10 11 12 Total
Introduction 6
X
Termenologie Effectif : ni 1 3 4 7 3 2 n= ni = 20
Types de variables i=1
statistiques
6
X
Collecte des ni xi2 49 192 324 700 363 288 ni xi2 = 1916
données i=1
Représentation
2 2 2 2 +3∗112 +2∗122
graphique des
s 2 = 1∗7 +3∗8 +4∗9 +7∗10 − x̄ 2 = 1916
− 9.72 = 1.71.
données
√ 20 20
Indicateurs
statistiques
D’où s = s 2 = 1.308.
Couples de
Classe [xi ,xi+1 [ [0, 15[ [15, 30[ [30, 60[ [60, 120[ [120, 180[ Total
variables
Centre ci 7.5 22.5 45 90 150 -
statistiques et 5
corrélation X
Effectif ni 7 5 8 12 4 ni = 36
Représentation i=1
graphique du nuage 5
de points
X
ni ci2 393.75 2531.25 16200 97200 90000 ni ci2 = 206325
Ajustement linéaire
i=1
2 2 2 2 2
s 2 = 7∗7.5 +5∗22.5 +8∗45
36
+12∗90 +4∗150
− x̄ 2
= 206325 − 61.252 = 1979.6875.
36 √
D’où s = s 2 = 44.49.
Statistiques
Descriptives
Jmaei Asma
Introduction
Termenologie
Types de variables
statistiques Dans cette partie, consacrée à l’étude simultanée de deux
Collecte des variables quantitatives, tableau à deux entrées, nous allons ainsi
données
Représentation introduire :
graphique des
données
le graphique appelé nuage de points
Indicateurs
statistiques
les notions de covariance, de coefficient de corrélation
Couples de
variables linéaire
statistiques et
corrélation la droite de régression linéaire
Représentation
graphique du nuage
de points
Ajustement linéaire
Statistiques
Descriptives
Jmaei Asma
Introduction
Termenologie Une étude simultanée sur deux variables quantitatives X et Y
Types de variables
statistiques sur une population de n individus a donné les différents points de
Collecte des mesures :
données
Représentation
graphique des
(x1 , y1 ), (x2 , y2 ), (x3 , y3 ), ..., (xn , yn )
données
Statistiques
Descriptives Exemple
Jmaei Asma
On mesure la taille X et le poids Y et de 20 individus.
Introduction
Termenologie
Types de variables
statistiques
xi yi xi yi
Collecte des 155 60 180 75
données
Représentation
graphique des
162 61 175 76
données
Indicateurs
157 64 173 78
statistiques
Couples de
170 67 175 80
variables
statistiques et
164 68 179 85
corrélation
Représentation
graphique du nuage
162 69 175 90
de points
Ajustement linéaire 169 70 180 96
170 70 185 96
178 72 189 98
173 73 187 101
Jmaei Asma (LGLSI2) Statistiques Descriptives A.U : 2024-2025 38 / 50
Couples de variables statistiques et corrélation Représentation graphique du nuage de points
Statistiques
Descriptives
Jmaei Asma
Collecte des
variances :
données
Représentation n n
graphique des 1X 1X
données
x̄ = xi , sx2 = (xi − x̄ )2
Indicateurs n i=1 n i=1
statistiques
n n
Couples de 1X 2 1X
variables ȳ = yi , sy = (yi − ȳ )2
statistiques et
corrélation
n i=1 n i=1
Représentation
graphique du nuage
de points Le point G de coordonnées (x̄ , ȳ ) est appelé le point moyen du
Ajustement linéaire
nuage de points.
Statistiques
Descriptives
Jmaei Asma
Statistiques
Descriptives
Jmaei Asma
Covariance et coefficient de corrélation : La covariance des
Introduction
Termenologie
variables X et Y s’écrit :
Types de variables
n n
statistiques
1X 1X
Collecte des sxy = (xi − x̄ )(yi − ȳ ) = xi yi − x̄ ȳ
données n i=1 n i=1
Représentation
graphique des
données
Indicateurs
La covariance dépend des unités de mesures dans lesquelles sont
statistiques exprimées les variables.
Couples de
variables
De même, on définit le coefficient de corrélation :
statistiques et
corrélation sxy
Représentation ρxy =
graphique du nuage
de points
sx sy
Ajustement linéaire
Statistiques
Descriptives
Jmaei Asma
Remarque :
Introduction
Termenologie −1 ≤ ρxy ≤ 1.
Types de variables
statistiques
Si |ρxy | = 1 les points (xi , yi ), i = 1, ..., n sont alignés, alors
Collecte des
données il existe une liaison linéaire entre X et Y c’est à dire, il
Représentation
graphique des existe deux réels a et b tel que Y = aX + b.
données
Statistiques
Descriptives
Jmaei Asma
Introduction
Termenologie
Types de variables
statistiques
Collecte des
données
Représentation
graphique des
données
Indicateurs
statistiques
Couples de
variables
statistiques et
corrélation
Représentation
graphique du nuage
de points
Ajustement linéaire
Statistiques
Descriptives
Jmaei Asma
Exemple
Introduction xi yi xiyi xi2 yi2
Termenologie 155 60 9300 24025 3600
Types de variables
162 61 9882 26244 3721
statistiques 157 64 10048 24649 4096
170 67 11390 28900 4489
Collecte des 164 68 11152 26896 4624
données 162 69 11178 26244 4761
169 70 11830 28561 4900
Représentation 170 70 11900 28900 4900
graphique des
données
178 72 12816 31684 5184 x̄ = 3458 1549
20 = 172.9,ȳ = 20 = 77, 45,
173 73 12629 29929 5329 sx2 = 599592 − 172.92 = 85.19, sy2 = 123051 − 77.452 = 154.0475,
180 75 13500 32400 5625 20 20
Indicateurs sxy = 269833 100.545
− 172.9 ∗ 77.45 = 100.545,ρxy = √85.19∗154.047 = 0.88.
175 76 13300 30625 5776 20
statistiques 173 78 13494 29929 6084
175 80 14000 30625 6400
Couples de 179 85 15215 32041 7225
variables 175 90 15750 30625 8100
statistiques et 180 96 17280 32400 9216
corrélation 185 96 17760 34225 9216
189 98 18522 35721 9604
Représentation
graphique du nuage 187 101 18887 34969 10201
de points 3458 1549 269833 599592 123051
Ajustement linéaire
Statistiques
Descriptives
Droite de régression :
Jmaei Asma
Si ρxy est proche de 1 (|ρxy | > 0.8) et si l’examen du nuage de
points indique qu’on peut supposer une relation de type linéaire
Introduction
Termenologie
entre X et Y , alors on cherche à déterminer les réels a et b de la
Types de variables
statistiques droite Y = aX + b telle que la distance entre cette droite et
Collecte des chaque point du nuage soit la plus petite possible.
données
Représentation La méthode des moindres carrés propose cette notion de
graphique des
données
proximité entre la droite et le nuage des points. elle consiste à
Indicateurs
statistiques minimiser la fonction
Couples de n
variables X
statistiques et φ(a, b) = (yi − axi − b)2
corrélation
Représentation
i=1
graphique du nuage
de points
Ajustement linéaire Si on note x̄ et ȳ les moyennes respectives de X et Y , alors le
couple (â, b̂) qui minimise la fonction φ est
sxy
â = , b̂ = ȳ − âx̄
sx2
Statistiques
Descriptives
Jmaei Asma
Introduction
Termenologie
Types de variables
La droite de régression y = âx + b̂ passe par le point moyen
statistiques
G(x̄ , ȳ ).
Collecte des
données
Représentation
graphique des
données
Résidus et valeurs ajustées :
Indicateurs Les valeurs ajustées sont : yi∗ = âxi + b̂, i = 1, ..., n. Ils sont les
statistiques
“prédictions” des yi réalisées au moyen de la variable X et de la
Couples de
variables droite de régression de y en x .
statistiques et
corrélation Les résidus sont les différences entre les valeurs observées et les
Représentation
graphique du nuage valeurs ajustées : ei = yi − yi∗ . Ils sont de moyenne nulle.
de points
Ajustement linéaire
Statistiques
Descriptives
Equation de la variance :
Jmaei Asma On appelle somme des carrés totale :
Introduction n
X
Termenologie
Types de variables
ST = (yi − ȳ )2 = nsy2
statistiques
i=1
Collecte des
données On appelle somme des carrés de la régression :
Représentation
graphique des
données n
(yi∗ − ȳ )2
X
Indicateurs
statistiques
SR =
i=1
Couples de
variables
statistiques et On appelle somme des carrés résiduelle :
corrélation
Représentation
graphique du nuage
n
(yi − yi∗ )2
X
de points
Ajustement linéaire
SE =
i=1
Statistiques
Descriptives
Jmaei Asma
Introduction
Collecte des
expliqué par la régression :
données
Représentation
Si R 2 est proche de 1, la qualité de la prédiction par le
graphique des
données modèle de régression linéaire est bonne : le nuage de points
Indicateurs
statistiques
est resserré autour de la droite.
Couples de Si R 2 est proche de 0, la qualité de la prédiction est
variables
statistiques et mauvaise.
corrélation
Représentation
graphique du nuage
Un R 2 égal à 1 est synonyme de prédiction parfaite.
de points
Ajustement linéaire
Statistiques
Descriptives
Jmaei Asma
Introduction
Termenologie
Exemple
Types de variables
statistiques On prend les variables la taille X et le poids Y et de 20 individus.
Collecte des
données
On a trouvé x̄ = 172.9, ȳ = 77, 45, sx2 = 85.19, sy2 = 154.0475,
Représentation
graphique des
sxy = 100.545, ρxy = 0.88.
données
On a ρxy = 0.88 > 0.8 donc on peut approché Y par la droite
Indicateurs s
statistiques aX + b avec â = sxy2 = 100.545
85.19 = 1.18,
x
Couples de
variables b̂ = ȳ − âx̄ = 77.45− = 100.545
85.19 ∗ 172.9 = −126.614.
statistiques et
corrélation La droite de régression est y = 1.18 ∗ x − 126.614.
Représentation
graphique du nuage
Elle passe par les points (0,-126.614) et (172.9,77.45).
On a ST = 3080.95, SR = 2373.353, SE = 707.597, R 2 = 0.77.
de points
Ajustement linéaire
Statistiques
Descriptives
Jmaei Asma
Introduction
Termenologie
Types de variables
statistiques
Collecte des
données
Représentation
graphique des
données
Indicateurs
statistiques
Couples de
variables
statistiques et
corrélation
Représentation
graphique du nuage
de points
Ajustement linéaire