Classification des Variables Quantitatives
Classification des Variables Quantitatives
QUANTITATIVES
Dr Houda BEN AYED
Service de Médecine Préventive et d’Hygiène Hospitalière
2022-2023
VARIABLES
STATISTIQUES
Variables Variables
qualitatives quantitatives
VARIABLES
STATISTIQUES
Variables Variables
qualitatives quantitatives
Plan
Définition d’une variable quantitative
Mesures de dispersion
Application
Plan
Définition d’une variable quantitative
Mesures de dispersion
Application
Variables quantitatives
• Variable quantitative: C’est le résultat d’une mesure effectuée sur chaque objet de la
série statistique.
❑ Elles peuvent être exprimées selon une unité de mesure et «peuvent être comparées
Mesures de dispersion
Application
Types de variables
VARIABLES
STATISTIQUES
Variables Variables
qualitatives quantitatives
Variables Variables
qualitatives quantitatives
• Remarque: une variable quantitative continue peut être exprimée sous la forme
d’une variable quantitative discrète. C’est remplacer une échelle élémentaire en
une échelle par classes dont chacune sera représentée par sa valeur centrale.
❑ Exemple : la taille (on peut imaginer une infinité de valeurs entre une
Variables Variables
qualitatives quantitatives
❑ Les valeurs que peut prendre une variable quantitative discrète, sur un
parité, gestité, ….
Variables quantitatives discrètes
Ménage Français par rapport à leur effectif en 1989
Mesures de dispersion
Application
Mesures de fréquence des variables quantitatives
Mesure des
variables
quantitatives
Mesures de
Mesures de
tendance
dispersion
centrale
Mesures de fréquence des variables quantitatives
Mesure des
variables
quantitatives
Mesures de
Mesures de
tendance
dispersion
centrale
Mesures de tendance centrale
• Graphiquement, si on représente l’ensemble de mesures
observées sur un échantillon, on voit généralement que toutes
les mesures oscillent autour de mesures centrales, qu’on appelle
mesures de tendance centrale, de position.
On représente graphiquement
l’ensemble des mesures de glycémie
effectuées chez des ouvriers
Mesures de fréquence des variables
quantitatives
Mesures de
tendance centrale
Arithmétique Géométrique
Mesures de tendance centrale
• Intérêt:
Arithmétique Géométrique
Moyenne arithmétique
• La moyenne arithmétique est la plus utilisée de toutes les mesures de tendance
centrale
• La moyenne arithmétique (ma) est la somme de chacune des valeurs observées des
variables divisées par le nombre de valeurs observées, c’est-à-dire par la fréquence
totale.
Moyenne arithmétique
• Si on désigne les n valeurs observées d’une variable par x1, x2…., xn,
ou en abrégé
ma =
x1 + x2 + ... + xn
ma =
(x ) i
n n
3 + 5 + 8 + 9 + 12 + 12
Exemple: Pour la série: 3-5-8-9-12-12 ma =
6
= 8,16
Moyenne arithmétique: Exemple
• Soit la série correspondant aux tailles en cm de 6
étudiants : 160,170,180,180, 190, 200.
n = 6; T = 160+170+180+180+190+200 = 1080
1080
x= = 180 cm
6
Moyenne arithmétique: Exemple
Dans une usine de 400 ouvriers, nous avons sélectionné un échantillon de 40 ouvriers chez
les quels nous avons effectué un prélèvement sanguin pour mesurer leur glycémie (g/l). Nous
avons trouvé les chiffres suivants:
1.28 0.92 1.09 1.14 1.50 0.93 1.17 1.25 1.06 1.02
1.12 1.03 1.16 1.05 1.08 1.45 1.22 0.98 0.67 1.06
0.95 1.09 1.20 1.09 0.96 0.69 1.18 0.87 1.26 0.99
1.28 0.92 1.09 1.14 1.50 0.93 1.17 1.25 1.06 1.02
1.12 1.03 1.16 1.05 1.08 1.45 1.22 0.98 0.67 1.06
0.95 1.09 1.20 1.09 0.96 0.69 1.18 0.87 1.26 0.99
Ma: Peut être calculée sur des données quantitatives discrètes ou continues.
1 326
2 450
3 124
4 100
Moyenne arithmétique
Pour les variables quantitatives discrètes
x1 + x2 + ... + xn
Nombre d’enfants Effectif des familles ma =
n
1 326
2 450
ma =
(x ) i
3 124
4 100
n
Glycémie Effectif
-- Glycémie <1g/dl (g/dl) observé
0.67≤G<1 12
- Glycémie entre 1 et 1.26 g/dl 1≤G≤1,26 24
1,26<G≤1,62 4
- Glycémie >1.26g/dl Total 40
Moyenne arithmétique
1.20 1.18 0.95 0.98 1 1.14 1.25 1.62 1.26 0.95
1.28 0.92 1.09 1.14 1.50 0.93 1.17 1.25 1.06 1.02
1.12 1.03 1.16 1.05 1.08 1.45 1.22 0.98 0.67 1.06
0.95 1.09 1.20 1.09 0.96 0.69 1.18 0.87 1.26 0.99
Glycémie Effectif
Si on dispose uniquement des données résumées dans ce
(g/dl) observé
tableau: 0.67≤G<1 12
1≤G≤1,26 24
Calculer la moyenne arithmétique?
1,26<G≤1,62 4
Total 40
Moyenne arithmétique
On considère les centres des classes de glycémie:
Glycémie (g/dl) Centre de classe Effectif
observé
0.67≤G<1 (0.67+1)/2 = 0.83 12 Comment calculer la moyenne arithmétique?
1≤G≤1,26 (1+1.26)/2=1.13 24
1,26<G≤1,62 (1.26+1.62)/2=1.44 4
>1,62 0
Total 42,84 40
Avantages
NB: La moyenne d'un groupe résultant de la fusion d'autres groupes n'est égale à
la moyenne des moyennes que si tous les groupes ont le même effectif
Mesures de fréquence des variables
quantitatives
Mesures de
tendance centrale
Arithmétique Géométrique
Les autres moyennes
n1 n2 nk
G= n x x .....x
1 2 k
Mesures de fréquence des variables
quantitatives
Mesures de
tendance centrale
Arithmétique Géométrique
La médiane
• La médiane : valeur qui divise l’ensemble des
valeurs observées, disposées en ordre croissant
ou décroissant, en deux parties égales, c’est à
dire de même fréquence.
3 4 4 5 6 8 8 9 10 3 4 4 5 6 8 8 9
Série: 3- 5- 8- 9- 12- 12 ,
Série 3- 5- 8- 9-12 : n= 5,
0.67 0.69 0.87 0.92 0.93 0.95 0.95 0.95 0.96 0.98
0.98 0.99 1 1.02 1.03 1.05 1.06 1.06 1.08 1.09
1.09 1.09 1.12 1.14 1.14 1.16 1.17 1.18 1.18 1.20
1.20 1.22 1.25 1.25 1.26 1.26 1.28 1.45 1.50 1.62
La Médiane
0.67 0.69 0.87 0.92 0.93 0.95 0.95 0.95 0.96 0.98
0.98 0.99 1 1.02 1.03 1.05 1.06 1.06 1.08 1.09
1.09 1.09 1.12 1.14 1.14 1.16 1.17 1.18 1.18 1.20
1.20 1.22 1.25 1.25 1.26 1.26 1.28 1.45 1.50 1.62
Avantages
Inconvénients
Par exemple:
Série: 3- 5- 8- 9- 12- 12 -1000
La médiane: 9
Inconvénients
Arithmétique Géométrique
Mode
• Rappel :
• Dans les distributions en cloche, unimodales
symétriques, mode, médiane et moyenne
sont confondus.
Mode
Il peut y en avoir plus d’un, comme il peut ne pas
exister.
Exemple: Pour la série (3-5-6-6-7-7-7-7-8-8-9)
le mode = 7
Avantages
Inconvénients
230 235 200 175 170 290 181 245 150 190
120 145 220 225 215 195 200 230 240 200
235 165 265 210 250 210 215 190 270 250
Exemple
120 145 150 165 170 175 181 190 190 195
200 200 200 210 210 215 215 220 225 230
230 235 235 240 245 250 250 265 270 290
Exemple 130
150
170
1
2
3
1
3
6
190 4 10
210 7 17
• Moyenne arithmétique: 230 6 23
250 4 27
30
= 212,66 mg/100ml
Stabilité
extrêmes.
Stabilité
•La moyenne arithmétique est moins sensible que la médiane et le mode aux
•La médiane exige au moins une échelle ordinale, pas pour une échelle nominale,
•Le mode: aussi bien pour des variables quantitatives que qualitatives.
Position relative des 4 mesures
droite
mode.
Position relative des 4 mesures
Mesures de dispersion
Application
Mesures de fréquence des variables quantitatives
Mesure des
variables
quantitatives
Mesures de
Mesures de
tendance
dispersion
centrale
Mesures de dispersion
Définition
• Les mesures de dispersion:
Mesures de
dispersion
Intervalle
Coefficient
Etendue Variance Ecart type semi-
de variation
interquartile
Mesures de dispersion
Mesures de
dispersion
Intervalle
Coefficient
Etendue Variance Ecart type semi-
de variation
interquartile
Etendue
Mesures de
dispersion
Intervalle
Coefficient
Etendue Variance Ecart type semi-
de variation
interquartile
Variance
133 0
• Le signe: de quel côté de la moyenne
140 +7
se situe la valeur observée.
Variance et écart type
N −1
Variance et écart type
Exemple:
x= 10+ 4+ 6+ 8 + 14 = 42 (x)²
x ² −
S² = N
x2= 102+42+ 62+82+142 = 412 N −1
422
• S2 = 412 − unités2
5 = 14,8
4
Variance et écart type
• Elle est nulle lorsque toutes les valeurs observées sont égales.
années carrées.
Mesures de dispersion
Mesures de
dispersion
Intervalle
Coefficient
Etendue Variance Ecart type semi-
de variation
interquartile
Variance et écart type
S=
(x - m ) a ²
n
Variance et écart type
Exemple:
• Pour la série de valeurs: 10- 4 - 6 - 8-14
x= 10+ 4+ 6+ 8 + 14 = 42
= 102+42+ 62+82+142 = 412
x 2
• S2 = 422 unités2
412 −
5 = 14,8
4
• S= 3,84 unités
Application
Limites de la Centre de la Effectif X=Ni * xi xi2 X2=Ni * xi2
classe (mg/l) classe (xi) observé
[10 – 30[ 20 6 120 202=400 6*400=2400
[30 – 50[ 40 12 480 402=1600 19200
[50 – 70[ 60 20 1200 602=3600 72000
[70 – 90[ 80 37 2960 802=6400 236800
[90 – 110[ 100 58 5800 1002=10000 580000
[110 – 130[ 120 35 4200 1202=14400 504000
[130 – 150[ 140 16 2240 1402=19600 313600
[150 – 170[ 160 8 1280 1602=25600 204800
[170 – 190[ 180 5 900 1802=32400 162000
190 et plus 200 3 600 2002=40000 120000
somme 200 19780 154000 2214800
Application
Centre de la Effectif X=Ni * xi xi2 X2=Ni * xi2
classe (xi) observé
20 6 120 202=400 6*400=2400
40 12 480 402=1600 19200
60 20 1200 602=3600 72000
80 37 2960 802=6400 236800
100 58 5800 1002=10000 580000
120 35 4200 1202=14400 504000
140 16 2240 1402=19600 313600
160 8 1280 1602=25600 204800
180 5 900 1802=32400 162000
200 3 600 2002=40000 120000
200 19780 154000 2214800
Variance=2214800-[(19780)2/200]/199=1299.28
unités 2
Ecart type = 36.04 unités
Variance et écart type
Intérêt :
Exemple :
Taux d’anticorps moyen = 144.6 mU/ml Taux d’anticorps moyen = 146.4 mU/ml
Variance = 2384.4 Variance = 410.41
Ecart type= 48.38mU/ml Ecart type = 20.25 mU/ml
Mesures de
dispersion
Intervalle
Coefficient
Etendue Variance Ecart type semi-
de variation
interquartile
Coefficient de variation
TAS Cholestérol
ma= 120 mm Hg ma= 180 mg/100ml
S= 10 mm Hg S= 30 mg/100ml
variables différentes?
Coefficient de variation
correspondante.
• C. V. = S * 100/ma
CVcholestérol 16,7
= = 2,01
CVTAS 8,3
Coefficient de variation
• Exemple:
CVcholestérol 16,7
= = 2,01
CVTAS 8,3
• Remarque:
Taux d’anticorps moyen = 144.6 mU/ml Taux d’anticorps moyen = 146.4 mU/ml
Variance = 2384.4 Variance = 410.41
Ecart type= 48.38mU/ml Ecart type = 20.25 mU/ml
CV= 33,4% CV=13,8%
• CV=11.79% • CV=5.47%
CV poids/CV FC=11.79/5.47=2.15
➔ La dispersion du poids est deux fois plus importante que celle de la
fréquence cardiaque
➔ La répartition de la fréquence cardiaque est plus homogène que
celle du poids
Mesures de dispersion
Mesures de
dispersion
Intervalle
Coefficient
Etendue Variance Ecart type semi-
de variation
interquartile
Intervalle semi inter quartile
la moyenne arithmétique.
fortement dissymétriques.
Intervalle semi inter quartile
Médiane
• Q3 – Q1 est l’intervalle interquartile
• Q3 − Q1 est l’intervalle semi interquartile
2
Exemple
x = 6316 x 2
= 1373436
Q1= 185,5
N= 1 N= 8 N=15 n= 23 N = 30
Q1 Q2 Q3
• N = 30
Classe Centre de classe Effectif cumulé
Q2 : entre15 et 16 ➔ 210
[120, 140[ 130 1
[140, 160[ 150 3 Q1 : entre 7 et 8
[160, 180[ 170 6
[180, 200[ 190 10 ➔ [180 , 200] ou 190
[200, 220[ 210 17
Q 3 : entre 23 et 24
[220, 240[ 230 23
[240, 260[ 250 27 ➔ (230+250)/2=240
[260, 280[ 270 29
[280, 300[ 290 30 Q3 – Q1= 240 – 190 = 50
(Q3 – Q1)/2 = 25