0% ont trouvé ce document utile (0 vote)
59 vues133 pages

Classification des Variables Quantitatives

Le document présente une analyse des variables quantitatives, en définissant leur nature et en les classifiant en continues et discrètes. Il aborde également les mesures de tendance centrale et de dispersion, ainsi que des exemples pratiques pour illustrer le calcul de la moyenne arithmétique. Enfin, il souligne l'importance de ces mesures dans l'interprétation des données statistiques.

Transféré par

7jks8txwvx
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
59 vues133 pages

Classification des Variables Quantitatives

Le document présente une analyse des variables quantitatives, en définissant leur nature et en les classifiant en continues et discrètes. Il aborde également les mesures de tendance centrale et de dispersion, ainsi que des exemples pratiques pour illustrer le calcul de la moyenne arithmétique. Enfin, il souligne l'importance de ces mesures dans l'interprétation des données statistiques.

Transféré par

7jks8txwvx
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

LES VARIBALES

QUANTITATIVES
Dr Houda BEN AYED
Service de Médecine Préventive et d’Hygiène Hospitalière
2022-2023
VARIABLES
STATISTIQUES

Variables Variables
qualitatives quantitatives
VARIABLES
STATISTIQUES

Variables Variables
qualitatives quantitatives
Plan
Définition d’une variable quantitative

Classification des variables quantitatives

Mesures de fréquence d’une variable quantitative

Mesures de tendance centrale

Mesures de dispersion

Application
Plan
Définition d’une variable quantitative

Classification des variables quantitatives

Mesures de fréquence d’une variable qualitative

Mesures de tendance centrale

Mesures de dispersion

Application
Variables quantitatives
• Variable quantitative: C’est le résultat d’une mesure effectuée sur chaque objet de la
série statistique.

• Elle s’exprime par une valeur numérique.

❑ Un âge, une taille, une glycémie sont des variables quantitatives.

❑ Elles peuvent être exprimées selon une unité de mesure et «peuvent être comparées

entre elles, additionnées, faire l’objet de calculs de moyenne, de variance, etc.».


Plan
Définition d’une variable quantitative

Classification des variables quantitatives

Mesures de fréquence d’une variable qualitative

Mesures de tendance centrale

Mesures de dispersion

Application
Types de variables
VARIABLES
STATISTIQUES

Variables Variables
qualitatives quantitatives

Nominales Ordinales Continues Discrètes


Types de variables
VARIABLES
STATISTIQUES

Variables Variables
qualitatives quantitatives

Nominales Ordinales Continues Discrètes


Variables quantitatives continues
• Résultat de la mesure d’une grandeur : nombre  R (entre 2 valeurs il y a une
infinité de valeurs possibles)

• Exemple: la taille pour un groupe de personnes.

• Remarque: une variable quantitative continue peut être exprimée sous la forme
d’une variable quantitative discrète. C’est remplacer une échelle élémentaire en
une échelle par classes dont chacune sera représentée par sa valeur centrale.

• On perd en information et on gagne en simplicité.


Variables quantitatives continues

❑ Une variable quantitative continue peut prendre toutes les valeurs à

l’intérieur d’un intervalle.

❑ Exemple : la taille (on peut imaginer une infinité de valeurs entre une

personne mesurant 160 cm et 161 cm)


Variables quantitatives continues

❑ L’amplitude d’une classe est la différence entre la borne supérieure et la

borne inférieure de l’intervalle défini : soit [a; b[ une classe d’une

variable quantitative, on dit que (b−a) est l’amplitude de cette classe.

❑ Le centre de classe [a; b[ est le milieu de l’intervalle; c’est la moyenne

arithmétique des bornes de la classe (a+b/2).


Variables quantitatives continues
• Exemple :
❑ La taille d’un échantillon d’étudiants en médecine varie entre 122 cm
et 198 cm.
❑ Elle peut être exprimée en classes de la façon suivante, [120; 140[,
[140; 160[, [160; 200[.
❑ L’amplitude des 2 premières classes est de 20 cm, de la 3ème classe
est de 40 cm.
❑ Le centre de la classe [160; 200[ : 160+200/2 = 180 cm.
Types de variables
VARIABLES
STATISTIQUES

Variables Variables
qualitatives quantitatives

Nominales Ordinales Continues Discrètes


Variables quantitatives discrètes

❑ Les valeurs que peut prendre une variable quantitative discrète, sur un

intervalle donné, sont dénombrables.

❑ Exemples : taille de la famille, nombre d’enfants dans un ménage,

parité, gestité, ….
Variables quantitatives discrètes
Ménage Français par rapport à leur effectif en 1989

Nbe personnes Effectif Pourcentage


1 personne 7079434 31.6
2 personnes 7086664 31.6
3 personnes 3619655 16.1
4 personnes 3057674 13.6
5 personnes 1182235 5.3
6 ou plus 109189 1.8
Total 22434621 100
Plan
Définition d’une variable quantitative

Classification des variables quantitatives

Mesures de fréquence d’une variable quantitative

Mesures de tendance centrale

Mesures de dispersion

Application
Mesures de fréquence des variables quantitatives

Mesure des
variables
quantitatives

Mesures de
Mesures de
tendance
dispersion
centrale
Mesures de fréquence des variables quantitatives

Mesure des
variables
quantitatives

Mesures de
Mesures de
tendance
dispersion
centrale
Mesures de tendance centrale
• Graphiquement, si on représente l’ensemble de mesures
observées sur un échantillon, on voit généralement que toutes
les mesures oscillent autour de mesures centrales, qu’on appelle
mesures de tendance centrale, de position.

• Permettent de localiser le centre d’une distribution.


Mesures de tendance centrale

On représente graphiquement
l’ensemble des mesures de glycémie
effectuées chez des ouvriers
Mesures de fréquence des variables
quantitatives
Mesures de
tendance centrale

Moyenne Médiane Mode

Arithmétique Géométrique
Mesures de tendance centrale

• Intérêt:

➔ représentation simplifiée des observations

➔ Comparaison de la distribution de 2 variables


Mesures de fréquence des variables
quantitatives
Mesures de
tendance centrale

Moyenne Médiane Mode

Arithmétique Géométrique
Moyenne arithmétique
• La moyenne arithmétique est la plus utilisée de toutes les mesures de tendance
centrale

• On l’appelle simplement « la moyenne »

• Correspond à l’expression courante « en moyenne »: l’exemple scolaire de la note


moyenne de la classe.

• La moyenne arithmétique (ma) est la somme de chacune des valeurs observées des
variables divisées par le nombre de valeurs observées, c’est-à-dire par la fréquence
totale.
Moyenne arithmétique
• Si on désigne les n valeurs observées d’une variable par x1, x2…., xn,

ou en abrégé

ma =
x1 + x2 + ... + xn
ma =
(x ) i

n n

3 + 5 + 8 + 9 + 12 + 12
Exemple: Pour la série: 3-5-8-9-12-12 ma =
6
= 8,16
Moyenne arithmétique: Exemple
• Soit la série correspondant aux tailles en cm de 6
étudiants : 160,170,180,180, 190, 200.

n = 6; T = 160+170+180+180+190+200 = 1080

1080
x= = 180 cm
6
Moyenne arithmétique: Exemple
Dans une usine de 400 ouvriers, nous avons sélectionné un échantillon de 40 ouvriers chez
les quels nous avons effectué un prélèvement sanguin pour mesurer leur glycémie (g/l). Nous
avons trouvé les chiffres suivants:

1.20 1.18 0.95 0.98 1 1.14 1.25 1.62 1.26 0.95

1.28 0.92 1.09 1.14 1.50 0.93 1.17 1.25 1.06 1.02

1.12 1.03 1.16 1.05 1.08 1.45 1.22 0.98 0.67 1.06

0.95 1.09 1.20 1.09 0.96 0.69 1.18 0.87 1.26 0.99

Calculer la glycémie moyenne de ces sujets


Moyenne arithmétique: Exemple
Dans une usine de 400 ouvriers, nous avons sélectionné un échantillon de 40 ouvriers
chez les quels nous avons effectué un prélèvement sanguin pour mesurer leur
glycémie (g/l). Nous avons trouvé les chiffres suivants:

1.20 1.18 0.95 0.98 1 1.14 1.25 1.62 1.26 0.95

1.28 0.92 1.09 1.14 1.50 0.93 1.17 1.25 1.06 1.02

1.12 1.03 1.16 1.05 1.08 1.45 1.22 0.98 0.67 1.06

0.95 1.09 1.20 1.09 0.96 0.69 1.18 0.87 1.26 0.99

Somme des glycémies = 1.2 + 1.18 + 0.95 + … +0.99 = 43.99 g/l

Moyenne arithmétique = 43.99/40= 1.09 g/l


Moyenne arithmétique
• La moyenne arithmétique peut être calculée aussi bien sur

1. des données quantitatives discrètes


2. des données quantitatives continues.
• Si le nombre moyen d’enfants par famille de 2,4 heurte le sens
commun, il n’en demeure pas moins que cette abstraction est utile.
Moyenne arithmétique
Pour les variables quantitatives discrètes

Ma: Peut être calculée sur des données quantitatives discrètes ou continues.

Exemple: Dans une communauté de 1000 familles, nous avons énuméré le


nombre d’enfants par famille, calculer le nombre d’enfants moyen par famille:

Nombre d’enfants Effectif des familles

1 326
2 450
3 124
4 100
Moyenne arithmétique
Pour les variables quantitatives discrètes
x1 + x2 + ... + xn
Nombre d’enfants Effectif des familles ma =
n
1 326
2 450
ma =
(x ) i

3 124
4 100
n

Somme des x = (326*1)+(450*2)+(124*3)+(100*4) = 326 + 900 + 372 + 400 =1998

Moyenne arithmétique = 1998/1000 = 1.99 enfant/famille.


Moyenne arithmétique: Exemple
• Les étudiants de première année sont répartis dans 3 amphithéâtres
avec les données ci-dessous. Qu’elle est la moyenne de l’âge?

Moyenne Les effectifs étant différents dans les 3 groupes, la


de l'âge en moyenne recherchée n’est pas la moyenne des
Effectifs années moyennes.
Amphi 1 1000 18,1
• On calcule le total de l’âge des 3 groupes réunis : T
Amphi 2 500 19,5 = 18,1*1000+ 500*19,5+ 18,3*1000 =46 150.
Amphi 3 1000 18,3 • L’effectif total est de 2 500.
• La moyenne recherchée est 46150/2500 =18,5 ans
Moyenne arithmétique
Pour les variables quantitatives continues
1.20 1.18 0.95 0.98 1 1.14 1.25 1.62 1.26 0.95
1.28 0.92 1.09 1.14 1.50 0.93 1.17 1.25 1.06 1.02
1.12 1.03 1.16 1.05 1.08 1.45 1.22 0.98 0.67 1.06
0.95 1.09 1.20 1.09 0.96 0.69 1.18 0.87 1.26 0.99

Glycémie Effectif
-- Glycémie <1g/dl (g/dl) observé
0.67≤G<1 12
- Glycémie entre 1 et 1.26 g/dl 1≤G≤1,26 24
1,26<G≤1,62 4
- Glycémie >1.26g/dl Total 40
Moyenne arithmétique
1.20 1.18 0.95 0.98 1 1.14 1.25 1.62 1.26 0.95

1.28 0.92 1.09 1.14 1.50 0.93 1.17 1.25 1.06 1.02

1.12 1.03 1.16 1.05 1.08 1.45 1.22 0.98 0.67 1.06

0.95 1.09 1.20 1.09 0.96 0.69 1.18 0.87 1.26 0.99

Glycémie Effectif
Si on dispose uniquement des données résumées dans ce
(g/dl) observé
tableau: 0.67≤G<1 12
1≤G≤1,26 24
Calculer la moyenne arithmétique?
1,26<G≤1,62 4
Total 40
Moyenne arithmétique
On considère les centres des classes de glycémie:
Glycémie (g/dl) Centre de classe Effectif
observé
0.67≤G<1 (0.67+1)/2 = 0.83 12 Comment calculer la moyenne arithmétique?
1≤G≤1,26 (1+1.26)/2=1.13 24
1,26<G≤1,62 (1.26+1.62)/2=1.44 4
>1,62 0
Total 42,84 40

• Somme des glycémies:


(12*0.83)+(24*1.13)+(4*1.44)=9.96+27.12+5.76=42.84
• Moyenne arithmétique = 42.84/40= 1.07 g/dl
Moyenne arithmétique
Caractéristiques

Avantages

➢Simple, Facile à comprendre

➢ Dépend de toutes les observations qui la composent

➢ Si on ajoute une même valeur à chaque observation, elle change


Exemple: pour la série: 2 et 3, Ma = 2,5
par la même valeur Si on a 2+1 et 3+1➔ Ma = 2,5 +1

➢ Relativement stable (aux fluctuations d’échantillonnage)


Plusieurs TAS: la Ma tend vers une valeur unique
Moyenne arithmétique
Caractéristiques
Inconvénients

➢influencée par les valeurs extrêmes


Valeurs aberrantes: Valeurs aberrantes:
Changement important: Changement important:
Par exemple: 3-5-8-9-12-12-13 Par exemple: 3-5-8-9-12-12- 1000
M= 8,85 M= 149,85

➢ que pour variables quantitatives.

NB: La moyenne d'un groupe résultant de la fusion d'autres groupes n'est égale à
la moyenne des moyennes que si tous les groupes ont le même effectif
Mesures de fréquence des variables
quantitatives
Mesures de
tendance centrale

Moyenne Médiane Mode

Arithmétique Géométrique
Les autres moyennes

• Moyenne géométrique d'une série de valeurs positives est la racine


nième du produit des n valeurs.
• Elle est toujours inférieure ou égale à la moyenne arithmétique.
• Utilisée dans le cas de phénomènes multiplicatifs (taux de croissance
moyen)

n1 n2 nk
G= n x x .....x
1 2 k
Mesures de fréquence des variables
quantitatives
Mesures de
tendance centrale

Moyenne Médiane Mode

Arithmétique Géométrique
La médiane
• La médiane : valeur qui divise l’ensemble des
valeurs observées, disposées en ordre croissant
ou décroissant, en deux parties égales, c’est à
dire de même fréquence.

❑50 % des valeurs < Médiane


❑50 % des valeurs >Médiane

X1 < X2 < X3 < X4 < X5


La médiane
Les valeurs observées doivent être rangées par ordre croissant.

Nombre impair d’observations Nombre pair d’observations

3 4 4 5 6 8 8 9 10 3 4 4 5 6 8 8 9

4 valeurs 4 valeurs 4 valeurs 4 valeurs


M Intervalle médian
M = milieu = 5,5
La médiane : calcul
• Sur une distribution non groupée :
• Si n impair, la médiane est l'observation de rang (N+1)/2
• Si n est pair, tout nombre entre xN/2 et xN/2+1
convient: le rang se situe entre deux valeurs successives (x1 et x2) et la
médiane sera (x1+x2)/2.

• Sur une distribution groupée, la classe médiane est celle qui


contient la médiane.
Médiane

Série: 3- 5- 8- 9- 12- 12 ,

la médiane est située entre 8 et 9 = 8.5.

Série 3- 5- 8- 9-12 : n= 5,

la médiane correspond à la valeur de rang 3 (5+1/2)


La Médiane
Exemple:
1.20 1.18 0.95 0.98 1 1.14 1.25 1.62 1.26 0.95
1.28 0.92 1.09 1.14 1.50 0.93 1.17 1.25 1.06 1.02
1.12 1.03 1.16 1.05 1.08 1.45 1.22 0.98 0.67 1.06
0.95 1.09 1.20 1.09 0.96 0.69 1.18 0.87 1.26 0.99

0.67 0.69 0.87 0.92 0.93 0.95 0.95 0.95 0.96 0.98
0.98 0.99 1 1.02 1.03 1.05 1.06 1.06 1.08 1.09
1.09 1.09 1.12 1.14 1.14 1.16 1.17 1.18 1.18 1.20
1.20 1.22 1.25 1.25 1.26 1.26 1.28 1.45 1.50 1.62
La Médiane

0.67 0.69 0.87 0.92 0.93 0.95 0.95 0.95 0.96 0.98
0.98 0.99 1 1.02 1.03 1.05 1.06 1.06 1.08 1.09
1.09 1.09 1.12 1.14 1.14 1.16 1.17 1.18 1.18 1.20
1.20 1.22 1.25 1.25 1.26 1.26 1.28 1.45 1.50 1.62

N= 40 ➔ on cherche la position (n+1)/2➔ entre 20 et 21➔

médiane = (1.09+1.09)/2 = 1.09


La Médiane
• Pour les mesures observées dans des intervalles

Glycémie Centre de Effectif Effectif


(g/dl) classe observé cumulé
0.67≤G<1 0.83 12 12 Du 1er au 12è <1
1≤G≤1,26 1.13 24 24+12=36 Du 13è au 36è entre 1 et 1.26
1,26<G≤1,62 1.44 4 36+4=40 Du 37è au 40è >1.26
Total 40

N= 40 ➔ on cherche la position entre 20 et 21= entre 13 è et 36è


➔médiane = 1.13 et Classe médiane = [1 – 1.26]
La médiane
• Sur les distributions symétriques unimodales
en cloche (normales par exemple) la
médiane est égale à la moyenne et au
mode.

• Paramètre peu sensible aux valeurs


extrêmes.

• Peut être utilisée pour des données


ordinales.
La Médiane
Caractéristiques:

Avantages

➢ n’est pas influencée par les valeurs extrêmes (distribution fortement

asymétrique+++) satisfaction Effectif


observé
➢ peut être calculée pour des variables qualitatives ordinales. médiocre 6
faible 25
Exemple: satisfaction des usagers d’une
moyen 11
structure de soins: enquête auprès de 100
bonne 38
usagers:
Très bonne 20
La Médiane
Caractéristiques:

• Exemple: satisfaction des usagers d’une structure de soins: enquête


satisfaction Effectif Effectif
auprès de 100 usagers observé cumulé
médiocre 6 6
faible 25 31
moyen 11 42
bonne 38 80
Très bonne 20 100

classe médiane = bonne satisfaction


La Médiane
Caractéristiques:

Inconvénients

➢ dépend du rang des observations et non de leurs valeurs


Elle est invariante à une augmentation d’une valeur qui lui est supérieure ou à
une diminution d’une valeur qui lui est inférieure.

Par exemple:
Série: 3- 5- 8- 9- 12- 12 -1000
La médiane: 9

Que l’on remplace 8 par 6 ou 12 par 13 ne change pas la valeur de la médiane.


La Médiane
Caractéristiques:

Inconvénients

➢ dépend du rang des observations et non de leurs valeurs

➢ Moins stable que la moyenne arithmétique


Mesures de fréquence des variables
quantitatives
Mesures de
tendance centrale

Moyenne Médiane Mode

Arithmétique Géométrique
Mode

• Mode encore appelé valeur dominante :


• Correspond à la valeur la plus fréquente.
• Il peut y avoir un ou plusieurs modes.

• Rappel :
• Dans les distributions en cloche, unimodales
symétriques, mode, médiane et moyenne
sont confondus.
Mode
Il peut y en avoir plus d’un, comme il peut ne pas
exister.
Exemple: Pour la série (3-5-6-6-7-7-7-7-8-8-9)
le mode = 7

Exemple: Pour la série (1-2-5-2-4-3-2-5)


le mode = 2
Mode
Exemple: Pour la série (1-3-5-2-8)
Pas de mode

Exemple: Pour la série (1-2-5-2-4-3-5-2-5)


deux modes 2 et 5.
Mode
Méthode:

1.20 1.18 0.95 0.98 1 1.14 1.25 1.62 1.26 0.95


1.28 0.92 1.09 1.14 1.50 0.93 1.17 1.25 1.06 1.02
1.12 1.03 1.16 1.05 1.08 1.45 1.22 0.98 0.67 1.06
0.95 1.09 1.20 1.09 0.96 0.69 1.18 0.87 1.26 0.99

Deux modes: 0.95 et 1.09


Mode
Méthode:
Glycémie Centre de classe Effectif
(g/dl) observé
0.67≤G<1 0.83 12
1≤G≤1,26 1.13 24
1,26<G≤1,62 1.44 4
Total 40

Classe modale = [1 – 1.26]


Mode
Caractéristiques:
Avantages

➢ on peut le déterminer aussi bien pour des variables qualitatives

que pour des variables quantitatives

➢Par exemple: Pour décrire le niveau scolaire de 15 personnes


Niveau effectif
Analphabète 4
Primaire 3
Secondaire 6
supérieur 2
Mode
Caractéristiques:

Avantages

➢ on peut le déterminer aussi bien pour des variables qualitatives

que pour des variables quantitatives

➢Exemple 2: Dans un échantillon de 80 sujets, nous avons observé


Couleur des Effectif
yeux observé
la couleur des yeux
noir 58
marron 14
bleu 3
vert 5
Mode
Caractéristiques:

Inconvénients

➢ influencé par la fréquence des observations

➢ Moins stable que la moyenne et la médiane


Récapitulation

•La moyenne arithmétique dépend des valeurs.

•La médiane dépend des rangs des valeurs.

•Le mode dépend des fréquences des valeurs.


Exemple

Étude expérimentale ➔ l’effet d’un nouveau


médicament sur le niveau du cholestérol dans le sérum
chez 30 adultes jeunes.

230 235 200 175 170 290 181 245 150 190

120 145 220 225 215 195 200 230 240 200

235 165 265 210 250 210 215 190 270 250
Exemple

La moyenne= 230 + 235 + 200 + 175 + ... + 250 = 212,82 mg/100 ml


30
La médiane ➔ la position =(30+1)/2➔entre 15 et 16

120 145 150 165 170 175 181 190 190 195
200 200 200 210 210 215 215 220 225 230
230 235 235 240 245 250 250 265 270 290

La médiane=(210+215)/2= 212,5 mg/100ml


Le mode = 200 mg/100ml
Exemple
• Même série:
Classe Effectif observé
[120, 140[ 1
[140, 160[ 2
[160, 180[ 3
[180, 200[ 4
[200, 220[ 7
[220, 240[ 6
[240, 260[ 4
[260, 280[ 2
[280, 300[ 1
Exemple
• Centres des classes:
Classe Effectif observé Centre Effectif cumulé
[120, 140[ 1 130 1
[140, 160[ 2 150 3
[160, 180[ 3 170 6
[180, 200[ 4 190 10
[200, 220[ 7 210 17
[220, 240[ 6 230 23
[240, 260[ 4 250 27
[260, 280[ 2 270 29
[280, 300[ 1 290 30
Classe Effectif Effectif
observé cumulé

Exemple 130
150
170
1
2
3
1
3
6
190 4 10
210 7 17
• Moyenne arithmétique: 230 6 23
250 4 27

(130*1) + (150*2) + (170*3) + ... + (290*1) 270


290
2
1
29
30

30
= 212,66 mg/100ml

La médiane est le centre de la classe où se situe la position (n+1)/2 ➔ 210


mg/100ml

Le mode est le centre de la classe modale (ayant l’effectif observé le plus


élevé) ➔ 210 mg/100ml
➔ Cette représentation est plus simple mais moins précise
PROPRIETES ET COMPARAISON DES QUATRE MESURES

Influence des valeurs extrêmes

Stabilité

Type d’échelle et mesure


PROPRIETES ET COMPARAISON DES QUATRE MESURES

Influence des valeurs extrêmes

•La moyenne arithmétique dépend des valeurs.

•La médiane dépend des rangs des valeurs.

•Le mode dépend des fréquences des valeurs.


PROPRIETES ET COMPARAISON DES QUATRE MESURES

Influence des valeurs extrêmes

•Ma dépend de toutes les valeurs observées.

➔ influencée par les valeurs extrêmes.


PROPRIETES ET COMPARAISON DES QUATRE MESURES

Influence des valeurs extrêmes

• La médiane et le mode ne sont pas influencées par les valeurs

extrêmes.

Préférer la médiane pour décrire la tendance centrale d’une distribution


fortement asymétrique
PROPRIETES ET COMPARAISON DES QUATRE MESURES

Stabilité

•La moyenne arithmétique est moins sensible que la médiane et le mode aux

fluctuations d’échantillonnage: la plus stable

• Le mode est le plus sensible aux changements surtout si on a peu d’observations


PROPRIETES ET COMPARAISON DES QUATRE MESURES

Type d’échelle et mesure

•Moyennes arithmétique ou géométrique: que pour variables quantitatives.

• Calcul des moyennes: que si on dispose d’échelles par intervalle.

•La médiane exige au moins une échelle ordinale, pas pour une échelle nominale,

on parle de classe médiane


PROPRIETES ET COMPARAISON DES QUATRE MESURES

Type d’échelle et mesure

•Le mode: aussi bien pour des variables quantitatives que qualitatives.
Position relative des 4 mesures

Si une distribution uni modale est symétrique:

• La moyenne arithmétique est égale à la médiane et au


mode

• Le mode: sommet le plus élevé.

• La médiane: partage les fréquences

en deux parties égales, donc la surface aussi


Position relative des 4 mesures

•Si une distribution est asymétrique à droite,

la moyenne arithmétique, est déplacée vers la

droite

•La médiane est forcément plus grande que le

mode.
Position relative des 4 mesures

•Si une distribution est asymétrique à

gauche, la moyenne arithmétique, est

déplacée vers la gauche.


Application
Dans un échantillon de 200 individus atteints d’une maladie inflammatoire, nous avons classé la valeur de la CRP
dans les classes suivantes:

Limites de la classe (mg/l) Effectif observé


[10-30 6 Calculer :
[30 – 50[ 12
[50 – 70[ 20
la moyenne arithmétique
[70 – 90[ 37
[90 – 110[ 58
[110 – 130[ 35
[130 – 150[ 16
la médiane
[150 – 170[ 8
[170 – 190[ 5
[190 – 210[ 2
et le mode
[210-230[ 1
Application
Limites de la Centre de la Effectif Ni * xi
classe (mg/l) classe observé
[10 – 30[ 20 6 120
[30 – 50[ 40 12 480
[50 – 70[ 60 20 1200 La moyenne arithmétique=
[70 – 90[ 80 37 2960
[90 – 110[ 100 58 5800 [(20 *6)+(40*12) + … + (220*1)]/200 = 19800/200 =
[110 – 130[ 120 35 4200 99 mg/l
[130 – 150[ 140 16 2240
[150 – 170[ 160 8 1280
[170 – 190[ 180 5 900
[190 – 210[ 200 2 400
[210 – 230[ 220 1 220
somme 200 19800
Application
Limites de la classe (mg/l) Effectif observé
10 – 30 6
30 – 50 12
50 – 70 20
70 – 90 37
90 – 110 58
la médiane= ??
110 – 130 35
130 – 150 16
150 – 170 8
170 – 190 5
190 – 210 2
210 – 230 1
Application
Méthode numérique:

Limites de la classe (mg/l) Effectif observé Effectifs cumulés


10 – 30 6 6
30 – 50 12 18
50 – 70 20 38
70 – 90 37 75
90 – 110 58 133
110 – 130 35 168
130 – 150 16 184
150 – 170 8 192
170 – 190 5 197
190 – 210 2 199
210 – 230 1 200
Application

• Pour trouver la médiane: on Limites de la Effectif Effectifs


classe (mg/l) observé cumulés
cherche l’observation entre 100 10 – 30 6 6
30 – 50 12 18
et 101 50 – 70 20 38
70 – 90 37 75
➔ situées entre la 76ème et la
90 – 110 58 133
133ème observation 110 – 130 35 168
130 – 150 16 184
• La classe médiane
150 – 170 8 192
correspondante est donc: 170 – 190 5 197

[90,110[ 190 – 210 2 199


210 – 230 1 200
Application

Limites de la classe (mg/l) Effectif observé


10 – 30 6
30 – 50 12
50 – 70 20
70 – 90 37
90 – 110 58 Le mode= ??
110 – 130 35
130 – 150 16
150 – 170 8
170 – 190 5
190 – 210 2
210 – 230 1

La classe modale correspondante est donc: [90,110[


Plan
Définition d’une variable quantitative
Classification des variables quantitatives
Mesures de fréquence d’une variable qualitative

Mesures de tendance centrale

Mesures de dispersion
Application
Mesures de fréquence des variables quantitatives

Mesure des
variables
quantitatives

Mesures de
Mesures de
tendance
dispersion
centrale
Mesures de dispersion
Définition
• Les mesures de dispersion:

- l’étalement des valeurs autour des mesures de position.

- la manière dont toutes les observations s’écartent d’une


valeur centrale.
Mesures de dispersion

Mesures de
dispersion

Intervalle
Coefficient
Etendue Variance Ecart type semi-
de variation
interquartile
Mesures de dispersion

Mesures de
dispersion

Intervalle
Coefficient
Etendue Variance Ecart type semi-
de variation
interquartile
Etendue

• Différence entre la plus grande et la plus petite des valeurs observées

• Ne tient compte que de deux valeurs, la plus petite et la plus grande

• Néglige les fréquences des autres observations

Etendue = maximum - minimum


Etendue
• Exemple 1:

Dans la série: 12, 14, 3, 7, 9, 25, 75, 25

L’étendue est 75 – 3 = 72 • Exemple 2:

Valeur maximum x = 174 mm

Valeur minimum x = 140 mm

Etendue de la variation = 174 - 140 = 34 mm


Mesures de dispersion

Mesures de
dispersion

Intervalle
Coefficient
Etendue Variance Ecart type semi-
de variation
interquartile
Variance

• Une bonne mesure de dispersion doit refléter la manière dont


toutes les observations s’écartent d’une valeur centrale.

• Considérons la série de valeurs : 130-131-131-133-140

• la moyenne est : 130+131+131+133+140 / 5 = 133


Variance et écart type

• Chacune des valeurs observées s’écarte +/- de la ma


X X- ma
• On considère la différence
130 -3
(valeur observée- ma) pour chaque valeur
131 -2

c’est l’écart à la moyenne arithmétique. 131 -2

133 0
• Le signe: de quel côté de la moyenne
140 +7
se situe la valeur observée.
Variance et écart type

• Synthèse des cinq écarts individuels obtenus (–3,-2,-2,0,+7)

➔ mesurer la dispersion globale de la série

Moyenne des On élève les écarts


Valeurs absolues
cinq écarts ? au carré

!!! E[X-E(X)]=0 !!! Peu utilisée ++++


Variance et écart type
• Écarts au carré: rend positifs les écarts négatifs.

• Les écarts au carré: additionnés pour donner finalement la

mesure de dispersion décrite par l’expression suivante :


(x - m ) ² (x)²
x ² −
a
• En pratique n

• Cette mesure de dispersion, dénotée S², est appeléeN


S² = la variance

N −1
Variance et écart type
Exemple:

• Pour la série de valeurs: 10- 4 - 6 - 8-14

 x= 10+ 4+ 6+ 8 + 14 = 42 (x)²
x ² −
S² = N
 x2= 102+42+ 62+82+142 = 412 N −1
422
• S2 = 412 − unités2
5 = 14,8
4
Variance et écart type

• Une série plus dispersée a une plus grande variance.

• Elle est nulle lorsque toutes les valeurs observées sont égales.

• Inconvénient : la variance s’exprime en unités carrées. Si la

variable x est l’âge, exprimé en années, la variance S² est en

années carrées.
Mesures de dispersion

Mesures de
dispersion

Intervalle
Coefficient
Etendue Variance Ecart type semi-
de variation
interquartile
Variance et écart type

• Racine carrée de la variance

S=
(x - m ) a ²
n
Variance et écart type

Exemple:
• Pour la série de valeurs: 10- 4 - 6 - 8-14

 x= 10+ 4+ 6+ 8 + 14 = 42
= 102+42+ 62+82+142 = 412
x 2

• S2 = 422 unités2
412 −
5 = 14,8
4
• S= 3,84 unités
Application
Limites de la Centre de la Effectif X=Ni * xi xi2 X2=Ni * xi2
classe (mg/l) classe (xi) observé
[10 – 30[ 20 6 120 202=400 6*400=2400
[30 – 50[ 40 12 480 402=1600 19200
[50 – 70[ 60 20 1200 602=3600 72000
[70 – 90[ 80 37 2960 802=6400 236800
[90 – 110[ 100 58 5800 1002=10000 580000
[110 – 130[ 120 35 4200 1202=14400 504000
[130 – 150[ 140 16 2240 1402=19600 313600
[150 – 170[ 160 8 1280 1602=25600 204800
[170 – 190[ 180 5 900 1802=32400 162000
190 et plus 200 3 600 2002=40000 120000
somme 200 19780 154000 2214800
Application
Centre de la Effectif X=Ni * xi xi2 X2=Ni * xi2
classe (xi) observé
20 6 120 202=400 6*400=2400
40 12 480 402=1600 19200
60 20 1200 602=3600 72000
80 37 2960 802=6400 236800
100 58 5800 1002=10000 580000
120 35 4200 1202=14400 504000
140 16 2240 1402=19600 313600
160 8 1280 1602=25600 204800
180 5 900 1802=32400 162000
200 3 600 2002=40000 120000
200 19780 154000 2214800

Variance=2214800-[(19780)2/200]/199=1299.28
unités 2
Ecart type = 36.04 unités
Variance et écart type

Intérêt :

• Représenter de façon simplifiée la dispersion des valeurs

d’une variable autour de la moyenne arithmétique .

• Comparer plusieurs distributions d’une même variable

exprimées dans les mêmes unités.


Variance et écart type

Exemple :

•Pour comparer deux formes de vaccins contre l’hépatite B

(Vaccin 1 et Vaccin 2), nous avons mesuré le taux

d’anticorps anti HBs dans le sérum des sujets vaccinés.

•Les résultats sont mentionnés dans le tableau suivant:


Variance et écart type
Exemple :
Variance et écart type
Exemple :

•Comment peut-on comparer les deux formes de vaccins

contre l’hépatite B (Vaccin 1 et Vaccin 2) ?

Calculer le taux moyen d’anticorps dans les deux


groupes A et B
Variance et écart type
Exemple :

Taux d’anticorps moyen =


(200+150+…188)/15 = 144.6 mU/ml
Somme des x2=2002+1502+…+1882=
Variance = 2384.4
Ecart type= 48.38mU/ml
Variance et écart type
Exemple :
Taux d’anticorps moyen =
(155+123+…125)/15 = 146.4
mU/ml
Somme des
x2=1552+1232+…+1252=
Variance = 410.41
Ecart type20.25 mU/ml
Variance et écart type
Vaccin 1 Vaccin 2

Taux d’anticorps moyen = 144.6 mU/ml Taux d’anticorps moyen = 146.4 mU/ml
Variance = 2384.4 Variance = 410.41
Ecart type= 48.38mU/ml Ecart type = 20.25 mU/ml

La distribution est plus homogène avec le


vaccin 2
Mesures de dispersion

Mesures de
dispersion

Intervalle
Coefficient
Etendue Variance Ecart type semi-
de variation
interquartile
Coefficient de variation

• Supposons maintenant qu’on va comparer deux variables différentes:

• Par exemple: Dans un échantillon de sujets tabagiques, nous avons essayé de

comparer la répartition de leur TA et du taux de cholestérolémie. Les résultats

étaient mentionnés dans le tableau suivant:


Coefficient de variation

TAS Cholestérol
ma= 120 mm Hg ma= 180 mg/100ml
S= 10 mm Hg S= 30 mg/100ml

Comment comparer des distributions de

variables différentes?
Coefficient de variation

• L’écart type: exprimé en unités de la variable

correspondante.

• Comment éliminer l’unité de l’écart type?


Coefficient de variation

• C. V. = S * 100/ma

• Le coefficient de variation est un nombre pur (sans dimension) qui facilite la

comparaison des dispersions

• Permet de comparer les distributions de variables différentes, du point de

vue de leur dispersion.


Coefficient de variation
• Exemple:
TAS Cholestérol
ma= 120 mm Hg ma= 180 mg/100ml
S= 10 mm Hg S= 30 mg/100ml

• C.V. TAS = 10 x 100/120 = 8.3 %


• C.V. cholestérol = 30 x 100/180 = 16.7 %

CVcholestérol 16,7
= = 2,01
CVTAS 8,3
Coefficient de variation
• Exemple:
CVcholestérol 16,7
= = 2,01
CVTAS 8,3

➔ Le taux de cholestérol a une dispersion environ deux fois


plus grande que celle de la TAS.

➔ Les individus sont relativement plus homogènes du point de


vue de leur tension artérielle que de leur cholestérol total.
Coefficient de variation

• Remarque:

• Le CV permet aussi de comparer deux distributions d’une même

variable mais de tendances centrales différentes.


Variance et écart type
Exemple :

•Comment peut-on comparer les deux formes de vaccins

contre l’hépatite B (Vaccin 1 et Vaccin 2) ?

Comparer la distribution des AC dans les


deux groupes A et B
Variance et écart type
Vaccin 1 Vaccin 2

Taux d’anticorps moyen = 144.6 mU/ml Taux d’anticorps moyen = 146.4 mU/ml
Variance = 2384.4 Variance = 410.41
Ecart type= 48.38mU/ml Ecart type = 20.25 mU/ml
CV= 33,4% CV=13,8%

La distribution est plus homogène avec le vaccin 2


EXERCICE
Fréquence
Poids
cardiaque

• CV=11.79% • CV=5.47%

CV poids/CV FC=11.79/5.47=2.15
➔ La dispersion du poids est deux fois plus importante que celle de la
fréquence cardiaque
➔ La répartition de la fréquence cardiaque est plus homogène que
celle du poids
Mesures de dispersion

Mesures de
dispersion

Intervalle
Coefficient
Etendue Variance Ecart type semi-
de variation
interquartile
Intervalle semi inter quartile

La variance et l’écart type: mesures de la dispersion autour de

la moyenne arithmétique.

➔La variance: influencée par les valeurs extrêmes.

➔ moins appropriée à décrire la dispersion des distributions

fortement dissymétriques.
Intervalle semi inter quartile

• Préférer une mesure de dispersion moins affectée par les valeurs


extrêmes,

• Par exemple, la dispersion des valeurs autour de la médiane.

• Si on découpe l’intervalle de variation d’une variable en 2 parties


égales: la médiane

• D’autres découpages, par exemple en quatre morceaux de même


effectif : 25 % chacun.
Intervalle semi inter quartile
Intervalle semi inter quartile

• Si on découpe l’intervalle de variation d’une variable en 4


morceaux égaux, on parle de quartiles

Q1=(n+1)*1/4 Q2 Q3= (n+1)*3/4

Médiane
• Q3 – Q1 est l’intervalle interquartile
• Q3 − Q1 est l’intervalle semi interquartile
2
Exemple

 x = 6316  x 2
= 1373436

• La moyenne arithmétique : 6316/30= 210,53 u

• L’étendue = 290 – 120= 170 u


63162
1373436 − ( )
30
• La variance = 29
= 1507 u2

• L’écart type = 38,82 u

• CV = 38,82 * 100/210,53 = 18,43%


Exemple
• L’intervalle semi interquartile?

• N = 30 ➔ médiane: rang 31/2=15.5 ; Q1= rang 31*1/4 ➔entre 7 et 8;


Q3=rang 31*3/4 = rang 23.25 ➔ entre 23 et 24

Q1= 185,5

Q2= 212,5; Q3- Q1= 237,5 – 185,5 = 52


(Q3 – Q1)/2= 26
Q3= 237,5
Exemple
• Avec la 2ème représentation:
Classe Effectif
[120, 140[ 1
[140, 160[ 2
[160, 180[ 3
[180, 200[ 4
[200, 220[ 7
[220, 240[ 6
[240, 260[ 4
[260, 280[ 2
[280, 300[ 1
Exemple
• 1- On définit les centres de classes:
Classe Centre de classe Effectif
[120, 140[ 130 1
[140, 160[ 150 2
[160, 180[ 170 3
[180, 200[ 190 4
[200, 220[ 210 7
[220, 240[ 230 6
[240, 260[ 250 4
[260, 280[ 270 2
[280, 300[ 290 1
Exemple
 x = (130*1)+ (150*2) +…+ (290*1)
= 6380 mg/100ml Classe Centre de Effectif
classe
2
x2 = (1302*1)+(1502 *2)+…+(2902*1) = [120, 140[ 130 1
[140, 160[ 150 2
1399000 (mg/100ml)2
[160, 180[ 170 3
[180, 200[ 190 4
63802 [200, 220[ 210 7
• Variance: 1399000 − ( )
30 [220, 240[ 230 6
29
[240, 260[ 250 4
= 1454,65 (mg/100ml)2 [260, 280[ 270 2
[280, 300[ 290 1

• L’écart type = 38,14 mg/100ml


Exemple
• Le coefficient de variation ? :

• Ma= 6380 /30 = 212,66 mg/100 ml

• CV= 38,14 *100/212,66 = 17,93%

• L’intervalle semi inter quartile ?


Classe Centre de Effectif observé Effectif cumulé
classe
[120, 140[ 130 1 1
[140, 160[ 150 2 3
[160, 180[ 170 3 6
[180, 200[ 190 4 10
[200, 220[ 210 7 17
[220, 240[ 230 6 23
[240, 260[ 250 4 27
[260, 280[ 270 2 29
[280, 300[ 290 1 30
Exemple

N= 1 N= 8 N=15 n= 23 N = 30
Q1 Q2 Q3
• N = 30
Classe Centre de classe Effectif cumulé
Q2 : entre15 et 16 ➔ 210
[120, 140[ 130 1
[140, 160[ 150 3 Q1 : entre 7 et 8
[160, 180[ 170 6
[180, 200[ 190 10 ➔ [180 , 200] ou 190
[200, 220[ 210 17
Q 3 : entre 23 et 24
[220, 240[ 230 23
[240, 260[ 250 27 ➔ (230+250)/2=240
[260, 280[ 270 29
[280, 300[ 290 30 Q3 – Q1= 240 – 190 = 50

(Q3 – Q1)/2 = 25

Vous aimerez peut-être aussi