Séries Statistiques à Deux Dimensions
Séries Statistiques à Deux Dimensions
Il est très courant que l'étude statistique ne porte pas que sur un seul caractère, mais plusieurs
caractères simultanément pour une même population.
On étudie par exemple, un ensemble de salariés non plus seulement selon leur salaire, mais encore
selon leur ancienneté. Les tableaux de données seront alors des tableaux à deux dimensions.
L’étude statistique peut porter en même temps sur deux caractères qui peuvent être de même nature ou
de nature différente (qualitatif-quantitatif discret, qualitatif- quantitatif continu……)
Dans ce chapitre on présentera ces tableaux, ainsi que le traitement statistique associé,
Les tableaux à double entrée présentant pour chaque couple de modalités des deux caractères
étudiées, l'effectif des individus, présentant ces deux modalités simultanément.
xi ni1 ni2 nij niq ni.
xp np1 np2 npj npq np.
Ligne n .1 n .2 n .j n .q N=n..
marginal
e n .j
1
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
L'effectif ni. (total de la ligne i) est le nombre total d'individus présentant la modalité x i du caractère X
indépendamment des modalités de Y.
En effectuant la somme des termes de chaque ligne, on définit les termes [Link] la colonne marginale
= ni1+ni2+…+nij+…+niq = ni .
ni . est l’effectif de la population qui présente les modalités xi du caractère X, ∀ les modalités du
caractère Y.
L'effectif n.j (total de la colonne j) est le nombre total d'individus présentant la modalité y j du caractère Y
indépendamment des modalités de X.
En effectuant la somme des termes de chaque colonne, on définit les termes n.j de la ligne marginale
= n. j = n1j + n2j + … + nij + … + npj : c’est l’effectif de la population qui présente les modalités y j
du caractère Y, indépendamment du caractère X.
De plus :
On appelle fréquence du couple de modalités (xi , yj) (ou encore fréquence totale), la proportion fij
d'individus présentant simultanément les deux modalités :
nij
f ij .
N
Remarque : la somme de toutes les fréquences de couples = 1.
EXEMPLE
Soit la répartition des salariés d’une entreprise selon le nombre d’enfant(X) et le salaire mensuel (Y) en
103DH.
Y (salaire) 2-6 6 - 10 10 - 16 Colonne
marginale ni.
X (nb enfants)
1 15 8 2 25
2 13 4 1 18
3 11 3 3 17
Ligne 39 15 6 60
marginale n.j
2
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
n.2= 15 salariés ont un salaire compris entre 6000 et 10000 DH quelque soit leurs nombre d’enfants
f22= =4/60 ; f2.= =18/60 ;f.2= =15/60
2. Distributions marginales
Considérons la colonne de droite du tableau de contingence. Les effectifs ni. représentent les individus
présentant la modalité xi indépendamment des modalités du second caractère étudié Y.
On dit qu'ils définissent la distribution marginale de X.
(Cette série statistique est une série statistique à un seul caractère).
Série marginale de X : (xi , ni.)i1, p.
X ni. fi.
x1 n1. f1.
x2 n2. f2.
. . .
. . .
xi ni. fi.
. . .
. . .
xp np. fp.
∑ n.. f..=1
On définit alors la fréquence marginale de la modalité xi par :
ni. p
f i .
N
. (On a : f
i 1
i. 1).
Exemple
Nombre d’enfant ni. fi.
(X)
1 25 0,417
2 18 0 ,3
3 17 0,283
∑ 60 1
3
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
∑ n.. f..=1
On définit la fréquence marginale de la modalité yj :
n. j q
Exemple
salaires en n.j f.j
103DH(Y)
2-6 39 0,65
6-10 15 0 ,25
10-16 6 0,1
∑ 60 1
3. Distributions conditionnelles
C’est une distribution suivant l’un des deux caractères (X,Y) liée par une modalité de l’autre caractère. Il
y a autant de distributions conditionnelles X qu’il y a de j , et il y a autant de distributions conditionnelles
Y qu’il y a de i.
Considérons les n.j individus qui présentent la modalité yj du caractère Y ; cette population est
décrite par la jième colonne du tableau suivant les modalités du caractère X.
On dit qu'elle définit la "distribution conditionnelle de X sachant que Y = yj". Ou une distribution
de X liée (conditionnée par) une valeur yj de Y.
4
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
∑ n.j f.j
nij
On peut définir les fréquences conditionnelles associées par : f i ; f i représente la
j n. j j
proportion d'individus présentant la modalité xi parmi l'ensemble des individus présentant la
modalité yj de Y.
Exemple
Distribution conditionnelle de X sachant que Y = y2 (distribution conditionnelle de X liée
par y2)
Nombre d’enfant ni/2 (y2(6-10)) fi/2
(X)
1 8 0,53
2 4 0 ,27
3 3 0,2
∑ 15 1
5
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
Y nj/i fj/i
y1 ni1 fi1
y2 ni2 fi2
. . .
. . .
yj n ij fij
. . .
. . .
yq n iq fiq
∑ ni. fi.
nij
f j ; f j représente la proportion d'individus présentant la modalité yj parmi l'ensemble
i ni . i
des individus présentant la modalité xi de X.
Exemple :
Distribution conditionnelle de Y sachant que X = x3 (distribution conditionnelle de Y liée
par x3)
salaires en nj/3 fj/3
103DH(Y)
2-6 11 0,65
6-10 3 0 ,175
10-16 3 0,175
∑ 17 1
Remarque : Les séries conditionnelles ; comme les séries marginales, sont des séries statistiques à un
seul caractère.
Il est possible de synthétiser dans un seul tableau toutes les séries conditionnelles et marginales.
Dans les cases centrales du tableau de contingence, on indique en plus des effectifs nij les
fréquences conditionnelles f i et f j (appelées parfois "fréquences en colonnes et "fréquences en
j i
6
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
lignes"). Dans les marges du tableau, on indique en plus des effectifs marginaux ni. et n.j , les
fréquences marginale fi. et f.j .
Exemple : Considérons la répartition de 2.000 salariés d'une entreprise selon leur âge (en années) (X)
et leur salaire mensuel net (en milliers de dirhams) (Y) :
Salaire Y
1 1,2 1,2 1,4 1,4 1,6 Marge
Âge X
Effectif 20 25 250 100 50 400
% ligne 62,5% 25% 12,5%
% colonne 41,7% 11,6% 9,3% 20%
25 35 200 400 200 800
25% 50% 25%
33,3% 46,5% 37% 40%
35 45 140 350 210 700
20% 50% 30%
23,3% 40,7% 38,9% 35%
45 60 10 10 80 100
10% 10% 80%
1,7% 1,2% 14,8% 5%
Marge 600 860 540
30% 43% 27% 2.000
On peut lire par exemple : (2ème ligne, 3ème colonne) 25% des gens âgés de 25 à 35 ans, ont un
salaire compris entre 1 400 DH et 1 600 DH.
37% des gens ayant un salaire compris entre 1 400 DH et 1 600 DH ont entre 25 et 35 ans.
f f f . j f j f i. .
ij i
j i
Dans le cas où les variables X et Y sont des variables quantitatives, on peut associer à chacune des
séries conditionnelles et des séries marginales définies par le tableau de contingence des
caractéristiques de tendance centrale et de dispersion
7
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
1. Caractéristiques Marginales
1-1 Moyennes marginales
Moyenne marginale de X
La moyenne marginale de X notée correspond à la valeur moyenne du caractère X
possédée par les individus de la population indépendamment du caractère Y
n i .. xi
1 p P
ni . x i f i . x i ;
i 1
la moyenne marginale : X
N n.. i 1 i 1
Exemple :
xi ni. [Link]
1 25 25
2 18 36
3 17 51
60 112
n i .. xi
1 p 112
i 1
X ni . x i 1,86
N n.. i 1 60
Moyenne marginale de Y
La moyenne marginale de Y notée correspond à la valeur moyenne du caractère Y
possédées par les individus de la population indépendamment du caractère X
n. j yj
1 q q
la moyenne marginale : Y J 1
N
.j j
n.. J 1
n y
j 1
f. j y j
Exemple :
yj n.j [Link]
4 39 156
8 15 120
13 6 78
60 354
8
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
n. j yj
1 q 354
Y J 1
N
n.. J 1
n. j y j
60
5,9
p p
ni . x i X
2
ni.x
2
i
- la variance marginale : V X
2
i 1
i 1
X .
N N
L’écart type marginale de X
X V X
Exemple
xi ni. xi2 ni.xi2
1 25 1 25
2 18 4 72
3 17 9 153
60 - 250
ni.x i
2
Variance marginale de X V X
2
i 1
X 250 / 60 1,86 2 0,71
N
L’écart type marginale de X σX =
Variance marginale de Y
La variance marginale de Y notée V(y) est une mesure de la dispersion des individus de la
population selon Y et indépendamment de X
q q
n. j y j Y n. jy
2 2
j
- la variance marginale : V Y
2
j 1 j 1
Y .
N N
Exemple
yj n.j yj2 n.jyj2
4 39 16 624
8 15 64 960
13 6 169 1014
60 - 2598
9
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
n. jy
2
j
Variance marginale de Y V Y
2
j 1
Y 2598 / 60 5,9 2 8,49
N
L’écart type marginale de Y
Y V Y
2. Caractéristiques Conditionnelles
2-1 Moyennes Conditionnelles
On peut, de la même façon définir les caractéristiques de toutes les séries conditionnelles (toujours
dans le cas où X et Y sont quantitatives).
Il y a (p + q) séries conditionnelles associées au tableau : p séries conditionnelles "Y sachant X = x i" et
q séries "X sachant Y = yj".
n
i 1
ij xi
la moyenne conditionnelle de "X sachant Y = yj" : X j ;
n. j
Exemple : calculons les moyennes conditionnelles
xi Y=y1 ni1xi
1 15 15
2 13 26
3 11 33
39 74
n
i 1
i1 xi
X1 74 / 39 1,89
n.1
xi Y=y2 ni2xi
1 8 8
2 4 8
3 3 9
15 25
n
i 1
i2 xi
X2 25 / 15 1,66
n.2
xi Y=y3 ni3xi
1 2 2
2 1 2
3 3 9
6 13
10
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
n
i 1
i3 xi
X3 13 / 6 2,16
n.3
n
j 1
ij Yj
- la moyenne conditionnelle de "Y sachant X = xi" : Yi .
ni.
Exemple : calculons les moyennes conditionnelles
yj X=x1 n1j yj
4 15 60
8 8 64
13 2 26
25 150
yj X=x2 n2j yj
4 13 52
8 4 32
13 1 13
18 97
yj X=x3 n3j yj
4 11 44
8 3 24
13 3 39
17 107
n x Xj
p p
n
2
ij i ij xi 2
V j X
i 1 2
i 1
Xj
n. j n. j
On peut donc calculer j variances conditionnelles associées à X
Exemple
11
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
Calculons V2(X)
xi Y=y2 xi 2 ni21xi 2
1 8 1 8
2 4 4 16
3 3 9 27
15 51
=0,645
n
2 2
ij yj
Vi Y
j 1 j 1 2
Yi .
ni . ni .
On peut donc calculer i variances conditionnelles associées à Y
Exemple
Calculons V2(Y)
yj X=x2 yj2 n2j yj2
4 13 16 208
8 4 64 256
13 1 169 169
18 633
12
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES
X 2
n V Y n .Y
q q p p
n V j X n
2
.j .j X
j i. i i i Y
V X j 1
j 1
. V Y i 1
i 1
.
N N N N
On peut traduire ces dernières relations en disant que l'hétérogénéité de la distribution marginale
résulte à la fois de :
- l'hétérogénéité propre à chaque distribution conditionnelle ;
- l'hétérogénéité des moyennes conditionnelles entre elles.
3. La Covariance
On associe aux deux caractères quantitatifs X et Y une caractéristique globale appelée la covariance et
définie par :
n ij x X y
i j Y
Cov X ,Y
i j
.
N
On montre que l'on peut calculer la covariance par la formule :
n ij xi y j
Cov X ,Y X .Y
i j
13