0% ont trouvé ce document utile (0 vote)
245 vues13 pages

Séries Statistiques à Deux Dimensions

Transféré par

kamguiaraoul
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
245 vues13 pages

Séries Statistiques à Deux Dimensions

Transféré par

kamguiaraoul
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS :


DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

Il est très courant que l'étude statistique ne porte pas que sur un seul caractère, mais plusieurs
caractères simultanément pour une même population.
On étudie par exemple, un ensemble de salariés non plus seulement selon leur salaire, mais encore
selon leur ancienneté. Les tableaux de données seront alors des tableaux à deux dimensions.
L’étude statistique peut porter en même temps sur deux caractères qui peuvent être de même nature ou
de nature différente (qualitatif-quantitatif discret, qualitatif- quantitatif continu……)
Dans ce chapitre on présentera ces tableaux, ainsi que le traitement statistique associé,

I. Tableaux à double entrée

Les tableaux à double entrée présentant pour chaque couple de modalités des deux caractères
étudiées, l'effectif des individus, présentant ces deux modalités simultanément.

1. Construction d'un tableau de contingence


Considérons une population de N unités statistiques décrites simultanément selon deux variables
statistiques X et Y prenant les modalités (ou valeurs) suivantes :
X : x1 , x2 , ... , xp
Y : y1 , y2 , ... , yq .
Le nombre d'individus présentant les modalités xi et yj simultanément est noté : nij .
Le tableau est de la forme :

Y y1 y2 ...... yj ...... yq Colonne


X marginale
ni.
x1 n11 n12 n1j n1q n1.
x2 n21 n22 n2j n2q n2.


xi ni1 ni2 nij niq ni.


xp np1 np2 npj npq np.
Ligne n .1 n .2 n .j n .q N=n..
marginal
e n .j

On désigne par N l'effectif total de la population de référence.


i  1, p
N    nij.
i j j  1, q

1
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

L'effectif ni. (total de la ligne i) est le nombre total d'individus présentant la modalité x i du caractère X
indépendamment des modalités de Y.
En effectuant la somme des termes de chaque ligne, on définit les termes [Link] la colonne marginale
= ni1+ni2+…+nij+…+niq = ni .

ni . est l’effectif de la population qui présente les modalités xi du caractère X, ∀ les modalités du
caractère Y.

L'effectif n.j (total de la colonne j) est le nombre total d'individus présentant la modalité y j du caractère Y
indépendamment des modalités de X.
En effectuant la somme des termes de chaque colonne, on définit les termes n.j de la ligne marginale
= n. j = n1j + n2j + … + nij + … + npj : c’est l’effectif de la population qui présente les modalités y j
du caractère Y, indépendamment du caractère X.
De plus :

On appelle fréquence du couple de modalités (xi , yj) (ou encore fréquence totale), la proportion fij
d'individus présentant simultanément les deux modalités :
 nij 
 f ij   .
 N
Remarque : la somme de toutes les fréquences de couples = 1.

EXEMPLE
Soit la répartition des salariés d’une entreprise selon le nombre d’enfant(X) et le salaire mensuel (Y) en
103DH.
Y (salaire) 2-6 6 - 10 10 - 16 Colonne
marginale ni.
X (nb enfants)
1 15 8 2 25
2 13 4 1 18
3 11 3 3 17
Ligne 39 15 6 60
marginale n.j

n..= 60 Le nombre total des salariés de l’entreprise


n22= 4 Salariés ont chacun 2 enfants et gagnent un salaire compris entre 6000 et 10000 DH
n13= 2 Salariés ont chacun 1 enfant et gagnent un salaire compris entre 10000 et 16000 DH
n2.=18 Salariés ont 2 enfants quelque soit leurs salaires

2
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

n.2= 15 salariés ont un salaire compris entre 6000 et 10000 DH quelque soit leurs nombre d’enfants
f22= =4/60 ; f2.= =18/60 ;f.2= =15/60

2. Distributions marginales
Considérons la colonne de droite du tableau de contingence. Les effectifs ni. représentent les individus
présentant la modalité xi indépendamment des modalités du second caractère étudié Y.
On dit qu'ils définissent la distribution marginale de X.
(Cette série statistique est une série statistique à un seul caractère).
Série marginale de X : (xi , ni.)i1, p.
X ni. fi.
x1 n1. f1.
x2 n2. f2.
. . .
. . .
xi ni. fi.
. . .
. . .
xp np. fp.

∑ n.. f..=1
On définit alors la fréquence marginale de la modalité xi par :

 ni.  p



f i . 
N 
. (On a : f
i 1
i.  1).

Exemple
Nombre d’enfant ni. fi.
(X)
1 25 0,417
2 18 0 ,3
3 17 0,283
∑ 60 1

De la même façon on définit la distribution marginale de Y en considérant la dernière ligne du


tableau.

3
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

Série marginale de Y : (yj , n.j)i1, q.


Y n.j f.j
y1 n.1 f.1
y2 n.2 f.2
. . .
. . .
yj n.j f.j
. . .
. . .
yq n.q f.q

∑ n.. f..=1
On définit la fréquence marginale de la modalité yj :

 n. j  q

 f j   . (on a, bien évidemment, f. j  1).


 N  j 1

Exemple
salaires en n.j f.j
103DH(Y)
2-6 39 0,65
6-10 15 0 ,25
10-16 6 0,1
∑ 60 1

3. Distributions conditionnelles

C’est une distribution suivant l’un des deux caractères (X,Y) liée par une modalité de l’autre caractère. Il
y a autant de distributions conditionnelles X qu’il y a de j , et il y a autant de distributions conditionnelles
Y qu’il y a de i.
Considérons les n.j individus qui présentent la modalité yj du caractère Y ; cette population est
décrite par la jième colonne du tableau suivant les modalités du caractère X.
On dit qu'elle définit la "distribution conditionnelle de X sachant que Y = yj". Ou une distribution
de X liée (conditionnée par) une valeur yj de Y.

4
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

X/(Y= yj) ni/j fi/j


x1 n1j f1j
x2 n2j f2j
. . .
. . .
xi nij fij
. . .
. . .
xp npj fpj

∑ n.j f.j

 nij 
On peut définir les fréquences conditionnelles associées par :  f i  ; f i représente la
 j n. j  j
proportion d'individus présentant la modalité xi parmi l'ensemble des individus présentant la
modalité yj de Y.

Exemple
Distribution conditionnelle de X sachant que Y = y2 (distribution conditionnelle de X liée
par y2)
Nombre d’enfant ni/2 (y2(6-10)) fi/2
(X)
1 8 0,53
2 4 0 ,27
3 3 0,2
∑ 15 1

De façon analogue, en considérant les ni. individus présentant la modalité xi du caractère X on


définit la "distribution conditionnelle de Y sachant que X = xi".
(ième ligne du tableau). Ou une distribution de Y liée (conditionnée par) une valeur xi de X

5
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

Y nj/i fj/i
y1 ni1 fi1
y2 ni2 fi2
. . .
. . .
yj n ij fij
. . .
. . .
yq n iq fiq

∑ ni. fi.

Les fréquences conditionnelles associées sont définies par :

 nij 
 f j  ; f j représente la proportion d'individus présentant la modalité yj parmi l'ensemble
 i ni .  i
des individus présentant la modalité xi de X.

Exemple :
Distribution conditionnelle de Y sachant que X = x3 (distribution conditionnelle de Y liée
par x3)
salaires en nj/3 fj/3
103DH(Y)
2-6 11 0,65
6-10 3 0 ,175
10-16 3 0,175
∑ 17 1

Remarque : Les séries conditionnelles ; comme les séries marginales, sont des séries statistiques à un
seul caractère.

 Il est possible de synthétiser dans un seul tableau toutes les séries conditionnelles et marginales.
Dans les cases centrales du tableau de contingence, on indique en plus des effectifs nij les
fréquences conditionnelles f i et f j (appelées parfois "fréquences en colonnes et "fréquences en
j i

6
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

lignes"). Dans les marges du tableau, on indique en plus des effectifs marginaux ni. et n.j , les
fréquences marginale fi. et f.j .

Exemple : Considérons la répartition de 2.000 salariés d'une entreprise selon leur âge (en années) (X)
et leur salaire mensuel net (en milliers de dirhams) (Y) :

Salaire Y
1 1,2 1,2 1,4 1,4 1,6 Marge
Âge X
Effectif 20 25 250 100 50 400
% ligne 62,5% 25% 12,5%
% colonne 41,7% 11,6% 9,3% 20%
25 35 200 400 200 800
25% 50% 25%
33,3% 46,5% 37% 40%
35 45 140 350 210 700
20% 50% 30%
23,3% 40,7% 38,9% 35%
45 60 10 10 80 100
10% 10% 80%
1,7% 1,2% 14,8% 5%
Marge 600 860 540
30% 43% 27% 2.000

On peut lire par exemple : (2ème ligne, 3ème colonne) 25% des gens âgés de 25 à 35 ans, ont un
salaire compris entre 1 400 DH et 1 600 DH.
37% des gens ayant un salaire compris entre 1 400 DH et 1 600 DH ont entre 25 et 35 ans.

Remarque : Relations entre les fréquences

On a défini les fréquences de couples, marginales, et conditionnelles de la façon suivante :


nij ni . n. j
f ij  ; f i.  ; f. j 
N N N
nij nij
fi  ; fj  .
j n. j i ni.

On remarque alors les relations suivantes :

f  f  f . j  f j  f i.  .
 ij i
j i 

II. caractéristiques des séries à deux variables

Dans le cas où les variables X et Y sont des variables quantitatives, on peut associer à chacune des
séries conditionnelles et des séries marginales définies par le tableau de contingence des
caractéristiques de tendance centrale et de dispersion

7
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

On considère un tableau de contingence comme celui défini au paragraphe I:


X prend les valeurs x1 , x2 , ... , xp ;
Y prend les valeurs y1 , y2 , ... , yq .
(Les xi ou yi sont les centres de classes dans le cas où X et Y sont des variables quantitatives
continues).

1. Caractéristiques Marginales
1-1 Moyennes marginales
Moyenne marginale de X
La moyenne marginale de X notée correspond à la valeur moyenne du caractère X
possédée par les individus de la population indépendamment du caractère Y

n i .. xi
1 p P

 ni . x i   f i . x i ;
i 1
la moyenne marginale : X  
N n.. i 1 i 1

Exemple :
xi ni. [Link]
1 25 25
2 18 36
3 17 51
60 112

n i .. xi
1 p 112

i 1
X   ni . x i   1,86
N n.. i 1 60

Moyenne marginale de Y
La moyenne marginale de Y notée correspond à la valeur moyenne du caractère Y
possédées par les individus de la population indépendamment du caractère X

 n. j yj
1 q q
la moyenne marginale : Y  J 1

N
  .j j 
n.. J 1
n y 
j 1
f. j y j

Exemple :
yj n.j [Link]
4 39 156
8 15 120
13 6 78
60 354

8
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

 n. j yj
1 q 354
Y  J 1

N
 
n.. J 1
n. j y j 
60
 5,9

1-2 Variances marginales


Variance marginale de X
La variance marginale de X notée V(x) est une mesure de la dispersion des individus de la
population selon X et indépendamment de Y

 
p p
 ni . x i  X
2
 ni.x
2
i
- la variance marginale : V  X  
2
i 1
 i 1
X .
N N
L’écart type marginale de X
 X  V X  
Exemple
xi ni. xi2 ni.xi2
1 25 1 25
2 18 4 72
3 17 9 153
60 - 250

 ni.x i
2

Variance marginale de X V  X  
2
i 1
 X  250 / 60  1,86 2  0,71
N
L’écart type marginale de X σX =
Variance marginale de Y
La variance marginale de Y notée V(y) est une mesure de la dispersion des individus de la
population selon Y et indépendamment de X

 
q q

 n. j y j  Y  n. jy
2 2
j

- la variance marginale : V Y  
2
j 1 j 1
 Y .
N N
Exemple
yj n.j yj2 n.jyj2
4 39 16 624
8 15 64 960
13 6 169 1014
60 - 2598

9
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

 n. jy
2
j

Variance marginale de Y V Y  
2
j 1
 Y  2598 / 60  5,9 2  8,49
N
L’écart type marginale de Y
 Y  V Y  
2. Caractéristiques Conditionnelles
2-1 Moyennes Conditionnelles
On peut, de la même façon définir les caractéristiques de toutes les séries conditionnelles (toujours
dans le cas où X et Y sont quantitatives).
Il y a (p + q) séries conditionnelles associées au tableau : p séries conditionnelles "Y sachant X = x i" et
q séries "X sachant Y = yj".

Moyennes conditionnelles de X sachant Y=yj


p

n
i 1
ij xi
la moyenne conditionnelle de "X sachant Y = yj" : X j  ;
n. j
Exemple : calculons les moyennes conditionnelles

xi Y=y1 ni1xi
1 15 15
2 13 26
3 11 33
39 74

n
i 1
i1 xi
X1   74 / 39  1,89
n.1

xi Y=y2 ni2xi
1 8 8
2 4 8
3 3 9
15 25

n
i 1
i2 xi
X2   25 / 15  1,66
n.2
xi Y=y3 ni3xi
1 2 2
2 1 2
3 3 9
6 13

10
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

n
i 1
i3 xi
X3   13 / 6  2,16
n.3

Moyennes conditionnelles de Y sachant X=xi


q

n
j 1
ij Yj
- la moyenne conditionnelle de "Y sachant X = xi" : Yi  .
ni.
Exemple : calculons les moyennes conditionnelles

yj X=x1 n1j yj
4 15 60
8 8 64
13 2 26
25 150

yj X=x2 n2j yj
4 13 52
8 4 32
13 1 13
18 97

yj X=x3 n3j yj
4 11 44
8 3 24
13 3 39
17 107

2-2 Variances Conditionnelles


Variances conditionnelles associées à X

 n x  Xj
p p

n
2
ij i ij xi 2
V j X  
i 1 2
 i 1
Xj
n. j n. j
On peut donc calculer j variances conditionnelles associées à X
Exemple
11
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES

Calculons V2(X)
xi Y=y2 xi 2 ni21xi 2
1 8 1 8
2 4 4 16
3 3 9 27
15 51

=0,645

Variances conditionnelles associées à Y


 nij y j  Yi 
q q

n
2 2
ij yj
Vi Y  
j 1 j 1 2
  Yi .
ni . ni .
On peut donc calculer i variances conditionnelles associées à Y
Exemple
Calculons V2(Y)
yj X=x2 yj2 n2j yj2
4 13 16 208
8 4 64 256
13 1 169 169
18 633

Remarque : Relations entre caractéristiques marginales et conditionnelles.


La distribution marginale de X résulte en fait du mélange des distributions conditionnelles "X sachant Y
= yj" représentées en effectifs n.j et la distribution marginale de Y résulte du mélange des distributions
conditionnelles "Y sachant X = xi" représentées en effectifs ni. .
On en déduit alors les relations suivantes entre les moyennes :
La moyenne marginale est égale à la moyenne des moyennes conditionnelles pondérées par les
effectifs marginaux :
 q p

  n. j X j n Y  i. i
X  j  1
; Y 
i 1 
 N N 
 
 
et les relations suivantes entre les variances :
La variance marginale est égale à la moyenne des variances conditionnelles augmentée de la variance
des moyennes conditionnelles :

12
CHAPITRE I : LES SERIES STATISTIQUES A DEUX DIMENSIONS : DISTRIBUTIONS MARGINALES ET CONDITIONNELLES


X 2  
  n V Y   n .Y  
q q p p

n V j X  n
2
 .j .j X  
j i. i i i Y
V  X   j 1

j 1
 . V Y   i 1

i 1
 .
 N N   N N 
   
   
On peut traduire ces dernières relations en disant que l'hétérogénéité de la distribution marginale
résulte à la fois de :
- l'hétérogénéité propre à chaque distribution conditionnelle ;
- l'hétérogénéité des moyennes conditionnelles entre elles.

Indépendance et liaisons de deux caractères (X,Y) :

- Indépendance : les caractères X et Y sont indépendants si les moyennes conditionnelles


sont égales entre elles d’une part et égales à la moyenne marginale ( = = …= = ) ou
( = = ….= = )
De même, ils sont indépendants si on vérifie : nij = ou fij =fi. X f.j
- Liaison entre X et Y : les deux caractères sont liés si les égalités précédentes ne sont pas
vérifiées

3. La Covariance
On associe aux deux caractères quantitatifs X et Y une caractéristique globale appelée la covariance et
définie par :


 n ij x  X y
i j Y 


Cov X ,Y  
i j
.
 N 
 
On montre que l'on peut calculer la covariance par la formule :

 n ij xi y j
Cov X ,Y    X .Y
i j

13

Vous aimerez peut-être aussi