Chapitre 2
Analyse bivariée
1 / 19
Plan
1 Définitions :
2 Paramètres et tableaux de calculs
2.1-Données non groupées :
2.2- Données groupées :
2.3- Propriétés :
2.4 Distribution conditionnelle, indépendance
2.5- Exemple :
2 / 19
1- Définitions :
On se donne une population de taille n et sur chaque élément de cette
population on effectue deux observations portant sur deux caractères
différents X et Y .
Pour chaque élément de l’échantillon, on peut associer un couple de
valeurs (xi , yi ) où xi est la valeur du caractére X et yi est la valeur du
caractére Y .
3 / 19
On obtient aussi un nuage de n points constituant un diagramme de
dispersion.
Les résultats de ces observations peuvent être présentés sous deux
formes
Données non groupées :
Individu 1 2 ··· n
Valeur X x1 x2 ··· xn
Valeur Y y1 y2 ··· yn
4 / 19
Données groupées :
Les valeurs prises par X et Y étant respectivement x1 , x2 , · · · , xp et
y1 , y2 , · · · , yq .
nij est l’effectif des individus dont les valeurs de X et Y sont
respectivement xi et yj .
X Y y1 y2 ... yj ... yq Totaux
x1 n11 n12 ... n1j ... n1q n1.
x2 n21 n22 ... n2j ... n2q n2.
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 ... nij ... niq ni.
.. .. .. .. .. .. .. ..
. . . . . . . .
xp np1 np2 ... npj ... npq np.
Totaux n.1 n.2 ... n.j ... n.q n
5 / 19
Ce tableau doit être lu de la façon suivante :
l’effectif du caractère double (xi , yi ) est nij .
nij est l’effectif des individus présentant simultannement les
modalités xi et yj .
P
L’effectif de toute la population est n = i,j nij .
nij X
En fréquence fij = et fij = 1.
n
i,j
6 / 19
Définitions
- Effectifs marginaux.
La somme des effectifs contenus dans la ligne de xi est égale à
l’effectif des élements dont la valeur du caractère X est xi . Elle est
notée ni. .
q
X
ni. = ni1 + · · · + niq = nij .
j=1
La somme des effectifs partiels contenus dans la colonne de yj est
égale à l’effectif des élements dont la valeur du caractère Y est yj . Elle
est notée n. j .
p
X
n. j = n1j + · · · + npj = nij .
i=1
7 / 19
ni. et n. j : sont appelés effectifs partiels marginaux.
On a :
Xp Xq p X
X q
n= ni. = n. j = nij .
i=1 j=1 i=1 j=1
8 / 19
- Fréquences marginales
ni.
fi. = fréquence marginale de xi .
n
n. j
f. j = fréquence marginale de yj .
n
On a
p
X q
X p X
X q
fi. = f. j = fij = 1.
i=1 j=1 i=1 j=1
(fij fréquence partielle correspondant à X = xi et Y = yj ).
Les couples (xi , ni. )1≤i≤p et yj , n. j 1≤j≤q définnissent les distributions
statistiques marginales.
9 / 19
2- Paramètres et tableaux de calculs
2.1-Données non groupées :
Comme dans le cas d’un seul caractère, on a :
n n
1X 1X
Moyennes X = xi et Y = yi .
n n
i=1 i=1
n
1X 2
Variances V (X ) = σX2 = xi − X
n
i=1
n
!
1X 2 2
= xi − X
n
i=1
n
1X 2
et V (Y ) = σY2 = yi − Y
n
i=1
n
!
1X 2 2
= yi − Y .
n
i=1
10 / 19
On introduit maintenant deux nouveaux caractères qui dépendent à la
fois de X et de Y .
Covariance. la Covariance de X et Y , notée cov (X , Y ), est définie
par :
n
1X
σXY = cov (X , Y ) = xi − X yi − Y .
n
i=1
On montre aisément que :
n
!
1X
σXY = xi yi − X Y.
n
i=1
Le coefficient de corrélation linéaire du couple (X , Y ) noté ρ(X , Y ), est
définis par :
cov (X , Y )
ρ(X , Y ) = .
σX σY
11 / 19
2.2- Données groupées :
Plus généralement et surtout lorsque l’effectif total est grand, si x1 , . . . , xp
sont les modalités de X et y1 , . . . , yq sont les modalités de Y , on dresse le
tableau suivant :
q q
X X
X Y y1 ··· yq ni. ni. xi ni. xi2 nij yj xi nij yj
j=1 j=1
x1 n11 ··· n1q n1. n1. x1 n1. x12
.. .. .. .. ..
. . . . .
xp np1 ··· npq np. np. xp np. xp2
n..j n.1 ··· n.q n
n. j yj n. 1 y1 ··· n. q yq
n. j yj2 n. 1 y12 ··· n. q yq2
p
X
nij xi ···
i=1
p
X
yj nij xi ···
i=1
12 / 19
p q
1X 1X
i) Moyennes : X = ni. xi et Y = n.j yj
n n
i=1 j=1
ii) Variances :
p
1X 2
V (X ) = σX2 = ni. xi − X
n
i=1
p
!
1X 2
= ni. xi2 − X
n
i=1
q
1X 2
et V (Y ) = σY2 = n.j yi − Y
n
j=1
q
1 X 2
= n.j yi2 − Y
n
j=1
p p
iii) Ecart-type : σX = V (X ) et σY = V (Y )
13 / 19
iv ) Covariances :
On appelle covariance du couple
(X , Y ) et on le note cov (X , Y ) ou
σXY la moyenne de X − X Y − Y
p q
1 XX
cov (X , Y ) = nij xi − X yi − Y .
n
i=1 j=1
p q
1 XX
On montre que : σXY = cov (X , Y ) = nij xi yj − X Y . v )
n
i=1 j=1
Coefficient de correlation linéaire :
cov (X , Y )
ρ(X , Y ) = .
σX σY
N.B L’importance des paramètres cov (X , Y ) et ρ(X , Y ) apparaîtra
quand on s’intéressera au lien (ou corrélation) éventuel entre X et Y .
14 / 19
2.3- Propriétés :
On montre que :
|ρ(X , Y )| ≤ 1.
aa0
ρ(aX + b, a0 Y + b0 ) = ρ(X , Y ). donc
|aa0 |
ρ(aX + b, a0 Y + b0 ) = ±ρ(X , Y )
1
cov (aX + b, a0 Y + b0 ) = cov (X , Y ).
aa0
Ces formules sont utilisables pour simplifier les calculs.
15 / 19
X −c
En effectuant les changement de variables suivants : X 0 = de et
d
Y − c0
Y0 =
d0
avec d, d 0 6= 0, on obtient :
1
cov (X 0 , Y 0 ) = cov (X , Y ).
dd 0
|dd 0 |
ρ(X 0 , Y 0 ) = ρ(X , Y )
dd 0
donc ρ(X 0 , Y 0 ) = ±ρ(X , Y ).
Démonstration : (cf. exercice 1 ; fiche TD N◦ 2)
16 / 19
2.4 Distribution conditionnelle, indépendance
La fréquence conditionnelle de xi sachant yj (yj réalisé)
nij fij
fi/j = =
n· j f· j
Où nij est l’effectif correspondant à X = xi et n· j l’effectif partiel
marginal de yj .
nij fij
On a fj/i = = .
ni· fi·
Ainsi fij = fi· × fj/i = f· j × fi/j .
17 / 19
Définition
Deux variables statistiques X et Y sont dites statistiquement
indépendantes si et seulement si, pour chacune des deux variables,
les distributions conditionnelles sont identiques à la distribution
marginale :
fi/j = fi· ou fj/i = f· j ∀ (i, j)
Conséquence : Les caractères X et Y sont indépendants si et
seulement si
∀ (i, j) fij = fi· × f· j
18 / 19
2.5- Exemple :
Sur le tableau suivant figure l’âge de la mère (x) et le poids de l’enfant
(y) pour un échantillon de 40 naissances, présentés avec un
groupement à deux dimensions en classe d’âge de 5 ans et en classe
de poids de 500g
2500 3000 3500 4000 4500 ni.
20 1 5 4 2 - 12
25 2 3 5 1 - 11
30 1 2 2 1 - 6
35 - 3 3 1 1 8
40 - 2 - 1 - 3
n.j 4 15 14 6 1 40
n13 = 4 signifie qu’il ya 4 enfants dont l’âge de la mère est 20 ans et
dont le poids est 3500g. Il y a 6 mères dont l’âge est 30 ans. Il Y a 14
enfants dont le poids est 3500g.
19 / 19