0% ont trouvé ce document utile (0 vote)
19 vues19 pages

Analyse bivariée des données statistiques

analyse bivarie

Transféré par

Youness Jiala
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
19 vues19 pages

Analyse bivariée des données statistiques

analyse bivarie

Transféré par

Youness Jiala
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre 2

Analyse bivariée

1 / 19
Plan

1 Définitions :

2 Paramètres et tableaux de calculs


2.1-Données non groupées :
2.2- Données groupées :
2.3- Propriétés :
2.4 Distribution conditionnelle, indépendance
2.5- Exemple :

2 / 19
1- Définitions :

On se donne une population de taille n et sur chaque élément de cette


population on effectue deux observations portant sur deux caractères
différents X et Y .
Pour chaque élément de l’échantillon, on peut associer un couple de
valeurs (xi , yi ) où xi est la valeur du caractére X et yi est la valeur du
caractére Y .

3 / 19
On obtient aussi un nuage de n points constituant un diagramme de
dispersion.

Les résultats de ces observations peuvent être présentés sous deux


formes
Données non groupées :

Individu 1 2 ··· n
Valeur X x1 x2 ··· xn
Valeur Y y1 y2 ··· yn

4 / 19
Données groupées :
Les valeurs prises par X et Y étant respectivement x1 , x2 , · · · , xp et
y1 , y2 , · · · , yq .
nij est l’effectif des individus dont les valeurs de X et Y sont
respectivement xi et yj .

X Y y1 y2 ... yj ... yq Totaux


x1 n11 n12 ... n1j ... n1q n1.
x2 n21 n22 ... n2j ... n2q n2.
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 ... nij ... niq ni.
.. .. .. .. .. .. .. ..
. . . . . . . .
xp np1 np2 ... npj ... npq np.
Totaux n.1 n.2 ... n.j ... n.q n

5 / 19
Ce tableau doit être lu de la façon suivante :
l’effectif du caractère double (xi , yi ) est nij .
nij est l’effectif des individus présentant simultannement les
modalités xi et yj .
P
L’effectif de toute la population est n = i,j nij .
nij X
En fréquence fij = et fij = 1.
n
i,j

6 / 19
Définitions
- Effectifs marginaux.
La somme des effectifs contenus dans la ligne de xi est égale à
l’effectif des élements dont la valeur du caractère X est xi . Elle est
notée ni. .
q
X
ni. = ni1 + · · · + niq = nij .
j=1

La somme des effectifs partiels contenus dans la colonne de yj est


égale à l’effectif des élements dont la valeur du caractère Y est yj . Elle
est notée n. j .
p
X
n. j = n1j + · · · + npj = nij .
i=1

7 / 19
ni. et n. j : sont appelés effectifs partiels marginaux.
On a :
Xp Xq p X
X q
n= ni. = n. j = nij .
i=1 j=1 i=1 j=1

8 / 19
- Fréquences marginales

ni.
fi. = fréquence marginale de xi .
n
n. j
f. j = fréquence marginale de yj .
n
On a
p
X q
X p X
X q
fi. = f. j = fij = 1.
i=1 j=1 i=1 j=1

(fij fréquence partielle correspondant  à X = xi et Y = yj ).


Les couples (xi , ni. )1≤i≤p et yj , n. j 1≤j≤q définnissent les distributions
statistiques marginales.

9 / 19
2- Paramètres et tableaux de calculs
2.1-Données non groupées :
Comme dans le cas d’un seul caractère, on a :
n n
1X 1X
Moyennes X = xi et Y = yi .
n n
i=1 i=1

n
1X 2
Variances V (X ) = σX2 = xi − X
n
i=1
n
!
1X 2 2
= xi − X
n
i=1

n
1X 2
et V (Y ) = σY2 = yi − Y
n
i=1
n
!
1X 2 2
= yi − Y .
n
i=1

10 / 19
On introduit maintenant deux nouveaux caractères qui dépendent à la
fois de X et de Y .
Covariance. la Covariance de X et Y , notée cov (X , Y ), est définie
par :
n
1X  
σXY = cov (X , Y ) = xi − X yi − Y .
n
i=1

On montre aisément que :


n
!
1X
σXY = xi yi − X Y.
n
i=1

Le coefficient de corrélation linéaire du couple (X , Y ) noté ρ(X , Y ), est


définis par :
cov (X , Y )
ρ(X , Y ) = .
σX σY

11 / 19
2.2- Données groupées :
Plus généralement et surtout lorsque l’effectif total est grand, si x1 , . . . , xp
sont les modalités de X et y1 , . . . , yq sont les modalités de Y , on dresse le
tableau suivant :
q q
X X
X Y y1 ··· yq ni. ni. xi ni. xi2 nij yj xi nij yj
j=1 j=1
x1 n11 ··· n1q n1. n1. x1 n1. x12
.. .. .. .. ..
. . . . .
xp np1 ··· npq np. np. xp np. xp2
n..j n.1 ··· n.q n
n. j yj n. 1 y1 ··· n. q yq
n. j yj2 n. 1 y12 ··· n. q yq2
p
X
nij xi ···
i=1
p
X
yj nij xi ···
i=1

12 / 19
p q
1X 1X
i) Moyennes : X = ni. xi et Y = n.j yj
n n
i=1 j=1
ii) Variances :
p
1X 2
V (X ) = σX2 = ni. xi − X
n
i=1
p
!
1X 2
= ni. xi2 − X
n
i=1

q
1X 2
et V (Y ) = σY2 = n.j yi − Y
n
j=1
 
q
1 X 2
=  n.j yi2  − Y
n
j=1
p p
iii) Ecart-type : σX = V (X ) et σY = V (Y )
13 / 19
iv ) Covariances :
On appelle covariance du couple
 (X , Y ) et on le note cov (X , Y ) ou
σXY la moyenne de X − X Y − Y
p q
1 XX  
cov (X , Y ) = nij xi − X yi − Y .
n
i=1 j=1
 
p q
1 XX
On montre que : σXY = cov (X , Y ) =  nij xi yj  − X Y . v )
n
i=1 j=1
Coefficient de correlation linéaire :

cov (X , Y )
ρ(X , Y ) = .
σX σY

N.B L’importance des paramètres cov (X , Y ) et ρ(X , Y ) apparaîtra


quand on s’intéressera au lien (ou corrélation) éventuel entre X et Y .

14 / 19
2.3- Propriétés :

On montre que :
|ρ(X , Y )| ≤ 1.
aa0
ρ(aX + b, a0 Y + b0 ) = ρ(X , Y ). donc
|aa0 |
ρ(aX + b, a0 Y + b0 ) = ±ρ(X , Y )
1
cov (aX + b, a0 Y + b0 ) = cov (X , Y ).
aa0
Ces formules sont utilisables pour simplifier les calculs.

15 / 19
X −c
En effectuant les changement de variables suivants : X 0 = de et
d
Y − c0
Y0 =
d0
avec d, d 0 6= 0, on obtient :

1
cov (X 0 , Y 0 ) = cov (X , Y ).
dd 0
|dd 0 |
ρ(X 0 , Y 0 ) = ρ(X , Y )
dd 0
donc ρ(X 0 , Y 0 ) = ±ρ(X , Y ).

Démonstration : (cf. exercice 1 ; fiche TD N◦ 2)

16 / 19
2.4 Distribution conditionnelle, indépendance

La fréquence conditionnelle de xi sachant yj (yj réalisé)

nij fij
fi/j = =
n· j f· j

Où nij est l’effectif correspondant à X = xi et n· j l’effectif partiel


marginal de yj .
nij fij
On a fj/i = = .
ni· fi·
Ainsi fij = fi· × fj/i = f· j × fi/j .

17 / 19
Définition
Deux variables statistiques X et Y sont dites statistiquement
indépendantes si et seulement si, pour chacune des deux variables,
les distributions conditionnelles sont identiques à la distribution
marginale :
fi/j = fi· ou fj/i = f· j ∀ (i, j)

Conséquence : Les caractères X et Y sont indépendants si et


seulement si
∀ (i, j) fij = fi· × f· j

18 / 19
2.5- Exemple :
Sur le tableau suivant figure l’âge de la mère (x) et le poids de l’enfant
(y) pour un échantillon de 40 naissances, présentés avec un
groupement à deux dimensions en classe d’âge de 5 ans et en classe
de poids de 500g

2500 3000 3500 4000 4500 ni.


20 1 5 4 2 - 12
25 2 3 5 1 - 11
30 1 2 2 1 - 6
35 - 3 3 1 1 8
40 - 2 - 1 - 3
n.j 4 15 14 6 1 40

n13 = 4 signifie qu’il ya 4 enfants dont l’âge de la mère est 20 ans et


dont le poids est 3500g. Il y a 6 mères dont l’âge est 30 ans. Il Y a 14
enfants dont le poids est 3500g.

19 / 19

Vous aimerez peut-être aussi