Cours 1
Cours 1
première année
J. Dedecker
de centres x1 , · · · , xi , · · · , xp .
Valeurs de Y en q classes
de centres y1 , . . . , yj . . . , yq .
X , e X ] et son centre x .
Confusion parfois entre la classe ]ei−1 i i
X , e X ] de centre x .
Si X est continue, xk = xi signifie xk ∈]ei−1 i i
{(xi , yj , nij ) ; 1 ≤ i ≤ p, 1 ≤ j ≤ q}
pour i = 1, . . . , p et j = 1, . . . , q.
I nij : nombre d’individus possédant la modalité xi de X et la modalité
yj de Y .
Xq
I ni• = nij : nombre d’individus possédant la modalité xi (∈ classe de
j=1
centre xi ) de X ;
Xp
I n•j = nij : nombre d’individus possédant la modalité yj de Y ;
i=1
X q
p X p
X q
X
I n= nij = ni• = n•j ; nombre total d’individus de la
i=1 j=1 i=1 j=1
population.
pour i = 1, . . . , p et j = 1, . . . , q
nij
I fij = : proportion d’individus possédant la modalité xi de la variable
n
X et la modalité yj de la variable Y .
X q
I fi• = fij : fréquence de la modalité xi de X .
j=1
p
X
I f•j = fij : fréquence de la modalité yj de Y .
i=1
p X
X q p
X q
X
I 1= fij = fi• = f•j .
i=1 j=1 i=1 j=1
distribution jointe en fréquences de X et de Y :
{(xi , yj , fij ) ; 1 ≤ i ≤ p, 1 ≤ j ≤ q} .
Région NE NW S W Total
Sexe
Femme 61 62 97 77 297
Homme 68 60 103 71 302
Total 129 122 200 148 599
Tableau en pourcentage :
Région NE NW S W Total
Sexe
Femme 10.18 10.35 16.19 12.86 49.58
Homme 11.35 10.02 17.20 11.85 50.42
Total 21.53 20.37 33.39 24.71 100
Tableau en pourcentage :
Région NE NW S W Total
Sexe
Femme 61 62 97 77 297
Homme 68 60 103 71 302
Total 129 122 200 148 599
En fréquences (pourcentages) :
Région NE NW S W Total
Sexe
Femme 10.18 10.35 16.19 12.86 49.58
Homme 11.35 10.02 17.20 11.85 50.42
Total 21.53 20.37 33.39 24.71 100
Y y1 y2 ... yj ... yq
X
x1 f1/1 f1/2 ... f1/j ... f1/q
x2 f2/1 f2/2 ... f2/j ... f2/q
.. .. .. .. ..
. . . . .
xi fi/1 fi/2 ... fi/j ... fi/q
.. .. .. .. ..
. . . . .
xp fp/1 fp/2 ... fp/j . . . fp/q
Total 1 1 ... 1 ... 1
Sur les ..... personnes observées, ..... sont des femmes qui touchent
entre 15 et 20 $ de l’heure.
Sur les ..... personnes observées, ..... sont des femmes qui touchent
entre 0 et 10 $ de l’heure.
Qu’en pensez-vous ?
Moyennes marginales x et y
p p
1X X
x = ni• xi = fi• xi .
n
i=1 i=1
q q
1X X
y = n•j yj = f•j yj .
n
j=1 j=1
Soit aussi
p p
1X X
σx2 = ni• xi2 − (x)2 = fi• xi2 − (x)2 .
n
i=1 i=1
q q
1X X
σy2 = n•j yj2 − (y )2 = f•j yj2 − (y )2 .
n
j=1 j=1
avec
nij
ni/j = nij et fi/j =
n•j
Moyenne conditionnelle de X sachant que Y = yj : x /j
p p p
1 X 1 X X
x /j = x /Y =yj = ni/j xi = nij xi = fi/j xi ;
n•j n•j
i=1 i=1 i=1
2
Variance conditionnelle de X sachant que Y = yj : σx/j
p p
2 1 X 2 X 2
σx/j = V (x/Y =yj ) = ni/j xi − x /j = fi/j xi − x /j .
n•j
i=1 i=1
avec
nij
nj/i = nij et fj/i =
ni•
Moyenne conditionnelle de Y sachant que X = xi : y /i
q q q
1 X 1 X X
y /i = y /X =xi = nj/i yj = nij yj = fj/i yj ;
ni• ni•
j=1 j=1 j=1
q q
1 X 2 X 2
σy2/i = V (y/X =xi ) = nj/i yj − y /i = fj/i yj − y /i .
ni•
j=1 j=1
p
2 1 X 2
σx/j = ni/j xi − x /j
n•j
i=1
p p
1 X 2 X 2
= nij xi2 − x /j = fi/j xi2 − x /j .
n•j
i=1 i=1
q
1 X 2
σy2/i = nj/i yj − y /i
ni•
j=1
q q
1 X 2 X 2
= nij yj2 − y /i = fj/i yj2 − y /i .
ni•
j=1 j=1
q q
1X X
x = n•j x /j = f•j x /j .
n
j=1 j=1
p p
1 X X
y = ni• y /i = fi• y /i .
n
i=1 i=1
297x16.6 + 302x19.2
17.9 = .
599
Calculs effectués à partie des données brutes. Les calculs à partir des
données groupées ne donnent qu’une approximation du vrai résultat.
297x16.17 + 302x19.15
17.67 = .
599
Ces résultats approchés seront d’autant plus précis que le découpage
en classe est fin.
1. Couple de variables statistiques (J. Dedecker) Statistique descriptive bivariée 49 / 51
Exemple : Salaire horaire selon la région
À partir des données brutes