I / GENERALITES.
VOCABULAIRE
Population : Toute étude statistique porte sur un ensemble Ω appelé population. Ω n’est pas
forcément composé de personnes.
Individu ou unité statistique : Tout élément de Ω .
Caractère : toute propriété que peut avoir un individu de Ω . On distingue les caractères
qualitatifs (qui ne peuvent pas s’exprimer par un nombre) et les caractères quantitatifs
(mesurés par un nombre) .
Enquête statistique : mesure du (ou des) caractère(s) sur chaque individu de la population.
Les résultats de cette enquête sont les données brutes qu’il va falloir organiser et résumer dans
un tableau à l’aide d’un petit nombre de valeurs caractéristiques : les caractéristiques de
position (mode , médiane, moyenne), les valeurs caractéristiques de dispersion (variance ,
écart type) : c’est le but de la statistique descriptive.
Série statistique : C’est la donnée des différentes valeurs du (ou des) caractère(s) , chacune
étant accompagnée du nombre d’individus ayant cette valeur du caractère (ce nombre est
appelé effectif de cette valeur) . on la donne sous forme de tableau ou d’un ensemble de
couples, de triplets …..
II / ETUDE D’UNE SERIE STATISTIQUE A DEUX VARIABLES OU SERIE
DOUBLE
On parle de série statistique à deux variables quand on étudie simultanément deux caractères
dans une même population.
Exemple : On a relevé les notes de Maths et de Physique de 160 candidats à un examen. Les
caractères étudiés sont donc la note de Maths X et la note de Physique Y. Les valeurs des
caractères X et Y sont données par le tableau à double entrée suivant, appelé tableau de
distribution ou de corrélation :
X 7 10 11 12 14 15 X
Y
7 5 7 2 0 3 5 22
8 1 4 0 6 2 3 16
9 8 9 10 13 5 4 49
10 0 3 7 12 10 11 43
11 1 1 3 2 0 4 11
13 2 6 2 3 5 1 19
Y 17 30 24 36 25 28 N=160
Vocabulaire
n ij est l’effectif partiel du couple x i ; y j : c’est le nombre d’individus qui ont la valeur xi du
caractère X et la valeur yj du caractère Y . Pour notre exemple : n11 = 5 ; n43 = 13 ; n56 = 5 etc.
La somme de tous les effectifs partiels donne l’effectif total N = 160 .
n ij
La fréquence du couple x i ; y j est f ij .
N
Nuage de points
1
L’ensemble des points de coordonnées non toutes nulles Mij (Xi , Yj) représente le nuage de
points de la série. Au dessus de chaque point Mij du nuage on précise l’effectif n ij
yj
15
14
12
11
10
(5)
7
7 8 9 10 11 13 xi
Séries Marginales
La somme des effectifs partiels contenus dans la ligne de xi (respectivement la colonne de yj)
est appelée effectif partiel marginal de xi (respectivement effectif partiel marginal de yj).
En notant respectivement ni et nj les effectifs partiels marginaux de xi et de yj :
les séries marginales sont (xi , ni ) et (yj, nj )
n i
la fréquence marginale de xi est f i
N
n j
la fréquence marginale de yj est f j
N
Les séries marginales X et Y sont représentées par
X 7 8 9 10 11 13
Effect marg 22 16 49 43 11 19
Valeurs caractéristiques d’une série double
Considérons la série double définie dans l’exemple précédent
X 0 1 2 3 4 5 Y n ij x i y j
Y i
1 8 2 1 0 0 0 11 4
2 3 11 10 5 1 0 30 100
3 1 3 16 13 4 1 38 285
4 0 1 3 5 8 4 21 296
X 12 17 30 23 13 5 N=100
Les effectifs partiels des séries marginales sont :
n1 = 12 ; n2 = 17 ; n3 = 30 ; n4 = 23 ; n5 = 13 ; n6 = 5 .
n∙1 = 11 ; n∙2 = 30 ; n∙3 = 38 ; n∙4 = 21 .
2
Soit x et y les moyennes des séries X et Y .
1 1
x
N
xi ni 2 , 2 3 et y
N
y jn j
2, 69 .
i j
Les variances des séries X et Y sont définies par :
2 2 2
V(X) = xi ni x
2
= 1.9 et V(Y) = yj nj y =1.49 .
i j
Les écarts-types de X et Y sont par définition :
x = V(X) ≃ 1,378 et y = V(Y) ≃ 1,22 .
La covariance de (X ; Y) est définie par
Cov(X ; Y) =
1
n ij x i x y j
y = xy
. On démontre que :
N
1 4 100 285 296 685
Cov(X ; Y) =
N
n ij x i y j
x y =
100
2 .2 3 2 .6 9
100
5 .9 9 8 7 0 .8 5
Le coefficient de corrélation linéaire de (X ; Y) est défini par
cov( X ; Y ) 0 .8 5
( X ;Y ) = ≃ 0,505 .
X
Y 1 .9 1 .4 9
Cas particulier d’une série double injective
On appelle ainsi une série double telle qu’à chaque valeur du caractère X, correspond une
seule valeur du caractère Y.
Exemple : On considère la série statistique suivante qui donne les dépenses annuelles en
millions de francs d’une société de 1996 à 2005 .
Années xi 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Dépenses yi 0,3 0,30,4 0,4 0,7 0,9 1,0 1,3 1,4 1,5 2,2
Dans ce cas, les formules précédentes se simplifient. On obtient :
1 1 1 1
x
N
xi ni ; y
N
yini ; Cov(X ; Y) =
N
ni xi x y i
y = N
ni xi yi x y .
i i
cov( X ; Y )
( X ;Y ) .
X
Y
Cas d’une série distribuée en classes
Dans ce cas, on utilise les mêmes formules, mais on remplace les xi et les yi par les centres
des classes.
Exemple : Le classement d’un certain nombre d’individus selon leur âge A et leur taille T a
donné le tableau à double entrée suivant :
A [40 ; 45[ [45 ; 50[ [50 ; 55[ [55 ; 60[
T
[150 ; 155[ 20 9 1 0
[155 ; 160[ 2 18 4 1
[160 ; 165[ 0 5 12 6
[165 ; 170[ 0 1 7 14
Exercice : On demande :
1°) de représenter graphiquement cette série par un nuage de points.
2°) de calculer le coefficient de corrélation.
Remarque
3
Le point G x ; y est appelé point moyen de la série double . x et y sont les moyennes des
séries marginales X et Y. On le représente dans le nuage de points
Séries Conditionnelles
Si X : x1, x2, ……… xp et Y : y1, y2, ……… yq. la série conditionnelle X sachant que Y = yk
notée X/ Y = yk est obtenue en prenant tous les couples (xi , yk ) où i varie de 1 à p et k fixe.
série conditionnelle X sachant que Y = 7
X 7 8 9 10 11 13
Y= 7 5 1 8 0 1 2
Fréquences conditionnelles
De même en notant f’k/i la fréquence conditionnelle de yk sachant X = xi on a f’k/i =
nk /i
(avec ni l’effectif partiel marginal de xi. Avec ces notations on a
n i
fik = f i / k f k
Courbes d’ajustement
Dans la pratique les deux variables sont souvent liées d’une certaine manière. Sur le
graphique représentant le nuage de points sur un repère orthonormé il est parfois possible de
tracer une courbe épousant au mieux l’ensemble des points : c’est la courbe d’ajustement. La
courbe d’ajustement peut être linéaire, parabolique, logarithmique etc……
Un ajustement linéaire n’apparaît nécessaire que lorsque le nuage de points associé au
couple ( X,Y ) a une forme « allongée ».On cherche dans ce cas à exprimer Y comme
fonction affine de X .
Dans le cas contraire la méthode d’ajustement linéaire donnera toujours un résultat qui
malheureusement ne sera qu’une très mauvaise représentation mathématique de la réalité et
donc ne sera pas exploitable
Méthode à main levée
On détermine le point moyen et on trace approximativement la courbe qui paraît passer le
« plus prés possible » de tous les points du diagramme de dispersion
Méthode de Mayer
On partage le nuage de points en deux parties de même effectif (ou d’effectifs différents d’une
unité quand N est impair).
On détermine le point moyen de chaque partie.
La droite de Mayer est la droite passant par ces deux points moyens
Exemple
On fait une enquête sur 100 familles portant sur :
- Le nombre d’enfants par famille (X)
- le nombre de pièces d’habitations par famille (Y)
Les résultats sont donnés par le tableau ci – dessous
4
Y 0 1 2 3 4 5
X
1 8 2 1 0 0 0
2 3 11 10 5 1 0
3 1 3 16 13 4 1
4 0 1 3 5 8 4
On partage la série en deux séries statistiques doubles S1et S2 de même effectif
La série S1est donnée par le tableau suivant :
Y 0 1 2 Y
X
1 8 2 0 11
2 3 11 6 20
3 1 3 13 17
4 0 1 2 3
X 12 17 21 N1=50
La série S2 est donnée par le tableau suivant
Y 2 3 4 5 Y
X
1 1 0 0 0 1
2 4 5 1 0 10
3 3 13 4 1 21
4 1 5 8 4 18
X 9 23 13 5 N2=50
On détermine le point moyen G1de la série S1, le point moyen G2 de la série S2 et une
équation de la droite ( G1G2 ) . Cette droite est appelée droite d’ajustement linéaire par la
méthode de MAYER .
On peut en utilisant l’équation de cette droite estimer la valeur de Y connaissant une valeur de
X
Méthode des moindres carrés
La méthode des moindres carrées permet de déterminer la droite qui passe le plus près des
points du nuage. On démontre qu’il y a deux telles droites :
1°)Droite de régression de Y en X
cov( X ; Y )
Dy : y = ax + b avec a et b y ax ou y ― y = a (x ― x ).
x v(x)
c’est la droite qui minimise la somme des carrés des distances avec M ij
(points du nuage)
parallèlement à (oy)
Dans la figure ci-dessous
Pour tout point Mk du nuage ,si Pk est son projeté sur Dy/x on cherche les réels a et b tels que
5
La somme Sab = (M k
Pk )
2
soit minimale
k
y
Dy/x
Mk
Pk
O x
2°)Droite de régression de X en Y
cov( X ; Y )
D x
: x = a’y + b’ avec a' et b' x a' y .
y v( y)
C’est la droite qui minimise la somme des carrés des distances avec M ij
(points du nuage)
parallèlement à (ox) .
Ces deux droites passent par le point moyen .
Remarques
De plus 1 1 .
aa ' .
2
On a
- Si est très proche de 1, c’est-à-dire si est très proche de 1 ou de ― 1, on dit qu’il
2
y a une forte corrélation entre X et Y
- Les droites de régression permettent dans ce cas de faire une bonne estimation de Y
connaissant la valeur de Y ( on utilise D y ) ou de faire une bonne estimation de X
x
connaissant la valeur de Y ( D x )
y
- Si 0 . 75 la corrélation est faible et les droites de régression ne permettent pas de
2
faire une bonne estimation .
6
7