Caroline Anjot-Mourrain
Statistiques à deux variables
Dénition. On appelle série statistique à 2 variables (ou série statistique double), une série
statistique où 2 variables sont étudiées simultanément.
1 Nuage de points
On donne la série sous forme de tableau:
variable X x1 x2 ... xn
variable Y y1 y2 ... yn
Exemple. Un responsable de ventes a dressé le tableau des dernières années de son chire d'aaires
ainsi que des frais de publicité engagés (en miliers d'euros). Son but est d'étudier la relation pouvant
exister entre ces 2 variables.
Frais de publicité X 10 6 6,5 11,5 11 8 7 6,5 11 9
Chire d'aaires Y 250 220 228 262 268 244 240 222 259 246
On représente graphiquement cette série double dans un repère orthogonal en plaçant les points
Mi(xi; yi) :
2 Paramètres caractéristiques
2.1 Point moyen
Dénition. On dénit le point moyen G de cette série double comme le point de coordonnées
,Y) où X
(X est la valeur moyenne de X et Yla valeur moyenne de Y.
Dans l'exemple, G(8; 65; 243; 90)
1
2.2 Variance et écart-type
Dénition. La variance de X est donnée par :
n
1X 2 2
V (X) = xi ¡ X
n
i=1
p
L'écart-type est : X = V (X)
Dans l'exemple, X = 2; 01 et Y =15,80
2.3 Covariance et coecient de corrélation linéaire
Dénition. La covariance des variables X et Y est donnée par la formule suivante:
n
1X Y
X ;Y = xiyi ¡ X
n
i=1
Dans l'exemple, X ;Y = 30; 36
Dénition. Le coecient de corrélation linéaire est déni par:
X ;Y
rX ;Y =
X Y
Le coecient de corrélation linéaire est un indice qui mesure le degré de relation entre les 2 variables
étudiées X et Y.
Dans l'exemple, r = 0; 95
Remarques:
Un coecient de corrélation est un nombre compris entre -1 et 1.
Un coecient de corrélation positif (respectivement négatif) indique que le nuage de points
est croissant (respectivement décroissant).
Le coecient vaut 0 s'il n'y a absolument aucune relation entre les 2 variables, 1 ou -1 si
les points sont parfaitement alignés.
2.4 Droite de regression (ou ajustement ane)
On cherche à déterminer une droite approchant le nuage de points. Ceci permettra de faire des
prévisions pour le futur. On utilise la méthode dite des moindres carrés .
X ;Y
Proposition. La droite de regression a pour équation Y=aX+b où a= 2 et b est déterminé
X
par le fait que cette droite passe par le point moyen G du nuage de points donc b=Y ¡ a X.
30; 36
Dans l'exemple: a = 7; 49 et b = 243; 90 ¡ 7; 49 8; 65 179; 09
2; 012
La droite de regression a donc pour équation Y = 7; 49X + 179; 09
2
Remarque: Ceci est une méthode d'ajustement ane, il en existe d'autres.
La droite de régression permet de faire des prédictions.
Par exemple pour une dépense de 9,5 milliers d'euros de publicité, on peut s'attendre à un chire
d'aaires de y=7,499; 5 + 179; 09 = 250; 2 milliers d'euros.