0% ont trouvé ce document utile (0 vote)
51 vues10 pages

Sta Tle

Le chapitre 10 traite des séries statistiques à deux variables, définissant la série statistique double comme un ensemble de triplets représentant des couples de caractères quantitatifs. Il explique comment construire des tableaux de séries marginales et de fréquences marginales, ainsi que la représentation graphique des données sous forme de nuage de points. Enfin, il aborde les méthodes d'ajustement linéaire, y compris la méthode de Mayer et celle des moindres carrés, pour déterminer la droite d'ajustement d'un nuage de points.

Transféré par

senyf236
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
51 vues10 pages

Sta Tle

Le chapitre 10 traite des séries statistiques à deux variables, définissant la série statistique double comme un ensemble de triplets représentant des couples de caractères quantitatifs. Il explique comment construire des tableaux de séries marginales et de fréquences marginales, ainsi que la représentation graphique des données sous forme de nuage de points. Enfin, il aborde les méthodes d'ajustement linéaire, y compris la méthode de Mayer et celle des moindres carrés, pour déterminer la droite d'ajustement d'un nuage de points.

Transféré par

senyf236
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Chapitre 10 : SERIES STATISTIQUES A DEUX VARIABLES

« Sans la maîtrise des


formules , les
Mathématiques restent un
I. Présentation de la série statistique double mystère »
1. Définition

On note : 𝑥1 , 𝑥2 , 𝑥3 ,…, 𝑥𝑝 les valeurs(ou les modalités) du caractère X ; 𝑦1, 𝑦2 , 𝑦3 ,…, 𝑦𝑞 les
On considère deux caractères quantitatifs X et Y sur une même population de n individus.

valeurs du caractère Y et 𝑛𝑖𝑗 l’effectif du couple (𝑥𝑖 ,𝑦𝑗).


On appelle série statistique double de caractère (X, Y), l’ensemble des triplets (𝑥𝑖 , 𝑦𝑗 ,𝑛𝑖𝑗).

Exemple
Une étude statistique porte sur une population de 100 ménages. Deux caractères X et Y sont étudiés :
 le caractère X est le nombre d’enfants,
 le caractère Y est le nombre de pièces de l’appartement occupé.
On obtient le tableau suivant qui représente la série statistique de caractère (X, Y).

Y
1 2 3 4
X
0 6 3 1 0
1 4 11 3 1
2 1 10 16 3
3 0 5 13 5
4 0 1 4 8
5 0 0 1 4

Sur la 1ère ligne, sont inscrites les valeurs du caractère Y ; soit 𝑦1 = 1 ; 𝑦2 = 2 ; 3 = 3; 𝑦4 = 4. La


1ère colonne affiche les valeurs du caractère X qui sont : 𝑥1 = 0; 𝑥2 = 1 ; 𝑥3 = 2 ; 𝑥4 = 3;
𝑥5 = 4; 𝑥6 = 5.

effectifs 𝑛𝑖𝑗 des couples (𝑥𝑖 ,𝑦𝑗).


Les nombres du tableau qui ne sont pas sur la 1ère ligne et la 1ère colonne, représentent les différents

Ainsi considérons le nombre 6 dans ce tableau. On constate qu’il est dans la colonne de la valeur 1 du
caractère Y et dans la ligne de la valeur 0 du caractère X. On dit alors qu’il y a 6 ménages qui n’ont
aucun enfant et qui occupent un appartement d’une pièce. On dit que l’effectif du couple (0 ; 1) est 6.

Combien de ménages ont deux enfants et occupent un appartement de trois pièces ?


On va donc considérer la ligne ayant la valeur 2 du caractère X et la colonne ayant la valeur 3 du
caractère Y. L’intersection de cette ligne et de cette colonne donne 16.
16 ménages ont donc deux enfants et occupent un appartement de trois pièces.

Exercez-vous à la maison avec le reste des 𝑛𝑖𝑗.


On dit que l’effectif du couple (2 ; 3) est 16.

Le tableau ci-dessus est un tableau à double entrée appelé tableau de contingence.

1
Cours de Maths Tle A&B Complexe Scolaire ADICAR
M. Yvon SENEPOU (00236)72677263/7553257070063670 [email protected]
2. Tableau de séries marginales

Reprenons l’exemple précédent.

Il est question de trouver l’effectif de chaque modalité du caractère X et l’effectif de chaque modalité
du caractère Y.
Y 1 2 3 4 Total
X
0 6 3 1 0 10
1 4 11 3 1 19
2 4 10 16 3 30
3 0 5 13 5 23
4 0 1 4 8 13
5 0 0 1 4 5
Total 11 30 38 21 100

Pour trouver l’effectif de la valeur 0, on additionne tous les 𝑛𝑖𝑗 qui se trouvent sur la ligne de la valeur
Considérons le caractère X.

0 du caractère X c’est-à-dire : 6 + 3 + 1+ 0 = 10.

Pour trouver l’effectif de la valeur 3 du caractère X, on additionne tous les 𝑛𝑖𝑗 qui se trouvent sur la ligne
Quel est l’effectif de la valeur 3 du caractère X ?

de la valeur 3 du caractère X c’est-à-dire : 0 + 5 + 13 + 5 = 23.

On procède de la même manière pour trouver l’effectif des autres modalités du caractère X. Ainsi à
chaque valeur du caractère X, on a son effectif dans la dernière colonne. D’où le tableau linéaire

𝑥𝑖
associé à X :

𝑛𝑖
0 1 2 3 4 5
10 19 30 23 13 5

La série ainsi obtenue est appelée série marginale du caractère X.

L’effectif de la modalité 1 du caractère Y en additionnant les 𝑛𝑖𝑗 de la colonne où se trouve cette modalité.
En faisant de même avec les colonnes, on obtient :

Soit 6 + 4 + 1 + 0 + 0 + 0 = 11.
On obtient ainsi l’effectif de chaque modalité du caractère Y dans la dernière ligne du tableau.
D’où le tableau linéaire associé à Y :

𝑛𝑖
1 2 3 4
11 30 38 21

La série ainsi obtenue est appelée série marginale du caractère Y.


• Dressons le tableau des fréquences marginales du caractère X.
On rappelle que la fréquence est l’effectif de la modalité sur l’effectif total. On
obtient le tableau suivant :

2
Cours de Maths Tle A&B Complexe Scolaire ADICAR
M. Yvon SENEPOU (00236)72677263/7553257070063670 [email protected]
𝑥𝑖 0 1 2 3 4 5 Total

𝑓𝑖
0,1 1
0,1 0,19 0,30 0,23 3 0,

De la même manière, définis le tableau des fréquences marginales du caractère Y.

𝑦𝑖 1 2 3 4 Total
0,3 1
𝑓𝑖
0, 0,30 8 0,21

3. Nuage de points
Définition

On note 𝑥1 , 𝑥2 , 𝑥3 ,…, 𝑥𝑝 les valeurs du caractère X,


On considère deux caractères quantitatifs X et Y sur une même population de n individus.

𝑦1 , 𝑦2 , 𝑦3 ,…, 𝑦𝑞 les valeurs du caractère Y,

dans un repère orthogonal des points de couple de coordonnées (𝑥𝑖; 𝑦𝑗) d’effectifs non nuls.
On appelle nuage de points associé à la série statistique double de caractère (X, Y), la représentation

Exercice d’application
Le tableau suivant donne le nombre d’exploitations agricoles d’une région selon leur superficie en
hectares.
Superficie X 2 2 3 4 5 6 7 7,6
Nombre d’exploitations Y 14 26 31 29 44 40 54 50
Représente le nuage de points associé à cette série.

Solution

3
Cours de Maths Tle A&B Complexe Scolaire ADICAR
M. Yvon SENEPOU (00236)72677263/7553257070063670 [email protected]
Remarque

l’effectif 𝑛𝑖 de chaque couple (𝑥𝑖 ,𝑦𝑖) vaut 1.


Dans la suite, les séries doubles considérées seront comme la série de l’exemple précédent ; c’est-à-dire

4. Point moyen

On appelle point moyen d’un nuage de points 𝑀𝑖 de coordonnées (𝑥𝑖; 𝑦𝑖) le point G de coordonnées
Définition

(𝑥𝐺; 𝑦𝐺) telle que x G= X=


x 1+ x 2 + x n y 1+ y 2+ y n
; y G =Y =
n n
Exercice d’application
Déterminer les coordonnées du point moyen du nuage de points de la série statistique suivante :
Superficie X 2 2 3 4 5 6 7 7,6
Nombre d’exploitations Y 14 26 31 29 44 40 54 50

Solution
C’est le point de coordonnées ( X ; Y )
On a :
2+2+3+ 4 +5+6+7+ 7 , 6 36 ,6
X= = =4,575
8 8

14+ 26+31+29+ 44+ 40+54+50 288


Y= = =36
8 8
Donc G(4,575 ; 36).

II. Ajustement
1. Présentation

Soit un nuage de points associé à une série statistique double représenté dans un repère orthogonal. Faire
un ajustement de ce nuage de points, c’est trouver une courbe qui passe le plus près « possible » du
maximum de points de ce nuage.
Lorsque cette courbe est une droite, on dit que l’ajustement est affine ou linéaire.

Exemple d’ajustement par une droite.

2. Ajustement linéaire par la méthode de Mayer

4
Cours de Maths Tle A&B Complexe Scolaire ADICAR
M. Yvon SENEPOU (00236)72677263/7553257070063670 [email protected]
a. Droite d’ajustement

 On range la série statistique double (X; Y) suivant les valeurs croissantes des 𝑥𝑖.
Pour déterminer la droite d’ajustement linéaire d’un nuage de points, on peut procéder comme suit :

 Si le nombre de points du nuage de points est pair, on partage la série statistique en deux séries
statistiques de même effectif :
(𝑥1; 𝑦1), (𝑥2; 𝑦2), ⋯, (𝑥𝑝; 𝑦𝑝) et (𝑥𝑝+1; 𝑦𝑝+1), (𝑥𝑃+2; 𝑦𝑃+2), ⋯ , (𝑥𝑛; 𝑦𝑛), tel que p .
 Si le nombre n de points du nuage de points est impair, alors on partage le nuage de points en
n+1 n+1
deux sous-nuages d’effectif . et −1
2 2
On détermine le point moyen G1 du premier sous-nuage et le point moyen G2 du deuxième sous
nuage.
La droite (G1G2) est la droite d’ajustement par la méthode de Mayer.

Remarque :
 La droite (G1G2) passe par le point moyen G du nuage de points.

Exercice d’application
Partager la série statistique ci-dessous en deux séries et détermine le point moyen de chacune d’elles.
Superficie X 2 2 3 4 5 6 7 7,6
Nombre d’exploitations Y 14 26 31 29 44 40 54 50

Solution
Les valeurs du caractère X sont rangées dans l’ordre croissant.
L’effectif total de la série est 8.
On va partager la série en deux séries d’effectif 4 chacune.
Série 1
X 2 2 3 4
Y 14 26 31 29
Point moyen G1
2+2+3+ 4 14+ 26+31+26
G1 ( X 1 ; Y 1) avec X 1 = =2, 75 et Y 1= =25
4 4
Donc : G1 (2,75 ; 25)

𝑥𝑖
Série 2

𝑦
5 6 7 7,6
44 40 54 50
𝑖

Point moyen G2
5+6 +7+7 , 6 44 +40+ 54+50
G2 ( X 2 ;Y 2 ), avec X 1 = =et Y 1= =47
4 4
Donc : G2 (6,4 ; 47)

b. Equation
Soit 1 ( X 1 ; Y 1) et G2 ( X 2 ;Y 2 ), les points moyens des sous-nuages.
G

5
Cours de Maths Tle A&B Complexe Scolaire ADICAR
M. Yvon SENEPOU (00236)72677263/7553257070063670 [email protected]
On détermine une équation de la droite (G1G2) à l’aide d’un vecteur directeur ou du coefficient directeur
tellque (G1G2) : y=ax+ b
Y 2−Y 1 Y 1−Y 2
Avec a= ou a= et b=Y 1−a× X 1 oub=Y 2−a× X 2
X 2−X 1 X 1−X 2

Exercice d’application
On considère la série statistique précédente.
Déterminer une équation de la droite d’ajustement linéaire du nuage de points par la méthode de Mayer.
Tracer cette droite.

Solution
C’est la droite (G1G2) avec G1(2,75 ; 25) et G2(6,4 ; 47).
Elle a pour équation : ax +b
Y 2−Y 1 Y 1−Y 2
Avec a= ou a= et b=Y 1−a× X 1 oub=Y 2−a× X 2
X 2−X 1 X 1−X 2
47−25 440 440 615
D’où a= = =6 , 03 et b=25− ×2 , 75= =8 , 42
6 , 4−2 ,75 73 73 73
Donc (G1G2) : y=6 , 02 x +8 , 42

3. Ajustement linéaire par la méthode des moindres carrés

a. Covariance
Définition
On appelle covariance de la série statistique double de caractère (X ; Y), le nombre réel noté
Cov (X ; Y ) tel que :
Cov ( X ; Y ) = ∑ ( x i−X )( y i−Y ) ou Cov ( X ; Y ) = ∑ i i −X Y
1 x y
n n
Remarque :
On note aussi laCov ( X ; Y ) =σ XY

Exercice d’application
Calculer la covariance de la série statistique suivante sachant que G(4,575 ; 36).
Superficie X 2 2 3 4 5 6 7 7,6
Nombre d’exploitations Y 14 26 31 29 44 40 54 50

6
Cours de Maths Tle A&B Complexe Scolaire ADICAR
M. Yvon SENEPOU (00236)72677263/7553257070063670 [email protected]
Solution
La covariance de cette série statistique est telle que: Cov ( X ; Y ) =
∑ x i y i −X Y .
n
On a:
2 ×14 +2 ×26+3 × 31+ 4 × 29+5 ×44 +6 × 40+7 ×54 +7 , 6 ×50
Cov ( X ; Y ) = −4,575 ×36
8
1503
Cov ( X ; Y ) = −164 ,7
8
D’où
Cov ( X ; Y ) =23,675
.

b. Coefficient de corrélation linéaire


Définition
Soit V ( X) la variance de la série statistique de caractère X, V (Y ) la variance de la série statistique de
caractère Y et Cov(X ; Y) la covariance de la série statistique (X ; Y telle que V ( X )= ∑ i −X 2 et
2
x
n

V ( Y )=
∑ y i −Y 2
2

n
On appelle coefficient de corrélation linéaire de la série statistique double (X ; Y), le nombre réel noté
Cov( X ,Y )
tel que r= .
√V (X )√ V (Y )
Exercice d’application
Calculer le coefficient de corrélation linéaire de la série statistique suivante.
Superficie X 2 2 3 4 5 6 7 7,6
Nombre d’exploitations Y 14 26 31 29 44 40 54 50

Solution

Le coefficient de corrélation linéaire de cette série statistique est tel que:


On a:

Donc :

7
Cours de Maths Tle A&B Complexe Scolaire ADICAR
M. Yvon SENEPOU (00236)72677263/7553257070063670 [email protected]
Remarques
• Le coefficient de corrélation linéaire permet de voir la dépendance linéaire des deux caractères X
et Y.

≤ 𝑟 ≤ 1.
• Le coefficient de corrélation linéaire est un nombre réel de même signe que COV(X, Y) et on a : −1

• Si |r|est proche de 1, c’est-à-dire en pratique : 0,87≤ 𝑟 ≤ 1 ou −1 ≤ 𝑟 ≤ −0,87, alors on dit qu’il y a


une bonne corrélation linéaire ou une forte corrélation linéaire entre les deux caractères X et Y.

Exercice d’application
Interprèter le coefficient de corrélation linéaire de l’exercice de fixation précèdent.

On sait que : 𝑟 = 0,92.


Solution

Comme 0,87≤ 𝑟 ≤ 1, il y a une forte corrélation entre la superficie et le nombre d’exploitations agricoles
de cette région.

c. Droites de régressions

Propriété
Soit V(X) la variance de la série statistique de caractère X, V(Y) la variance de la série statistique de
caractère Y et Cov(X, Y) la covariance de X et Y.
On suppose qu’il y a une forte corrélation entre les caractères X et Y .

i. Droite de régression de Y en X.

La droite (D) d’équation : 𝑦 = 𝑎𝑥 + 𝑏 où et est appelée la droite de régression


de Y en X par la méthode des moindres carrés.
ii. Droite de régression de X en Y.

La droite (D’) d’équation : 𝑥 = 𝑎′𝑦 + 𝑏′ avec : est appelée la droite de


régression de X en Y par la méthode des moindres carrés.

Exercice d’application
On considère la série statistique suivante :
Superficie X 2 2 3 4 5 6 7 7,6

On sait que: Cov(X, Y) = 23,675, V(X)=4,6 ; V(Y)= 157,25 et 0,87≤ 𝑟 ≤ 1.


Nombre d’exploitations Y 14 26 31 29 44 40 54 50

1. Déterminer une équation de la droite d’ajustement linéaire de Y en X par la méthode des moindres
carré ; (On donnera les arrondis d’ordre 2 de et b.).

carrés. (On donnera les arrondis d’ordre 2 de 𝑎′et b’)


2. Déterminer une équation de la droite d’ajustement linéaire de X en Y par la méthode des moindres

Comme 0,87≤ 𝑟 ≤ 1, il y’a une bonne relation entre X et Y.


Solution

8
Cours de Maths Tle A&B Complexe Scolaire ADICAR
M. Yvon SENEPOU (00236)72677263/7553257070063670 [email protected]
1. Déterminons la droite d’ajustement linéaire de Y en X par la méthode des moindres carrés.

C’est la droite (D) d’équation : 𝑦 = 𝑎𝑥 + 𝑏 avec

Donc (D) : 𝑦 = 5,69𝑥 + 9,97


= 36 – 5,69 ×4,575 = 9,97

3. Déterminons la droite d’ajustement linéaire de X en Y par la méthode des moindres carrés.

C’est la droite (D’) d’équation : 𝑥 = 𝑎′𝑦 + 𝑏 avec

= 4,575 – 0,15 36 = –0,825


Donc : (D’) : = 0,15𝑦 −0,83

Remarques
 Les droites (D) et (D’) passent par le point moyen G du nuage de points.

• 𝑎𝑎′ = 𝑟2 et
 Si est le coefficient de corrélation linéaire on a :

• Si > 0 et 𝑎’ > 0, alors .

Si < 0 et 𝑎’ < 0, alors


Si 𝑟2 = 1, alors
• .
• et les deux droites sont confondues.

III. Estimation

connaissant 𝑥 (resp. connaissant 𝑦).


• La droite d’ajustement tracée du nuage de points permet graphiquement une estimation de

L’équation de la droite d’ajustement permet de calculer une estimation de connaissant 𝑥


(resp. connaissant 𝑦).

Exercice d’application
On considère la série statistique suivante :
Superficie X 2 2 3 4 5 6 7 7,6

Soit (D) : 𝑦 = 5,69𝑥 + 9,97, la droite de régression de y en x.


Nombre d’exploitations Y 14 26 31 29 44 40 54 50

En considérant que la tendance se poursuit ainsi, déterminer le nombre d’exploitations agricoles pour
une superficie de 9 h.

9
Cours de Maths Tle A&B Complexe Scolaire ADICAR
M. Yvon SENEPOU (00236)72677263/7553257070063670 [email protected]
Solution
Par la méthode de Mayer
Une superficie de 9 ha correspond à x=9
En utilisant l’équation de la droite de Mayer, on a : y=6× 9+8 , 4=62, 4.
Donc pour une superficie de 9 ha, le nombre d’exploitations est estimé à 63.

Par la méthode des moindres carrés


Avec l’équation de la droite de régression de y en obtenue par la méthode des moindres
carrés, on a : y=5 , 69 x +9 , 97,
y=5 , 69 × 9+9 , 97=61 ,8
Donc pour une superficie de 9 ha, le nombre d’exploitations agricoles est estimé à 62.

10
Cours de Maths Tle A&B Complexe Scolaire ADICAR
M. Yvon SENEPOU (00236)72677263/7553257070063670 [email protected]

Vous aimerez peut-être aussi