Corrigé TD2 : Analyse Statistique Bivariée

Ce document fournit des explications sur les techniques d'analyse statistique bivariée et corrige des exercices. Il présente comment utiliser des calculatrices pour calculer le barycentre, la covariance, les droites de régression et de Mayer à partir de données. Les réponses aux exercices appliquent ces méthodes et analysent la corrélation.

Transféré par

Dicko

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

162 vues5 pages

Corrigé TD2 : Analyse Statistique Bivariée

Transféré par

Dicko

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

L1 - SOCIOLOGIE 2018-2019- CORRIGÉ DU TD2

COMMENTAIRE : le but de ces notes est d’expliquer sur les exercices de la feuille TD2 les techniques de calcul de
l’analyse statistique en deux variables, en utilisant éventuellement les fonctions des calculatrices. Les résultats numériques
que nous donnons sont fournis à titre indicatif, et ne dispensent pas les étudiants de faire eux-mêmes leurs propres calculs.
D’ailleurs, nos résultats peuvent tout à fait contenir des erreurs.

Sur l’usage des calculatrices classiques pour les exercices de cette feuille de TD. On rappelle d’abord comment
utiliser les fonctions de listes des calculatrices CASIO et TI pour s’aider dans les exercices d’étude de corrélation de deux
variables.
a) On remplit en mode STATISTIQUES les listes L1 et L2 des valeurs respectives des variables X et Y , en ayant au
préalable vidé soigneusement L1 et L2 des résidus des exercices précédents !
b) On ordonne les deux listes par ordre croissant : plus précisément, on dit que la liste de base est L1 , et la deuxième
liste est L2 . Bien que ce ne soit pas indispensable pour le calcul du barycentre et des droites DY /X et DX/Y , ça l’est
pour le calcul de la droite de Mayer, et utile pour la représentation graphique du nuage de points. Il est donc bon
d’avoir le réflexe de le faire dès le début.
(a) CASIO : Menu STAT→SRT-A→Répondre 2 (pour deux listes)→Répondre 1 (pour dire que la liste de base à
ordonner est L1 )→Répondre 2 (pour la seconde liste L2 ).
(b) TI : STAT→EDIT→SortA(L1,L2).
c) Puis on procède à l’aide de la fonction CALC du menu STAT pour l’analyse en deux variables :
(a) CASIO : Menu STAT→CALC puis vérifier les settings : SET→2Var XList : List 1, 2Var YList : List2, 2Var
Freq : 1. Valider par EXE, puis 2Var en bas de l’écran avec les colonnes contenant L1 et L2 .
(b) TI : STAT→CALC→2-Var Stats (L1 ,L2 ).

Ces fonctions donnent la taille n de l’échantillon

P (le P nombre de points du nuage de points), les moyennes re-
n
spectives x̄ = m (X) et ȳ = m (Y ), la somme xy = i=1 Xi Yi (utile pour le calcul de la covariance C (X, Y ))
2 2
et les écarts-types σ (X) et σ (Y ) (qui permettent de connaître les variances V (X) = σ (X) et V (Y ) = σ (Y ) ).
Donc le centre de gravité est le point G = (x̄, ȳ) = (m (X) , m (Y )).
1P
De même, la covariance est C (X, Y ) = m (XY ) − m (X) m (Y ) = xy − x̄ · ȳ.
n
d) Pour le calcul des droites de régression DY /X et DX/Y , et du coefficient de corrélation linéaire r (X, Y ), on peut
procéder comme suit, d’abord pour la droite DY /X :
(a) CASIO : Menu STAT→CALC (avec les même settings)→REG→X
(b) TI : STAT→LinReg(ax + b) L1 ,L2 .
On trouve les coefficients a et b de l’équation Y = aX + b de la droite de régression DY /X , ainsi que le coefficient
de corrélation linéaire r (X, Y ). On rappelle que −1 ≤ r (X, Y ) ≤ 1, que la droite DY /X “monte” si r (X, Y ) > 0
et descend si r (X, Y ) < 0, et que la corrélation entre Y et X est proche d’être linéaire si r (X, Y ) est proche de 1
ou de −1.

Puis pour la droite DX/Y :

(c) CASIO : Dans la suite d’instructions précédentes, il suffit d’inverser les SETTINGS : SET→2Var XList : List 2,
2Var YList : List1, 2Var Freq : 1.
TI : STAT→LinReg(ax + b) L2 ,L1 (on inverse L1 et L2 ).
e) Une fois calculés les coefficients des différentes droites, on procède ainsi pour leur dessin.
(a) Tout d’abord, on se souvient qu’il suffit de connaître deux points pour tracer une droite.
(b) La droite de Mayer passe par les points G1 et G2 .
(c) La droite de régression DY /X passe par le barycentre G et par le point (0, b).

1

(d) La droite de régression DX/Y passe le barycentre G et par le point b̂, 0 .
(e) Si l’abscisse 0 ou l’ordonnée 0 sont loin du cadre du dessin, et donc inutilisables, on utilise une abscisse x0 ou une
ordonnée y0 raisonnables, dans le cadre du dessin, pour trouver un autre point l’aide de l’équation de la droite à
tracer :
pour la droite DY /X l’ordonnée correspondant à x0 est ax0 + b0 , et on a donc le point (x0 , ax0 + b0 ).
pour la droite DX/Y l’abscisse correspondant à y0 est ây0 + b̂0 , et on a donc le point ây0 + b̂0 , y0 .

La droite de régression de Mayer. Si la corrélation entre la variable X et la variable Y est de type linéaire, le
problème est de trouver l’équation d’une droite autour de laquelle se regroupe le nuage de points donné par X et Y . Nous
avons vu en cours comment trouver deux de ces droites possibles : les droites DY /X et DX/Y .
Il en existe une troisième : c’est la droite de régression de Mayer. Voici comment on la contruit. Après avoir rangé les
points du nuage par abscisses croissantes, on sépare le nuage en deux groupes d’effectifs égaux : le groupe des premiers
points et le groupe des dernier points (voir dans la correction de l’Exercice 4 ce qu’il faut faire si l’effectif du nuage de
points est impair). On note G1 = (x1 , y1 ) le barycentre du premier groupe de points, et G2 = (x2 , y2 ) le barycentre du
deuxième groupe de points. La droite de régression de Mayer est la droite passant par les points G1 et G2 .
Son équation est (voir formulaire) :
y2 − y1
Y = a (X − x1 ) + y1 , avec a = .
x2 − x1

RÉPONSES AUX EXERCICES.

Exercice 1.
0. Le barycentre est G = (m (X) , m (Y )) = (4.5, 23.375).

Figure 1: Exercice 1, Nuage de points et droites de régression

1. Pour déterminer l’équation de la droite de Mayer, on calcule déja le barycentre G1 = (x1 , y1 ) de la première moitié
de points (en l’occurrence les 4 premier points), puis le barycentre G2 = (x2 , y2 ) de la seconde moitié de points (en
l’occurrence les 4 derniers points). On trouve G1 = (2.5, 20.0) et G2 = (6.5, 26.75). On voit alors dans le formulaire
y2 − y1
l’équation Y = a (X − x1 ) + y1 avec a = de la droite de régression de Mayer, qui est la droite passant par les
x2 − x1
deux points G1 et G2 . On trouve :
Y = 1.6875(X − 2.5) + 20.0.
Cette droite se dessine en joignant simplement les points G1 et G2 .
Commentaire. Cette droite passe par le centre de gravité G du nuage de points.
Attention : le coefficient a qu’on calcule pour la droite de Mayer n’est pas le coefficient a qu’on calcule pour la droite
de régression DY /X !
Si on utilise la fonction CALC du menu STAT de la calculatrice pour le calcul des points G1 et G2 , il est recommandé
de traiter la question sur la droite de Mayer en dernier. Pour calculer G1 , on peut recopier dans un premier temps les

2
listes L1 et L2 dans les listes L3 et L4 , effacer la seconde moitié des points de ces deux listes, et calculer rapidement,
à l’aide de la fonction STAT - 2-VAR à laquelle on aura donné comme variables L3 et L4 , les moyennes x̄ et ȳ de
chacune des deux listes.
On procède de même pour calculer G2 en recopiant à nouveau L1 et L2 dans les listes L3 et L4 , puis en supprimant
cette fois la première moitié des points de ces deux listes.
1 P8 917
2. C (X, Y ) = m (XY ) − m (X) m (Y ) = xi yi − m (X) m (Y ) = − 4.5 × 23.375 = 9.437.
8 i=1 8
3. Calcul des droites DY /X et DX/Y .
C (X, Y ) 9.437
(a) Droite DY /X . a = = = 1.797. b = m (Y ) − a · m (X) = 23.375 − 1.797 × 4.5 = 15.288. L’équation
V (Y ) 2.2912
de DY /X est : Y = aX + b = 1.797X + 15.286.
C (X, Y ) 9.547
(b) Droite DX/Y . â = = = 0.540. b̂ = m (X) − â · m (Y ) = 4.5 − 0.540 × 23.375 = −8.117.
V (Y ) 4.1812
4. Chiffre d’affaire prévisible pour la 10ème année. On remplace simplement X par 10 dans les équations des droites.
Avec la droite de Mayer, on a : 1.6875(10 − 2.5) + 20.0 = 32.656.
Avec la droite DY /X , on a : 1.7976 × 10 + 15.285 = 33.26.
C (X, Y ) 9.437
5. Le coefficient de corrélation linéaire est : r (X, Y ) = = = 0.985. On voit qu’on a,
σ (X) · σ (Y ) 2.291 × 4.181
conformément à la figure, un coefficient positif (et donc une droite DY /X “montante”), très proche de 1 : on en conclut
qu’on peut considérer que la corrélation entre X et Y est forte, de type linéaire (ce qui correspond bien à la figure)

Exercice 2.

Figure 2: Exercice 2, Nuage de points et droites de régression

0. G = (m (X) , m (Y )) = (2004.5, 287.0).

1. G1 = (2002.0, 141.2) et G2 = (2007.0, 432.8), donc l’équation de la droite de Mayer est Y = 58.32(X − 2002.0) + 141.2.
5757621
2. C (X, Y ) = m (XY ) − m (X) m (Y ) = − 2004.5 × 287.0 = 470.6.
10
5
3. DY /X : Y = 57.042X − 1.1405 × 10 ; DX/Y : X = 0.0173Y + 1999.5
4. Prévision pour X = 2011
(a) avec Mayer : 58.32 × (2011 − 2002.0) + 141.2 = 666.07.
(b) avec DY /X : 57.42 × 2011 − 1.1405 × 105 = 1421.6
C (X, Y )
5. r (X, Y ) = = 0.99492. A nouveau, le coefficient est positif (droite “montante”) et très proche de 1 :
σ (X) σ (Y )
corrélation forte entre X et Y , de type linéaire.

Exercice 3.

3
Figure 3: Exercice 3, Nuage de points et droites de régression

0) G (X, Y ) = (119.55, 24.0).

1) Pas très intéressant.
25431
2) C (X, Y ) = m (XY ) − m (X) m (Y ) = − 119.55 × 24.0 = −43.666.
9
3) DY /X : Y = −0.0837X + 34.009, et DX/Y : −8.9318Y + 333.91.
4) Avec X = 125 et DY /X , on a : −0.083719 × 125 + 34.009 = 23.544.
C (X, Y )
5) r (X, Y ) = = −0.86473. Négatif, donc droite “descendante”, et moins proche de −1 que les exercices
σ (X) σ (Y )
précédents : nous dirons donc corrélation relativement forte entre X et Y , de type linéaire. On voit d’ailleurs bien sur
la figure que, alors que les droites de régressions étaient presque confondues dans les exercices précédents, elles sont
plus espacées dans cet exercice.

Exercice 4. Deux remarques sur cet exercice.

a) Typiquement, il ne faut pas oublier de ranger la liste des pourcentages de population agricoles (qui ne sont pas
données par ordre croissant dans l’énoncé), et donc ordonner de façon cohérente la liste des calories/jour.
b) Ici, il y a un nombre impair de points dans le nuage de points. Comment donc séparer les points en deux moitiés ?
L’usage est de regarder, sur le nuage de points, comment le point central est positionné par rapport aux deux moitiés
restantes. Il est en général plus proche d’une des moitiés que de l’autre. On considère donc qu’il “fait partie” de cette
moitié là, et qu’on a ainsi “une moitié plus grosse que l’autre”.

Figure 4: Exercice 4, Nuage de points et droites de régression

4
0. G (X, Y ) = (m (X) , m (Y )) = (29.154, 2845.7).
1. Pas très intéressant.
2. L’effectif est de n = 11 points, c’est à dire qu’il y a un nombre impair de points. Or l’examen du nuage de points, ou
de la liste des points après rangement, montre que le point central de la liste de points, qui est le 6ème après range-
ment, de coordonnées (24.7, 2687), est beaucoup plus proche du point suivant (26.2, 2643) que du point précédent
(14.8, 3394). C’est très net sur la figure, sur laquelle on voit bien les deux points très proches au milieu. On sépare
donc en deux groupes de points : le premier groupe contient uniquement les 5 premiers points, et le second groupe
contient également le point central, contient donc les 6 derniers points.
Le barycentre des 5 premiers points est G1 = (9.516, 3246.1), et le barycentre des 6 derniers points est G2 =
(52.72, 2365.2). La droite de Mayer a donc pour équation :

Y = −20.391 × (X − 9.516) + 3246.1.

7.9342 × 105
3. C (X, Y ) = m (XY ) − m (X) m (Y ) = − 29.154 × 2845.7 = −1.0836 × 104 = −10836.
11
4. DY /X : Y = −17.163X + 3346.1
C (X, Y ) 1.0836 × 104
5. r (X, Y ) = =− = −0.8361. Ce cofficient est négatif, pas trop éloigné de −1, on a donc
σ (X) σ (Y ) 25.127 × 515.81
une corrélation relativement linéaire entre X et Y qui correspond à une droite décroissante. Ce résultat intéressant
indique donc que, de façon statistique, plus la proportion de population agricole dans un pays est grande, moins ses
habitants consomment de calories par jour !

Vous aimerez peut-être aussi

Corrélation et Régression en Biostatistique
Pas encore d'évaluation
Corrélation et Régression en Biostatistique
9 pages
Ajust 01
Pas encore d'évaluation
Ajust 01
9 pages
Statistique À Double Variables
100% (1)
Statistique À Double Variables
2 pages
Série Statistique Double 3a BT Comptabilité Transit Transport
Pas encore d'évaluation
Série Statistique Double 3a BT Comptabilité Transit Transport
5 pages
Corrélation et ajustement linéaire en statistiques
Pas encore d'évaluation
Corrélation et ajustement linéaire en statistiques
7 pages
Statistiques : Corrélation et Régression
Pas encore d'évaluation
Statistiques : Corrélation et Régression
3 pages
Stats 2 Vtrous
100% (1)
Stats 2 Vtrous
8 pages
Statistiques à Deux Variables : Ajustements
Pas encore d'évaluation
Statistiques à Deux Variables : Ajustements
8 pages
Statistiques à Deux Variables : Ajustements
Pas encore d'évaluation
Statistiques à Deux Variables : Ajustements
8 pages
Statistiques : Moyennes et Ajustements
Pas encore d'évaluation
Statistiques : Moyennes et Ajustements
21 pages
Statistique Double Bazile
Pas encore d'évaluation
Statistique Double Bazile
7 pages
Statistiques à Deux Variables : Analyse et Ajustement
Pas encore d'évaluation
Statistiques à Deux Variables : Analyse et Ajustement
5 pages
chapitreIII 2024
Pas encore d'évaluation
chapitreIII 2024
44 pages
TD Maths 11 Statistiques D200430
Pas encore d'évaluation
TD Maths 11 Statistiques D200430
13 pages
Statistiques Bivariées Sol
Pas encore d'évaluation
Statistiques Bivariées Sol
18 pages
Statistiques à Deux Variables : Cours et Outils
Pas encore d'évaluation
Statistiques à Deux Variables : Cours et Outils
75 pages
Ajustement Statistique à Deux Variables
Pas encore d'évaluation
Ajustement Statistique à Deux Variables
6 pages
V B Statistique
Pas encore d'évaluation
V B Statistique
26 pages
Ajustement Linéaire par Moindres Carrés
Pas encore d'évaluation
Ajustement Linéaire par Moindres Carrés
5 pages
Régression et Corrélation Statistique
Pas encore d'évaluation
Régression et Corrélation Statistique
4 pages
Statistiques à Deux Variables : Régression
Pas encore d'évaluation
Statistiques à Deux Variables : Régression
1 page
Probastat 2
Pas encore d'évaluation
Probastat 2
6 pages
Statistiques à Deux Caractères en Maths
Pas encore d'évaluation
Statistiques à Deux Caractères en Maths
6 pages
Travaux Dirigés de Statistiques 2024-2025
Pas encore d'évaluation
Travaux Dirigés de Statistiques 2024-2025
3 pages
Corrigé TD2 VF
Pas encore d'évaluation
Corrigé TD2 VF
8 pages
Statistiques à Deux Variables : Concepts et Méthodes
Pas encore d'évaluation
Statistiques à Deux Variables : Concepts et Méthodes
20 pages
Analyse bivariée et régression linéaire
Pas encore d'évaluation
Analyse bivariée et régression linéaire
7 pages
Corrigé TD 2 Régression
Pas encore d'évaluation
Corrigé TD 2 Régression
11 pages
Ajustement Lineaire - Correction Exo
Pas encore d'évaluation
Ajustement Lineaire - Correction Exo
10 pages
Régression Linéaire: Concepts et Calculs
Pas encore d'évaluation
Régression Linéaire: Concepts et Calculs
16 pages
Régression et Corrélation Linéaire
Pas encore d'évaluation
Régression et Corrélation Linéaire
8 pages
Série statistique double et nuage de points
Pas encore d'évaluation
Série statistique double et nuage de points
12 pages
Word 5
Pas encore d'évaluation
Word 5
10 pages
Régression Linéaire et Moindres Carrés
Pas encore d'évaluation
Régression Linéaire et Moindres Carrés
53 pages
Modèle de régression linéaire simple
100% (1)
Modèle de régression linéaire simple
69 pages
Laffly Regression Multiple
Pas encore d'évaluation
Laffly Regression Multiple
33 pages
Méthodes de Prévision en Statistique
Pas encore d'évaluation
Méthodes de Prévision en Statistique
29 pages
Statistiques et Corrélation en Terminale
Pas encore d'évaluation
Statistiques et Corrélation en Terminale
14 pages
Chapitre 2 Partie 2
Pas encore d'évaluation
Chapitre 2 Partie 2
8 pages
Analyse des séries statistiques doubles
Pas encore d'évaluation
Analyse des séries statistiques doubles
3 pages
Cours 2 PDF
Pas encore d'évaluation
Cours 2 PDF
10 pages
Corrélation et Prédiction Pluviométrique
Pas encore d'évaluation
Corrélation et Prédiction Pluviométrique
7 pages
Cours Statistique 4ème Éco Sabria
Pas encore d'évaluation
Cours Statistique 4ème Éco Sabria
9 pages
Cours Statistiques 4ème Economie Et Gestion MR Maatallah Kamel
Pas encore d'évaluation
Cours Statistiques 4ème Economie Et Gestion MR Maatallah Kamel
9 pages
STAT
Pas encore d'évaluation
STAT
4 pages
Ajustement Statistique : Régression Linéaire et Puissance
Pas encore d'évaluation
Ajustement Statistique : Régression Linéaire et Puissance
7 pages
TP Régression Linéaire
Pas encore d'évaluation
TP Régression Linéaire
20 pages
Econometrie S6 ALCenter
Pas encore d'évaluation
Econometrie S6 ALCenter
78 pages
Exercice Proba
100% (1)
Exercice Proba
4 pages
Statistiques Double
Pas encore d'évaluation
Statistiques Double
11 pages
Chap 3 Statistique
Pas encore d'évaluation
Chap 3 Statistique
3 pages
Statistiques à Deux Variables Linéaires
Pas encore d'évaluation
Statistiques à Deux Variables Linéaires
7 pages
Corr - TD2 Analyse Des Donnés
Pas encore d'évaluation
Corr - TD2 Analyse Des Donnés
10 pages
T.P. 9 Covariance - Corrélation - Régression: Y Y X X N Cov
Pas encore d'évaluation
T.P. 9 Covariance - Corrélation - Régression: Y Y X X N Cov
8 pages
STAT Ok
Pas encore d'évaluation
STAT Ok
7 pages
Statistiques: Nuages de Points et Ajustements
Pas encore d'évaluation
Statistiques: Nuages de Points et Ajustements
7 pages
td1 Iag Correction1
100% (4)
td1 Iag Correction1
8 pages
Statistiques uni-variées et bivariées
Pas encore d'évaluation
Statistiques uni-variées et bivariées
5 pages