0% ont trouvé ce document utile (0 vote)
70 vues9 pages

Ajust 01

Le document traite des statistiques à deux variables, en se concentrant sur l'ajustement des données à l'aide de différentes méthodes, telles que la méthode de Mayer et les moindres carrés. Il présente également des exemples pratiques, y compris l'évolution du nombre d'adhérents d'un club de rugby, et discute de l'importance du coefficient de corrélation linéaire pour évaluer la qualité des ajustements. Enfin, il conclut que l'ajustement exponentiel est le plus pertinent pour prédire les adhésions futures.

Transféré par

Farid Leguebedj
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
70 vues9 pages

Ajust 01

Le document traite des statistiques à deux variables, en se concentrant sur l'ajustement des données à l'aide de différentes méthodes, telles que la méthode de Mayer et les moindres carrés. Il présente également des exemples pratiques, y compris l'évolution du nombre d'adhérents d'un club de rugby, et discute de l'importance du coefficient de corrélation linéaire pour évaluer la qualité des ajustements. Enfin, il conclut que l'ajustement exponentiel est le plus pertinent pour prédire les adhésions futures.

Transféré par

Farid Leguebedj
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

1èreBT S DOMOT IQUE STATisTiquEs À DEux vAriABLEs 2008-2010

Statistiques à deux variables

Table des matières


I Position du problème. Vocabulaire 2
I.1 Nuage de points..................................................................................................................................... 2
I.2 Le problème de l’ajustement................................................................................................................. 3
I.3 Point moyen........................................................................................................................................... 3

II Ajustements 4
II.1 Ajustement à la règle.....................................................................................................................4
II.2 Méthode de Mayer................................................................................................................................. 4
II.3 Méthode des moindres carrés................................................................................................................ 4
II.4 Ajustement exponentiel......................................................................................................................... 6
II.5 Comparaison.......................................................................................................................................... 7

IIICoefficient de corrélation linéaire 8

http:// -
1èreBT S DOMOT IQUE STATisTiquEs À DEux vAriABLEs 2008-2010

Le problème qui se pose dans les séries statistiques à deux variables est principalement celui du lien qui
existe ou non entre chacune des variables.

Le texte en bleu concerne les calculatrices (TI et Casio)

I Position du problème. Vocabulaire

Par soucis de clarté, ce cours est élaboré à partir de l’exemple suivant :


Exemple
Le tableau suivant donne l’évolution du nombre d’adhérents d’un club de rugby de 2001 à 2006.

Année 2001 2002 2003 2004 2005 2006


Rang xi 1 2 3 4 5 6
Nombre 70 90 115 140 170 220
d’adhérents yi

Le but est d’étudier cette série statistique à deux variables (le rang et le nombre d’adhérents) afin
de prévoir l’évolution du nombre d’adhérents pour les années suivantes.

I.1 Nuage de points

La première étape consiste à réaliser un graphique qui traduise les deux séries statistiques ci-dessus.

Définition 1
Soit X et Y deux variables statistiques numériques observées sur n individus.
−→ −→
Dans un repère orthogonal (O; i ; j ), l’ensemble des n points de coordonnées (xi, yi) forme le
nuage de points associé à cette série statistique.

Dans notre exemple, si on place le rang en abscisses, et le nombre d’adhérents en ordonnées, on peut
représenter par un point chaque valeur. On obtient ainsi une succession de points, dont les coordonnées
sont (1; 70), (2; 90), ... (6; 220), forment un nuage de points.

Question 1
Dans le plan muni d’un repère orthogonal d’unités graphiques : 2 cm pour une année sur l’axe des
abscisses et 1 cm pour
20 adhérents sur l’axe des ordonnées, représenter le nuage de points associé à la série (xi; yi).

T.I. Casio
 Touche STA  Menu STA
 Menu EDI  Entrer les valeurs xi dans List1
 Entrer les valeurs xi dans L1
 Entrer les valeurs yi dans List2
 Entrer les valeurs yi dans L2
 Choisir GRP
 Règler les valeurs du repère avec la touche
WINDOW  Règler les paramètres avec SE
 Appuyer sur la touche TRAC  Choisir GPH

http:// -
1èreBT S DOMOT IQUE STATisTiquEs À DEux vAriABLEs 2008-2010

Nombre d’adhérents

+
260 Cf D2

240
D1
220

200
G2
180 
b

160

140 G

120

100 G1
b

80

60

40
+

20

0
0 1 2 3 4 5 6 7 8 Rang

I.2 Le problème de l’ajustement

Le nuage de points associé à une série statistique à deux variables donne donc immédiatement des informa-
tions de nature qualitatives.
Pour en tirer des informations plus quantitatives, il nous faut poser le problème de l’ajustement.

Le tracé met en évidence la possibilité de "reconnaître" graphiquement la possibilité d’une relation fonction-
nelle entre les deux grandeurs observées (ici rang et nombre d’adhérent).
Le problème de l’établissement d’une relation fonctionnelle entre les deux séries est le p roblème de
l’ajustement.

I.3 Point moyen

Définition 2
Soit une série statistique à deux variables, X et Y , dont les valeurs sont des couples (xi; yi). On app

x1 + x2 + · · · + xn
➤x G =. n
y1 + y2 + · · · + yn
➤y G =. n

http:// -
1èreBT S DOMOT IQUE STATisTiquEs À DEux vAriABLEs 2008-2010

Question 2
Déterminer les coordonnées des points moyens suivants :
 G1 des années allant de 2001 à 2003,
 G2 des années allant de 2004 à 2006,
 G, point moyen du nuage de points tout entier.

. 1+2+3
xG 1 = 3 = 2
Calcul des coordonnées de G1 : 70+90+115 donc, G1( 2 ; 91, .
yG1 = 3 = 91, 7
.
4+5+6
xG 2 = 3 = 5
Calcul des coordonnées de G2 : yG2 140+170+220 donc, G2( 5 ; 176, .
= 3 = 176, 7
.
xG 1+2+3+4+5+6
= 3,
Calcul des coordonnées de G : = 6 donc, .
5 G( 3, 5 ; 134,
yG = 70+90+115+140+170+220 = 134, 2
3

II Ajustements

II.1 Ajustement à la règle

On se propose, à partir des résultats obtenus, de faire des prévisions pour les années à venir.
Un poyen d’y parvenir est de tracer au juger une droite D passant le plus près possible des points du
nuage et d’en trouver l’équation du type y = ax + b.

II.2 Méthode de Mayer

Cet ajustement consiste à déterminer la droite passant par deux points moyens du nuage de point.
Question 3
Déterminer l’équation de la droite D1 qui passe par les points moyens G1 et G2 et la tracer sur le
graphique précédent.

La droite D1 n’est pas parallèle à l’axe des ordonnées, elle a donc pour équation y = ax + b avec :
yG − yG1 7−91,7
a= 2 = 176,5−2 = 28, 3.
xG2 − xG2
De plus, elle passe par le point G1( 2 ; 91, 7 ) d’où :
yG1 = axG1 + b ⇒ 91, 7 = 28, 3 × 2 + b ⇒ b = 35, 1.
Conclusion : .
D1 : y = 28, 3x +
Pour tracer D1, il suffit de placer G1 et G2 puis de tracer la droite qui les relie.

II.3 Méthode des moindres carrés

Il s’agit d’obtenir une droite équidistante des points situés de part et d’autre d’elle-même.
Pour réaliser ceci, on cherche à minimiser la somme des distances des points à la droite au carré.

On considère une série statistique à deux variables représentée par un nuage justifiant un ajustement affine.

http:// -
1èreBT S DOMOT IQUE STATisTiquEs À DEux vAriABLEs 2008-2010

Définition 3
Dans le plan muni d’un repère orthonormal, on considère un nuage de n points de coordonnées (x

Σn Σn
(MiQi)2 =[yi − (axi + b)]2
i=1 i=1

Mi D
yi b

axi + b
Qi

xi

Remarque 1
[xi − (ayi + b)]2.
Σn
Il serait tout aussi judicieux de s’intéresser à la droite D′ qui minimise la quantité
i=1
Cette droite est appelée droite de régression de x en y.

Définition 4
On appelle covariance de la série statistique double de variables x et y le nombre réel

1 Σn
cov(x, y) = σxy = n(xi − x¯)(yi − y¯).
i=1

Pour les calculs, on pourra aussi utiliser :

1Σn xi yi − x¯y¯.
σxy =
Remarque 2 ni=1
On a : cov(x, x) = σx2 = V (x) = [σ(x)]2.

Propriété 1
La droite de régression D de y en x a pour équation y = ax + b où

σxy
a= [σ(x)]2
b vérifie y¯ = ax¯ + b.

http:// -
1èreBT S DOMOT IQUE STATisTiquEs À DEux vAriABLEs 2008-2010

Remarque 3
Les réels a et b sont donnés par la calculatrice.

T.I. Casio
 Touche STA  Menu STA
 Menu CAL  Item CAL
 Item  Règler les paramètres avec s
LinRe
 LinReg L1, L2  Item RE
 Choisir X

Propriété 2
Le point moyen G du nuage appartient toujours à la droite de régression de y en x.

Question 4
Déterminer une équation de la droite d’ajustement D2 de y en x obtenue par la méthode des
moindres carrés et la tracer sur le graphique précédent.

La calculatrice donne D2 : y = ax + b avec a = 29 et b = 32, 7.


Conclusion :
D2 : y = 29x +
Pour tracer la droite D2, il faut choisir deux points (au moins) sur cette droite.
x 08
Par exemple : , les placer dans le repère puis tracer la droite.
y 32, 7264, 7

II.4 Ajustement exponentiel

On remarque qu’un ajustement affine ne semble pas très approprié pour ce nuage de points à partir de
2006, on se propose de déterminer un ajustement plus juste.
Question 5
On pose z = ln y. Recopier et compléter le tableau suivant en arrondissant les valeurs de zi au millième.

xi 1 2 3 4 5 6
zi 4, 248

Il suffit de calculer ln yi pour chaque caleur de i :

xi 1 2 3 4 5 6
zi 4, 248 4, 500 4, 745 4, 942 5, 136 5, 394

On peut déterminer les éléments de ce tableau grâce à la calculatrice :

http:// -
1èreBT S DOMOT IQUE STATisTiquEs À DEux vAriABLEs 2008-2010

T.I.
Casio
 Touche STA  Touche STA
 Menu EDI  Menu EDI
 Se placer dans L3
 Se placer dans List
 Entrer la formule "= ln L2"
 Entrer la formule "= ln List2"

Question 6
Déterminer une équation de la droite d’ajustement D3 de z en x obtenue par la méthode des moindres
carrés.

La manipulation à la calculatrice est la même que précédemment, en oubliant pas de changer les
paramètres. La calculatrice donne D3 : z = ax + b avec a = 0, 224 et b = 4, 045.
Conclusion : .
D3 : z = 0, 224x + 4,
Question 7
Dans ce cas, en déduire la relation qui lie y à x puis tracer la courbe représentative de la fonction y
= f (x).

.
On a z = 0, 224x + 4,
045 donc : ln y = 0, 224x + 4, 045
z = ln y

On compose par la fonction exponentielle : eln y = e0,224x+4,045


= (e0,224)x × e4,045
= (1,251)x × 57, 111

Conclusion : .
y = 57, 111 × 1,
Pour tracer la courbe, il suffit de placer des points, par exemple grâce au tableau de valeurs de la calculatrice.

II.5 Comparaison

Grâce aux trois derniers ajustements, on peut évaluer ce qui se passera plus tard, comparons les :
Question 8
En supposant que les ajustements restent valables pour les années suivantes, donner une estimation du
nombre d’adhérents en 2007 suivant les trois méthodes.

Dans tous les cas, il faut calculer y lorsque x correspond à l’année 2007, c’est à dire au rang 7.
• Méthode de Mayer : y = 28, 3 × 7 + 35, 1 = 233, 2 soit environ .
233
• Ajustement affine : y = 29 × 7 + 32, 7 = 235, 7 soit environ 236 adhérents .
• Ajustement exponentiel : y = 57, 112 × 1, 0247 = 273, 9 soit 274 adhérents .
environ

Question 9
En 2007, il y a eu 280 adhérents. Lequel des trois ajustements semble le plus pertinent ?

http:// -
1èreBT S DOMOT IQUE STATisTiquEs À DEux vAriABLEs 2008-2010

Le troisième ajustement semble le plus pertinent puisqu’il se rapporche le plus de la réalité.

http:// -
1èreBT S DOMOT IQUE STATisTiquEs À DEux vAriABLEs 2008-2010

III Coefficient de corrélation linéaire

Définition 5
Le coefficient de corrélation linéaire d’une série statistique de variables x et y est le nombre r défin
σxy
r = σ(x) × σ(y) .

Ce coefficient sert à mesurer la qualité d’un ajustement affine.

Interprétation graphique :
Plus le coefficient de régression linéaire est proche de 1 en valeur absolue, meilleur est l’ajustement linéaire.
Lorque r = ±1, la droite de régression passe par tous les points du nuage, qui sont donc alignés.
Question 10
Déterminer le coefficient de corrélation linéaire dans le cas de l’ajustement affine (entre x et y), puis
exponentiel (entre x
et z). Quel est l’ajustemet le plus juste ?

Grâce à la calculatrice, on trouve successivement r2 = 0, 987 puis r3 = 0, 999.


Ce qui est conforme à ce que nous avions déduit précédemment, à savoir que l’ajustement exponentiel est
plus fiable pour ce cas.

Propriété 3
Le coefficient de corrélation linéaire r vérifie −1 ≤ r ≤ 1.

http:// -

Vous aimerez peut-être aussi