CAP3
CAP3
Capítulo 3
Cuando la relación funcional que liga las variables X e Y es una recta entonces la
regresión y correlación reciben el nombre de Regresión Lineal y Correlación Lineal.
Una medida de la Correlación Lineal la da el Coeficiente de Correlación Lineal de
Pearson.
87
siendo bxi + a la ordenada teórica o estimada por la recta que se denota por
ybi . De esta forma la expresión anterior se transforma en
XX
S(a, b) = fij (yj − ybi )2
i j
eij = yj − ybj
Entonces
σ xy σ xy
2
b=y a = y − bx = y − 2 x
σx σx
Por tanto, la Recta de Regresión Y sobre X tiene la siguiente ecuación:
σ xy
y − y = 2 (x − x) .
σx
σ xy
x−x= (y − y)
σ 2y
Que, como hemos dicho anteriormente, una de sus aplicaciones es predecir el valor
de X conocido el valor de Y.
σ xy
bxy =
σ 2y
Sabemos que el signo del valor de la covarianza nos indica el sentido de la relación entre
las variables y recíprocamente. Pero el valor de la covarianza depende de las unidades en
que vengan expresadas las variables. Así pues, es necesario definir un coeficiente que mida
el grado de variación conjunta entre las variables y no esté afectado por las unidades de
medida. Una forma de obtener esta medida es dividir la covarianza por el producto de las
desviaciones típicas de cada variable, dando como resultado un coeficiente adimensional
que denotamos por r y recibe el nombre de Coeficiente de Correlación Lineal de
Pearson.
3.2 Coeficiente de correlación lineal de Pearson 91
Propiedades
Si |r| está próximo a 1 se dice que existe una relación lineal muy fuerte entre las
variables
indican que pasan por el punto (x, y), por tanto sólo pueden presentar dos posiciones en
el plano:
ii) Coincidan: Dichas rectas coinciden cuando, además de tener el punto (x, y) en común,
σ xy σ 2y
tienen la misma pendiente. Es decir, las pendientes ms = 2 y m0s = de las
σx σ xy
rectas de regresión son iguales
σ xy σ 2y σ 2xy
= ⇔ 2 2 = 1 ⇔ r2 = 1
σ 2x σ xy σxσy
Por lo tanto
X\Y 1 2 3 4
10 1 3 0 0
12 0 1 4 3
14 2 0 0 2
16 4 0 0 0
Se pide:
a) ¿Son independientes X e Y ?
Respuesta:
P
xi \yj 1 2 3 4 ni. xi ni. x2i ni. j xi yj nij
10 1 3 0 0 4 40 400 10 + 60 + 0 + 0 = 70
12 0 1 4 3 8 96 1152 0 + 24 + 144 + 144 = 312
14 2 0 0 2 4 56 784 28 + 0 + 0 + 112 = 140
16 4 0 0 0 4 64 1024 64 + 0 + 0 + 0 = 64
n.j 7 4 4 5 20 256 3360 586
yj n.j 7 8 12 20 47
yj2 n.j 7 16 36 80 139
b)
256 47
x= = 12,8; y = = 2,35
20 20
3360
σ 2x = − (12,8)2 = 4,16 ⇒ σ x = 2,039
20
139
σ 2y = − (2,35)2 = 1,43 = σ 2y ⇒ σ y = 1,195
20
586
σ xy = − (12,8) × (2,35) = −0,78
20
Recta de regresión de Y /X
¾
σ xy −0,78
y − y = 2 (x − x) ⇒ y − 2,35 = (x − 12,8)
σx 4,16
c)
σ xy −0,78
r= = = −0,320.
σxσy 2,039 × 1,195
La correlación es negativa, las variables están relacionadas en sentido opuesto (si una
variable aumenta de valor la otra variable disminuye). El coeficiente de correlación
es demasiado pequeño, por tanto no se ha realizado un buen ajuste por medio de
una recta de mínimos cuadrados.
donde
XX
∗) fij (yj − y)2 es la Varianza Marginal de Y que se denota por V (y) o σ 2y
j
i
XX
∗) fij (yj − ybi )2 es la Varianza Residual de Y, Vr (y), también llamada Va-
j
i
rianza no Explicada, y representa las desviaciones que no se han podido explicar
mediante la regresión
XX
∗) yi − y)2 es la Varianza Explicada por la regresión que se denota por
fij (b
j
i
Ve (y)
1
La descomposición (3.2) sólo es válida cuando se realiza en funciones que son lineales en los parámetros
(recta, parábola, hipérbola equilátera,· · · )
3.3 Coeficiente de determinación y varianza residual 95
Vr (y)
Si R2 = 0 ⇒ = 1 ⇒ Vr (y) = V (y) ⇒ Ve (y) = 0 ⇒ El modelo no explica
V (y)
nada de Y a partir de X, por tanto es el peor ajuste que puede hacerse por el
procedimiento de mínimos cuadrados.
Vr (y)
Si R2 = 1 ⇒ = 0 ⇒ Vr (y) = 0 ⇒ Todos los residuos son nulos, todos los
V (y)
puntos de la nube de puntos están sobre la curva, en este caso el ajuste es perfecto.
Y depende funcionalmente de X.
½
2 Si R2 se aproxima a 1 nos indicará buen ajuste
Si 0 < R < 1 ⇒
Si R2 se aproxima a 0 nos indicará mal ajuste
1) En la recta de regresión de Y /X, la Varianza Residual se denota por Vr (y) y
se comprueba que
Vr (y) = V (y)(1 − r2 )
Vr (y) V (y)(1 − r2 )
R2 = 1 − =1− = r2
V (y) V (y)
Vr (x) V (x)(1 − r2 )
R2 = 1 − =1− = r2
V (x) V (x)
96 Regresión Mínimo Cuadrática
N o de orden 1o 2o 3o 4o 5o 6o 7o 8o 9o 10 o
Xi 9 7 3 6 7 5 10 8 2 5
Yi 8 5 4 2 9 6 10 9 1 5
Respuesta:
xi yi x2i xi yi yi2
9 8 81 72 64 62 59
x= = 6,2; y = = 5,9
7 5 49 35 25 10 10
3 4 9 12 16 µ ¶2
442 62
6 2 36 12 4 σ 2x = − = 5,76
10 10
7 9 49 63 81
5 6 25 30 36 µ ¶2
433 59
10 10 100 100 100 σ 2y = − = 8,49
10 10
8 9 64 72 81
2 1 4 2 1 µ ¶ µ ¶
423 62 59
5 5 25 25 25 σ xy = − × = 5,72
10 10 10
62 59 442 423 433
3.3 Coeficiente de determinación y varianza residual 97
y = −0,238 + 0,99x
c) Coeficiente de determinación
σ 2xy (5,72)2
R2 = = = 0,669
σ 2x σ 2y 5,76 × 8,49
f)
Figura 3.2
2) Si r = ±1 ⇒ r2 = 1 ⇒ Vr (y) = 0 ⇒ Todos los residuos son ceros y por tanto todos los
puntos de la nube de puntos están sobre la recta de regresión (los valores observados
coinciden con los valores teóricos) ⇒ Las dos rectas de regresión coinciden. En este
caso se dice que la correlación es perfecta.
3c) 0 < r < 1 ⇒ La correlación es positiva (valores altos (bajos) de una variable
le corresponden valores altos (bajos) de la otra variable)
3d) −1 < r < 0 ⇒ La correlación es negativa (valores altos (bajos) de una
variable le corresponden valores bajos (altos) de la otra variable)
(0 ≤ r2 ≤ 1)
∗) r : Se utiliza para medir el grado de asociación lineal entre las dos variables
3.4.1. Parábola
Suponemos que la curva que mejor se ajusta a la nube de puntos es de tipo parabólico, de
ecuación
y = a + bx + cx2 ; a, b, c ∈ R
El criterio de Mínimos Cuadrados considera que la función que mejor se ajusta a los
datos es aquella función que minimiza la media de los cuadrados de los residuos. (Hacemos
el desarrollo para el caso en que las frecuencias absolutas son unitarias)
X X¡ ¢2
S(a, b) = e2ij = yj − (a + bxi + cx2i )
i,j i,j
xi 2 3 5 6 9 11
yi 7 5 9 11 8 10
o
Ajustar a dichos puntos una parábola de 2 grado: y = a + bx + cx2 .
Respuesta:
Realizamos el siguiente cambio de variable: x0i = xi − x = xi − 6
Por lo tanto, se tiene que ajustar la siguiente parábola: y = a + bx0 + cx02
xi yi x0i x02
i x03
i x04
i x0i yi x02
i yi
2 7 -4 16 -64 256 -28 112
3 5 -3 9 -27 81 -15 45
5 9 -1 1 -1 1 -9 9
6 11 0 0 0 0 0 0
9 8 3 9 27 81 24 72
11 10 5 25 125 625 50 250
36 50 0 60 60 1044 22 488
⎧ 25 − 30c ⎫
⎫ ⎫ ⎪ ⎪
50 = 6a + 0b + 60c ⎬ 25 = 3a + 30c ⎬ ⎨ a=
⎪
3
⎪
⎬
22 = 0a + 60b + 60c ⇒ 11 = 30b + 30c ⇒
⎭ ⎭ ⎪
⎪ ⎪
488 = 60a + 60b + 1044c 122 = 15a + 15b + 261c ⎩ b = 11 − 30c ⎪
⎭
30
Sustituyendo en la tercera ecuación:
µ ¶ µ ¶
25 − 30c 11 − 30c
122 = 15 + 15 + 261c ⇒ c = −0,08 854
3 30
yi 3 5 6 9 10 14
xi 60 70 80 100 150 210
3.4 Otros tipos de ajuste 103
0,4194 47 0,0649
σ yz = − × = −0,0148
6 6 6
σ yz
Recta de regresión Y /Z : y − y = 2 (z − z)
σ
µz ¶
47 −0,0148 0,0649 850,57
y− = −5
z− ⇒ y = 17,03 −
6 1,74 × 10 6 x
µ ¶µ ¶
0,89392 1,35217 2,59723
−
σ y0 x0 4 4 4 3,986 × 10−3
b= = µ ¶ = = 3,1208
σ 2x0 1,69151 2,59723 2 1,2772 × 10−3
−
4 4
1,35217 2,59723
a0 = y 0 − bx0 = − 3,1208 × = −1,6883 ⇒
4 4
y = abx ; a, b ∈ R
Como en el caso anterior tenemos que linealizarla para que posteriormente ajustar, por
mínimos cuadrados, la recta resultante
⎧ 0
⎨ y = ln y
y = abx ⇒ ln y = ln a + x ln b ⇒ llamando a0 = ln a ⇒ y 0 = a0 + b0 x
⎩ 0
b = ln b
3.4 Otros tipos de ajuste 105
xi 1 2 3 4 5
yi 100 120 110 150 130
Ajustar una función exponencial del tipo y = abx ¿Es mejor dicho ajuste que si ajustamos
la recta de regresión de Y /X ?
Respuesta.
La función y = abx se linealiza tomando logaritmos. (Utilizamos logaritmos neperianos)
⎧ 0
⎨ y = ln y
ln y = ln a + x ln b ⇒ llamando a0 = ln a ⇒ y 0 = a0 + b0 x
⎩ 0
b = ln b
72,6616 15 23,9713 ⎫
− × ⎪
⎪
σ y0 x 5 5 ¶ 5 0,14954 ⎪
⎪
b0 = = µ = = 0,07477 ⎪
⎪
σ 2x 55 15 2 2 ⎪
⎬
− ⇒
5 5 ⎪
⎪
⎪
⎪
⎪
23,9713 15 ⎪
⎪
a0 = y 0 − b0 x = − 0,07477 × = 4,56995 =⇒ ⎭
5 5
½
b0 = ln b = 0,07477 =⇒ b = e0,07477 = 1,0776
⇒
a0 = ln a = 4,56995 =⇒ a = e4,56995 = 96,54
y = 96,54 × (1,0776)x
106 Regresión Mínimo Cuadrática
Vr (y) = V (y)(1 − r2 )
µ ¶ ⎫
75900 610 2 ⎪
V (y) = − = 296 ⎪⎪
⎪
⎪
5 5 ⎬
⇒ Vr (y) = 134,088
σ 2 2 ⎪
⎪
18 ⎪
= 0,547 ⎪
xy
r2 = 2 2 = ⎪
⎭
σx σy 2 × 296
X\Y 10 15 20
X\Y 10 15 20 X\Y 10 15 20 25
1 0 2 0
1 0 2 0 1 0 3 0 1
2 1 0 0
2 1 0 0 2 0 0 1 0
3 0 0 3
3 0 0 3 3 2 0 0 0
4 0 1 0
¿Depende funcionalmente?
2. Una factoría de una marca de refrescos ha tomado al azar 10 semanas al año, ob-
servando la temperatura media correspondiente a cada una de ellas y la cantidad de
refrescos pedidos durante cada uno de dichos periodos. La información obtenida es:
Temperatura media 10 28 12 31 30 19 24 5 9 15
No de refrescos 21 65 19 72 75 39 67 11 12 24
b) ¿Existe una relación lineal importante entre las variables? (Sol: r = 0,63 (relación
moderadamente fuerte entre las variables)).
108 Regresión Mínimo Cuadrática
4. Se realiza un estudio para investigar la relación entre el nivel de humedad del suelo
y la tasa de mortalidad en lombrices. La tasa de mortalidad, Y , es la proporción de
lombrices de tierra que mueren tras un periodo de dos semanas; el nivel de humedad,
X, viene medido en milímetros de agua por centímetro cuadrado de suelo. Los datos
se muestran en la siguiente tabla. Se pide:
X 0.31 0.31 0,56 0,56 0,89 0.89 0,96 0,96 1,15 1,15 1.25
Y 0.2 0.1 0 0.2 0.3 0.5 0 0.6 0.4 0.2 0.5
a) ¿Muestran los datos una tendencia lineal? (Sol: y = 0,0097 + 0,3217x; r = 0,521
(relación moderadamente fuerte entre las variables))
5. Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar
la concentración de estrona en la saliva, X, para predecir la concentración del es-
teroide en plasma libre, Y . Se extrajeron los siguientes datos a 13 individuos sanos.
Se pide:
Edad 56 42 72 36 63 47 55 47 38 42
Presión 148 126 159 118 149 130 151 142 114 141
Dar una predicción lineal para la presión sanguínea de una mujer de 51 años. (Sol:
y = 80,444 + 1,1517x; 139,18).
8x + 2y = 1; 16x + 9y − 1 = 0
Calcular x, y y el coeficiente de correlación lineal. (Sol: 0,175; −0,2; r = −0,666).
X X X X X
xi = 11,34 ; x2i = 12,16 ; xi yi = 22,13 ; yi = 20,72 ; yi2 = 84,96
i i i i i
Se pide:
b) ¿Son fiables las predicciones efectuadas con las rectas anteriores? (Sol: r2 = 0,4697
(Si es fiable)).
12. Cinco niños de 2, 4, 6, 7 y 8 años pesan respectivamente, 15, 19, 25, 33 y 34 Kgs.
Hallar la recta de regresión mínimo cuadrática del peso con respecto a la edad. (Sol:
y = 6,9 + 3,388x; r2 = 0,948 (Buen ajuste)).
13. La siguiente tabla muestra el número de calzado y los pesos de 55 estudiantes:
X\Y 50 60 65 70 75 80 85
39 1 0 0 0 0 0 0
40 0 3 3 4 0 0 0
41 0 3 4 6 0 0 1
42 0 0 8 8 7 2 0
43 0 0 2 0 1 0 0
44 0 0 0 0 0 0 2
Dar una predicción del peso de un estudiante que calza el 38 ¿Es buena la predicción?
(Sol: y = −80,15 + 3,59576x; y = 56,48; r2 = 0,3060).
3.6 Comentarios bibliográficos 111
la atención del duque de Brunswick, quien dispuso, cuando el muchacho tenía catorce
años, costear tanto su educación secundaria como universitaria. Gauss, a quien también
le interesaban los clásicos y los idiomas, pensaba que haría de la filología la obra de su
vida, pero las matemáticas resultaron ser una atracción irresistible.
El día 30 de marzo de 1796, se decidió por fin por la matemática, porque ese mismo
día, cuando le faltaba aun un mes para cumplir los diecinueve años, hizo un brillante
descubrimiento. Gauss halló un método para construir un polígono equilátero de
17 lados con ayuda de regla y compás3 , e incluso fue más allá, demostrando que sólo
ciertos polígonos equiláteros se podían construir con ayuda de regla y com-
pás. Descubrió el método de construcción del Heptadecágono, y dio el criterio necesario
y suficiente para que un polígono pueda ser dibujado. Este 30 de marzo hará su primera
anotación en su diario de notas, un pequeño cuaderno de 19 páginas, que acom-
pañará a Gauss hasta 1814, el diario científico más importante de la historia de las
matemáticas, en el que irá anotando, a veces de forma críptica, los resultados matemáticos
que le vienen a la cabeza, en total 144 anotaciones. Un documento que por desgracia
para la ciencia no verá la luz hasta casi 50 años después de la muerte de Gauss.
Gauss se graduó en Gotinga en 1798, y al año siguiente recibió su doctorado
en la Universidad de Helmstedt. Las matemáticas no fueron el único tema que le
interesó a este hombre; fue también astrónomo, físico, geodesta e inventor. Hablaba
con facilidad varios idiomas, e inclusive dominó el ruso a la edad de sesenta años.
En 1799, Gauss tenía 22 años, demostró en su tesis que cada ecuación tiene al
menos una raíz compleja, consiguiendo de paso la aceptación por los matemáticos de
un nuevo universo de números: los números complejos. Gauss acababa de realizar la
presentación en sociedad de un nuevo conjunto de números que matemáticos anteriores,
como Wallis o el mismo Euler, que se referían a ellos como números imposibles, habían
utilizado con recelo.
En 1801 publicó el libro Disquisitiones Aritmeticae, con seis secciones dedicadas a la
Teoría de números, dándole a esta rama de las matemáticas una estructura sistematizada.
En la última sección del libro expone su tesis doctoral. Ese mismo año predijo la órbita
del asteroide Ceres aproximando parámetros por mínimos cuadrados.
En 1807 fue nombrado director del Observatorio de Göttingen y profesor de as-
tronomía en la Universidad de Gotinga. En este mismo año publica Theoria motus cor-
porum coelestium in sectionibus conicis Solem ambientium describiendo cómo calcular
la órbita de un planeta y cómo refinarla posteriormente. Profundiza sobre ecuaciones
diferenciales y secciones cónicas. Durante su estancia en el observatorio, construyó un
3
Desde hacía más de 2000 años, se sabía como construir con regla y compás el triángulo equilátero, el
cuadrado y el pentágono regular (así como algunos otros polígonos regulares cuyos números de lados son
múltiplos de dos, de tres o de cinco), pero ningún otro polígono regular con un número primo de lados.
3.6 Comentarios bibliográficos 113
En 1833 inventó un telégrafo eléctrico, once años antes de que Morse emitiese su
primer telegrama5 . Inventó también un magnetómetro bifiliar para medir el mag-
netismo y, con Weber, proyectó y construyó un observatorio no magnético6 . En
1840, las investigaciones de Gauss sobre la óptica tuvieron especial importancia debido
a sus deducciones respecto a los sistemas de lentes.
4
Instrumento que reflejaba la luz solar a grandes distancias y con él los rayos de luz solar se podían
emplear como líneas rectas que marcaban la superficie terrestre, pudiéndose obtener así determinaciones
trigonométricas más precisas de la forma del planeta.
5
Gauss y su amigo y colaborador Wilhelm Weber se comunicaban desde sus respectivos despachos
en el observatorio astronómico y la facultad de Física de la Universidad, separadas más de dos kilómetros,
mediante un telégrafo
6
Tanto Gauss como Riemann, que fue discípulo suyo, pensaban en una teoría electromagnética que
sería muy semejante a la ley universal de la gravitación de Newton. La teoría del electromagnetismo fue
ideada más tarde, en 1873, por Maxwell, aunque Gauss ya poseía los cimientos matemáticos para la
teoría.
114 Regresión Mínimo Cuadrática
Moneda acuñada con el título póstumo "Príncipe de los Matemáticos" con que el
rey Jorge V de Hannover honró a Gauss tras su muerte.