AJUSTE POR MINIMOS CUADRADOS
MÉTODOS NUMÉRICOS
Oscar Tinoco Gómez
ANÁLISIS BIVARIADO
El Análisis Bivariado estudia la relación o
interacción entre dos variables
• Cuando las variables son cuantitativas:
– Correlación
– Regresión
• Cuando las variables son cualitativas
– Prueba Chi Cuadrado
AJUSTE POR MÍNIMOS CUADRADOS
Modelo más frecuente: Y = Bo + B1 X
CORRELACIÓN Y REGRESIÓN
La correlación y la regresión son dos técnicas que
permiten estudiar la relación entre dos variables
cuantitativas (escala de intervalo o de razón). Por
ejemplo:
• Presión sanguínea y edad
• Estatura y peso
CORRELACIÓN:
Mide el grado de asociación entre dos variables
REGRESIÓN
Analiza la relación de dependencia entre dos variables,
una de ellas será dependiente y la otra independiente
1. ANÁLISIS BIVARIADO
CONCEPTO
• Consiste en analizar la interacción de dos variables.
Ejemplo.
Analizar la relación entre los siguientes resultados de dos tests
(Matemáticas y Ciencias) aplicados a un grupo de alumnos:
Tabla 1: Resultados de dos Tests (Matemática y Ciencia)
Puntuación Matemática Puntuación Ciencias Test
Alumno Test “X” “Y”
A 83 160
B 46 38
C 92 143
D 81 67
E 70 124
F 70 117
G 75 132
H 88 143
I 74 121
J 79 113
DIAGRAMA DE DISPERSIÓN
Es la expresión gráfica de la relación entre dos variables
cuantitativas.
Una primera herramienta para este análisis es el “diagrama de
dispersión o nube de puntos”, el mismo que consiste en graficar
los pares ordenados correspondientes.
Gráfico 1. Diagrama de dispersión o nube de puntos
Y
LÍNEA DE REGRESIÓN
NUBE DE PUNTOS (estrecha
o ancha)
La forma que adopta el diagrama de dispersión, indica la
naturaleza e intensidad de la relación.
El diagrama de dispersión que se muestra a
continuación representa gráficamente la forma en que se
asocian las dos variables. En estudio, pudiendo ésta ser
lineal, cuadrático, cúbico o exponencial.
De acuerdo al valor numérico del coeficiente de
correlación, la nube de puntos tiene una forma peculiar,
La misma que puede ser:
Para r positivo, figura 1.
Para r negativo, figura 2.
Para r nulo, figura 3.
LINEAL POSITIVA
r positivo
LINEAL NEGATIVA
r negativo
NINGUNA RELACIÓN
r nulo
Gráfico 2. Diagrama de dispersión de las puntuaciones de
los alumnos de Matemática y Ciencias
180
160
140
120
T E S T "Y "
100
80
60
40
20
0
0 20 40 60 80 100
T E S T "X "
COEFICIENTE DE CORRELACIÓN DE PEARSON
• Mide el grado de asociación de dos variables cuantitativas.
• El objetivo es determinar que tan intensa es la relación
mediante el coeficiente de correlación. Se simboliza con la
letra “r” y su valor puede fluctuar de la siguiente forma:
-1 <= r <= 1
Correlación Ninguna Correlación
negativa Correlación positiva
perfecta perfecta
Valor negativo de “r” Valor positivo de “r”
-1.00 0.00 1.00
Correlación negativa Correlación positiva
El coeficiente de correlación puede calcularse con la
siguiente fórmula:
N XY X * Y
r
n X ( X ) n Y ( Y )
2 2 2 2
En donde: n : Número de sujetos de la muestra
X : Puntuaciones de la Variable “X”
Y : Puntuaciones de la Variable “Y”
Ejemplo:
• Para simplificar los cálculos correspondientes, se tabulan de la
siguiente forma:
Tabla 2. Resultados de los Tests
(Matemática y Ciencias)
ALUMNO X Y X2 Y2 XY
A 83 160 6889 25600 13280
B 46 38 2116 1444 1748
C 92 143 8464 20449 13156
D 81 67 6561 4489 5427
E 70 124 4900 15376 8680
F 70 117 4900 13689 8190
G 75 132 5625 17424 9900
H 88 143 7744 20449 12584
I 74 121 5476 14641 8984
J 79 113 6241 12769 8927
TOTAL X 758 Y 1158 X 2
58916 146330
Y 2
XY 90846
* EN ESTE CASO “n” ES IGUAL A 10.
Fuente: Tabla 1
Aplicando la fórmula:
N XY X * Y
r
n X 2
( X ) 2 n Y 2 ( Y ) 2
10(90846) (758)(1158 )
r
10(58916) (758) 10(146330) (1158 )
2 2
30696 30696
r
14596 122336 42256.5528
r 0.726
INTERPRETACIÓN:
• La correlación es positiva (por el signo del resultado), lo cual significa
que ambas variables varían en un mismo sentido.
• La correlación es numéricamente igual a 0.726, valor que puede ser
aceptado como “regular”.
Tabla 3. Significación del coeficiente de correlación de
Pearson
VALOR r
INTERPRETACIÓN RELACIÓN
De A
0.00 0.49 “r” MUY DEBIL RELACIÓN CASI NULA
0.50 0.719 “r” DEBIL RELACIÓN DEFINIDA PERO DÉBIL
0.72 0.799 “r” MODERADA RELACIÓN MODERADA
0.80 0. 899 “r” ALTA RELACIÓN FUERTE
0.90 0.999 “r” MUY ALTA RELACIÓN MUY FUERTE
Para los datos que se muestran:
a) Obtener e interpretar el diagrama de dispersión
b) Obtener e interpretar el coeficiente de correlación de
Pearson
PUBLICIDAD
90
80
70
60
50
40
30
20
10
0
0 5 10 15 20 25 30 35
El Principio de los “Mínimos
Cuadrados”
• La regresión trata de generar la
“ecuación de mejor ajuste” ---
pero ¿qué es lo “mejor”?
• Criterio: minimizar la suma de
las desviaciones cuadradas
de los puntos de datos de la
regresión lineal.
¿Qué tan Buena es la Regresión?
¿Qué tan bien representa nuestros datos originales la ecuación de
regresión?
La proporción (porcentaje) de la varianza en y que es explicada por la
ecuación de regresión es representada por el símbolo R2.
(Suma de los cuadrados de la media de Y)
R = 2 (Suma de los cuadrados de la regresión lineal)
Variabilidad Ajustada - ilustración
R2 Alto- buen ajuste R2 Bajo- poco ajuste
RESUMEN: MÉTODO DE LOS MÍNIMOS CUADRADOS
Es una técnica de análisis numérico en la que dados un conjunto
de pares ordenados (obtenidos empíricamente) se intenta
encontrar la función que mejor se aproxime a los datos
(«ajuste»).
En su forma más simple intenta minimizar la suma de los
cuadrados de las diferencias ordenadas (residuos) entre los
puntos generados por la función (modelo teórico) y los
correspondientes en los datos.
Bo =
𝒀 =𝑩 𝒐 +𝑩 𝟏 𝑿
B1 =
EJERCICIO RESUMEN
a) Elaborar el diagrama de dispersión. Interpretar.
b) Obtener el coeficiente de correlación de Pearson. Interpretar.
c) Ensayar un modelo de regresión lineal por mínimos cuadrados. Interpretar R2.
d) Ensayar un modelo de regresión no lineal por mínimos cuadrados. Interpretar
R2.
Y
250
200
150
100
50
0
0 5 10 15 20 25 30
Interpretación:
Interpretación:
Y
250
Y
Y
250 y = 0.0008x5 - 0.0576x 4 + 1.4886x3 - 17.166x2 + 88.848x - 62.269
250 200
R² = 0.9558
200 y = 0.0011x 2 + 4.9703x + 60.148
3 - 0.6999x 2 + 13.171x + 36.927
y = 0.0167x
200 150 R²R²==0.9027
0.9272
150
150
100
100
100
50
50
50
0
0 0 5 10 15 20 25 30
0 0 5 10 15 20 25 30
0 5 10 15 20 25 30
EJERCICIO PROPUESTO
a) Elaborar el diagrama de dispersión. Interpretar.
b) Obtener el coeficiente de correlación de Pearson. Interpretar.
c) Ensayar un modelo de regresión lineal por mínimos cuadrados. Interpretar R2.
d) Ensayar un modelo de regresión no lineal por mínimos cuadrados. Interpretar
R2.
G1
Ajustar con mínimos cuadrados
G2
a) Elaborar el diagrama de dispersión. Interpretar
b) Obtener e interpretar el coeficiente de correlación de Pearson
c) Obtener el ajuste por mínimos cuadrados para un modelo lineal.
Calcular la altura, con este modelo, para un tiempo de 25 h
d) Obtener el ajuste por mínimos cuadrados para un modelo cuadrático.
Calcular la altura, con este modelo, para un tiempo de 25 h
G3
G4
a) Elaborar el diagrama de dispersión. Interpretar
b) Obtener e interpretar el coeficiente de correlación de Pearson
c) Obtener el ajuste por mínimos cuadrados para un modelo lineal.
Estimar las compras, con este modelo, para ingresos de 177
d) Obtener el ajuste por mínimos cuadrados para un modelo cuadrático.
Estimar las compras, con este modelo, para ingresos de 177
G5
G6
a) Elaborar el diagrama de dispersión. Interpretar
b) Obtener e interpretar el coeficiente de correlación de Pearson
c) Obtener el ajuste por mínimos cuadrados para un modelo lineal.
Calcular la altura, con este modelo, para una posición de 300
d) Obtener el ajuste por mínimos cuadrados para un modelo cuadrático.
Calcular la altura, con este modelo, para una posición de 300
G7
a) Elaborar el diagrama de dispersión. Interpretar
b) Obtener e interpretar el coeficiente de correlación de Pearson
c) Obtener el ajuste por mínimos cuadrados para un modelo lineal.
Calcular el precio de la harina, con este modelo, para X = 37
d) Obtener el ajuste por mínimos cuadrados para un modelo cuadrático.
Calcular el precio de la harina, con este modelo, para una PRODUCCIÓN
DE 37
G8
a) Elaborar el diagrama de dispersión. Interpretar
b) Obtener e interpretar el coeficiente de correlación de Pearson
c) Obtener el ajuste por mínimos cuadrados para un modelo lineal.
Estimar las ventas, con este modelo, para un nivel de gastos en
publicidad de 350
d) Obtener el ajuste por mínimos cuadrados para un modelo no lineal.
Estimar las ventas, con este modelo, para un nivel de gastos en
publicidad de 350
G9
a) Elaborar e interpretar el diagrama de dispersión
b) Obtener e interpretar el coeficiente de correlación de Pearson
c) Efectuar el ajuste por mínimos cuadrado para un modelo lineal y para dos modelos
no lineales. Cuál escogería? Justificar la respuesta
Linealización de relaciones no lineales
y y y
x
y 1e 1 x
y 2x 2
y 3
3 x
x x x
ln y log y 1/y
Pendiente = b3/a3
Pendiente = b1
Pendiente = b2 Intersección = 1/a3
x log x 1/x
Intersección = ln a1 Intersección = log a2