FIMAAS
SEM 14
ING. OSCAR EDUARDO ROJAS FARRO
FIMAAS
REGRESIÓN LINEAL SIMPLE
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
La relación entre dos variables métricas puede ser
representada mediante la línea de mejor ajuste a los datos.
Esta recta se le denomina recta de regresión, que puede ser
negativa o positiva, la primera con tendencia decreciente y la
segunda creciente.
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
Para el cálculo de la recta de regresión se aplica el método de
mínimos cuadrados entre dos variables. Esta línea es la que
hace mínima la suma de los cuadrados de los residuos, es
decir, es aquella recta en la que las diferencias elevadas al
cuadrado entre los valores calculados por la ecuación de la
recta y los valores reales de la serie, son las menores posibles.
y = a + bx
REGRESION LINEAL SIMPLE
METODO DE LOS MINIMOS CUADRADOS
Este método consiste en minimizar LA SUMA DE LOS ERRORES AL
CUADRADO para estimar los parámetros poblacionales α y β mediante a
y b respectivamente.
n n n
SSE e y i yˆ y i a bxi
2 2 2
i
i 1 i 1 i 1
REGRESION LINEAL SIMPLE
ESTIMACION DE LOS COEFICIENTES DE REGRESION.- Dada una
muestra , las estimaciones de mínimos cuadrados a y b de los coeficientes
de regresión α y β se calcula por medio de las formulas:
n xi y i xi y i y i b xi
b a
n xi2 xi n
2
REGRESION LINEAL SIMPLE
Para deducir el estimador S2 de σ2 es necesario introducir las
notaciones.
x 2
S xx xi x xi2
2 i
y 2
S yy y i y y
2 2 i
i
n
n n
n
i i
x y
S xy xi x y i y xi y i i 1 i 1
i 1 n
REGRESION LINEAL
;
SIMPLE
Ahora podemos escribir la suma de los cuadrados del error
como sigue:
n n
S xy
SSE ei2 yi a bxi S yy bS xy
2
b
i 1 i 1 S xx
Concluimos que luego con el siguiente teorema:
Una estimación insesgada de 2
es:
SSE S yy bS xy
S
2
n2 n2
REGRESION LINEAL SIMPLE
ERROR ESTANDAR DE ESTIMACION S S2
El error estándar es la medida de variabilidad de los valores
de Yi a partir de sus valores predichos de la misma manera
en que desarrollamos una media de la variabilidad alrededor
de la media. La media de la variabilidad alrededor de la línea
de regresión (su desviación estándar) se conoce como error
estándar de la estimación. En cualquier recta de regresión
predicha cae cerca de muchos de los valores de Y, existen
varios valores por encima y por debajo de esta, de modo que:
y i ŷ 0
REGRESION LINEAL SIMPLE
PROB 1
1.- AL GERENTE DEL DEPARTAMENTO DE ADQUISICIONES DE UNA ORGANIZACIÓN BANCARIA LE GUSTARÍA
DESARROLLAR UN MODELO PARA PREDECIR LA CANTIDAD DE TIEMPO(Y) QUE LLEVARÍA PROCESAR SUS
FACTURAS(X). SE TOMARON DATOS DE UNA MUESTRA DE 30 DÍAS CON LOS RESULTADOS SIGUIENTES:
X Y X2 Y2 X.Y
∑ 3897 61.2 669459 153.92 10007.8
a. Construya un diagrama de dispersión
b. Suponiendo que haya relación lineal utilice el método de mínimos
cuadrados, para encontrar los coeficientes de regresión a y b.
c. Interprete el significado de la intersección con el eje Y, a y de la
pendiente, b. de este problema.
d. Utilice el modelo de regresión. Para predecir la cantidad de tiempo
que llevaría procesar 150 facturas
e. Calcule el error estándar de estimación.
xyii22y i
REGRESION LINEAL SIMPLE
SOLUCION
a. Construya un diagrama de dispersión
REGRESION LINEAL SIMPLE
b. Suponiendo que haya relación lineal utilice el método de mínimos cuadrados
Sea la ecuación:
y a bx
b
x y 30 10007.8 (3897)(61.2) 0.0126
n x i y i i i
n x x 30 669459
Dónde: ( 3897 )
2 2 2
i i
a
y i b xi
61.2 0.0126 3897
0.4023
n 30
y 0.4023 0.0126 x
c. Interprete el significado de la intersección con el eje Y. a. y de la pendiente b. de este problema.
Sabemos que:
y 0.4023 0.0126 x
a 0.4023 , REPRESENTA LA VARIACIÓN EN HORAS DEBIDO A OTROS FACTORES DIFERENTES AL PROCESO DE FACTURACIÓN.
b 0.0126 , PUEDE INTERPRETARSE COMO EL AUMENTO O VARIACIÓN POR CADA FACTURA PROCESADA, EL INCREMENTO
DE LA CANTIDAD DE TIEMPO EN HORAS.
REGRESION LINEAL SIMPLE
d. UTILICE EL MODELO DE REGRESIÓN PARA PREDECIR LA CANTIDAD DE TIEMPO QUE LLEVARÍA PROCESAR 150 FACTURAS:
x0 150 facturas
yˆ 0 0.4023 0.0126(150)
y 0 2.2923 Horas estimadas a la predicción cuando se procesan 150 facturas.
e. CALCULE EL ERROR ESTÁNDAR DE ESTIMACIÓN.
( y i ) 2 61.2
2
S yy y 2
i 153.92 153.92 124.848 29.072
n 30
( xi ) 2 3897 2
S xx xi2 n
669459
30
669459 506220.3 163238.7
n n
n
xi yi
(3897)(61.2)
S xy xi yi i 1 i 1 10007.8 10007.8 7949.88 2057.92
i 1 n 30
S yy bS xy 29.072 (0.0126) 2057.92
S2 0.1122217
n2 28
POR LO TANTO EL ERROR ESTÁNDAR DE ESTIMACIÓN SERÁ: S S 2 0.334995 0.335
PROB 2.
EN UNA COMPAÑÍA FABRICANTE DE HELADOS SE SOSPECHA QUE AL
ALMACENAR EL HELADO A TEMPERATURA BAJA. DURANTE LARGOS
PERIODOS TIENE UN EFECTO LINEAL EN LA PERDIDA DE PESO DEL
PRODUCTO . EN LA PLANTA DE ALMACENAMIENTO DE LA COMPAÑÍA SE
OBTUVIERON LOS SIGUIENTES DATOS:
Perdida de
peso (x) 1.01 1.32 1.30 1.06 1.00 1.30 1.26
(Tm.)
Tiempo(y) 28.00 32.00 35.00 27.00 25.00 31.00 30.00
(horas)
a) CONSTRUYA UN DIAGRAMA DE DISPERSIÓN
b) SUPONIENDO QUE HAYA UNA RELACIÓN LINEAL UTILICE EL MÉTODO
DE MÍNIMOS CUADRADOS, PARA ENCONTRAR LOS COEFICIENTES DE
REGRESIÓN A Y B.
c) INTERPRETE EL SIGNIFICADO DE LA INTERSECCIÓN a CON EL EJE Y, Y
DE LA PENDIENTE , b. DE ESTE PROBLEMA
d) UTILICE EL MODELO DE REGRESIÓN PARA PREDECIR LA CANTIDAD DE
TIEMPO QUE LLEVARÍA ALMACENAR 1.05 TONELADAS METRICAS
e) CALCULE EL ERROR ESTÁNDAR DE ESTIMACIÓN
Solución:
〖𝑥𝑖〗 〖 y𝑖 〗 〖𝑥𝑖〗 ^2 〖 y𝑖 〗 ^2 𝑥[Link]
1.0100 28.0000 1.0201 784.0000 28.2800
1.3200 32.0000 1.7424 1024.0000 42.2400
1.3000 35.0000 1.6900 1225.0000 45.5000
1.0600 27.0000 1.1236 729.0000 28.6200
1.0000 25.0000 1.0000 625.0000 25.0000
1.3000 31.0000 1.6900 961.0000 40.3000
1.2600 30.0000 1.5876 900.0000 37.8000
8.2500 208.0000 9.8537 6248.0000 247.7400
Construyendo diagrama de dispersión
b) Suponiendo que haya relación lineal utilice el método
de mínimos cuadrados
Sea la ecuación y = a + bx
Donde:
b = = = = 19.9037
a= =
y
c) Interprete el significado de la intersección con el eje Y,
a. y de la pendiente b. de este problema.
Sabemos que:
y = 6.2564 + 19.9037 x
a = 6.2564, representa la variación en horas debido a otros
factores diferentes al de la cantidad de peso perdido.
b = 19.9037, puede interpretarse como el aumento o
variación por cada tonelada métrica pérdida de peso, el
incremento de la cantidad de tiempo en horas.
Utilice el modelo de regresión para predecir la cantidad
d)
de tiempo que llevaría almacenar 1.05 toneladas métricas
=1.05 toneladas métricas
=6.2564+19.9037(1.05)
=27.1552 horas estimadas para almacenar 1.05 toneladas
métricas
e.
PROB
DE UNA DETERMINADA EMPRESA SE CONOCEN LOS
SIGUIENTES DATOS, REFERIDOS AL VOLUMEN DE Y AL
GASTO EN DE LOS ÚLTIMOS 6 AÑOS:
(y) (x)
a. Construya un diagrama de dispersión.
b. Suponiendo que haya relación lineal utilice el
método de mínimos cuadrados, para encontrar
los coeficientes de regresión a y b.
c. Interprete el significado de la intersección con el
eje Y, a y de la pendiente, b de este problema.
d. Utilice el modelo de regresión. Para predecir el
gasto de publicidad 120 volúmenes de ventas .
e. Calcule el error estándar de estimación
Solución:
i i i i i i
a) Dibujamos primero el diagrama de
dispersión
•b) Suponiendo que haya relación lineal utilice el
método de mínimos cuadrados, para encontrar los
coeficientes de regresión a y b.
Sea la ecuación:
•c) Interpretando el significado de la intersección con
el eje Y, a y de la pendiente, b de este problema.
Ya sabemos que :
a= representa la variación en gastos de publicidad
debido a otros factores diferentes al volumen.
b= puede interpretarse como el aumento o
variación por cada unidad de volumen, el
incremento de la cantidad de gastos de publicidad
•
d) Utilizando el modelo de regresión. Para
predecir el gasto de publicidad 120 volúmenes
de ventas .
•e) Calculando el error estándar de estimación
por lo tanto el error estándar de estimación será:
S=