Universidad Peruana de Ciencias Aplicadas
MA331-2001-S - Algebra Lineal
Informe 1 - Regresión Lineal
Integrantes:
Aranda Del Carpio, Sebastián Alonso - U20191A355
Pineda Knox, Luis Alonso - U201915747
Profesor:
Edgard Kenny Venegas Palacios
Lima, Abril 2020
Índice
1. Introducción
2. Fundamento teórico
3. Variantes de Regresión Lineal
4. Ejercicios prácticos
5. Conclusiones y referencias bibliográficas
Introducción
El presente informe ha sido elaborado con la finalidad de explicar y ahondar en lo
referente a la regresión lineal y su uso en la álgebra lineal, así como de demostrar mediante
ejemplos y ejercicios el proceso matemático
detrás.
El concepto de regresión lineal data
desde inicios del siglo XIX, junto con el modelo
de mínimos cuadrados. Frecuentemente
empleada en los campos de la estadística, la
regresión lineal es una técnica que permite, en
su forma más sencilla, hallar la ecuación
continua que se aproxime de mejor manera a un
conjunto de datos conocidos. Más allá de su
utilización con grupos de datos conocidos, la
regresión también permite, en cierta medida, el cálculo de valores externos al conjunto de
datos -lo que se conoce también como extrapolación-, así como determinar el nivel de
dependencia entre los valores X e Y(ver la figura).
El término “regresión” resulta de la aplicación de la técnica al conjunto de datos
representado gráficamente dentro del plano cartesiano, donde la ecuación hallada es la que
tiene asociada la menor distancia desde la recta (o curva) a los datos, “regresando” al valor
medio.
Fundamento teórico
La regresión lineal, como se ha explicado anteriormente, es un procedimiento del análisis
matemático empleado para encontrar la expresión matemática que se ajuste de mejor manera
a un conjunto de N pares de datos.
El caso más común y simple de la regresión lineal es el método de los mínimos cuadrados,
buscando la regresión del conjunto de datos a una ecuación base en la forma:
y=mx+b
Siguiendo este procedimiento, tanto m como b pueden ser determinados mediante las
siguientes fórmulas:
n ⋅ Σ(x ⋅ y)−Σ x ⋅ Σ y
m= 2
n⋅ Σ x 2−|Σ x|
n⋅ Σ x 2−Σ x ⋅ Σ(x ⋅ y)
b= 2
n ⋅ Σ x 2−|Σ x|
Por otro lado, el mismo problema puede ser resuelto de forma más sencilla mediante la
aplicación de matemática matricial, expresando nuestro conjunto de datos a través de un SEL.
Visto de forma matricial, la regresión lineal para un sistema Ax=B puede ser representada de
la siguiente manera:
T −1 T
x=(A A) ⋅ A B
Es importante hacer ciertas observaciones importantes en relación a esta expresión:
● La matriz AT A solo podrá ser invertible (❑−1) si las columnas de A son LI.
● Debido a que matemáticamente es más conveniente resolver AT Ax= AT B utilizando
el método de Cholesky, ambas técnicas son empleadas de manera simultánea
frecuentemente.
Variantes de la regresión lineal
Función Potencial
La función potencial es una variante de la regresión lineal, que permite ajustar
aún la curva a la nube de datos a analizar. A diferencia del método de mínimos
cuadrados, la curva resultante de la ecuación no será una recta, y en ese sentido, resulta
imposible asegurar el comportamiento de la misma fuera del grupo de datos analizados.
La función potencial está dada por la siguiente fórmula:
b
y=a x
Función Exponencial
La función exponencial está dada por la siguiente fórmula:
bx
y=a ⋅e
Estas funciones tienen la particular de no ser lineales de por sí, pero son linealizables
mediante la aplicación de los logaritmos.
Ejercicios Resueltos
Para el desarrollo de los siguientes ejercicios se hará uso de un entorno de trabajo
llamado “Matrix Calculator”, el cual nos brindará un entorno de fácil uso para desarrollar las
matrices.
1. La proporción de desempleados en una empresa tiende a aumentar según lo mostrado en la
siguiente tabla:
Semestre 1 2 3 4 5 6
Proporción 0.20 0.25 0.20 0.35 0.45 0.40
Determinemos el modelo lineal que se ajuste a los puntos dados.
Para solucionar el ejercicio, primero se debe escribir la información de manera matricial:
b
A [¿ m ]=B ¿
De esta manera, al finalizar tendremos las siguientes matrices:
A= ∙ B=
Para los valores de la matriz de incógnitas, se emplea la siguiente fórmula:
T −1 T
x=(A A) ⋅ A B
Aplicando la transposición y la inversa, llegamos a:
x=¿
Finalmente, la ecuación de la recta que buscábamos es :
y=0.05 x +0.1333
2. Una empresa muy conocida ha trabajado hasta ahora con la hipótesis de que las ventas de
la empresa dependen linealmente de la inversión en gastos de publicidad efectuados.
Nos piden la realización de un análisis que ponga de manifiesto si la hipótesis, hasta ahora
mantenida, se puede seguir sosteniendo en función de los datos que tenemos en los últimos
9 años:
Año Gastos en Publicidad Ventas
2004 21 180,2
2005 22 190,5
2006 22 200,0
2007 25 201,9
2008 26 220,2
2009 27 230,5
2010 29 240,4
2011 30 260,3
2012 32 280,8
Se pide obtener un modelo lineal que permita estimar las ventas de la empresa a partir de los
gastos invertidos en publicidad.
Para la solución del problema, convertimos la información a matriz:
A= ∙ B=
Para los valores de la matriz de incógnitas, se emplea la siguiente fórmula:
T −1 T
x=(A A) ⋅ A B
Aplicando la transposición y la inversa, llegamos a:
x=¿
Finalmente, la ecuación de la recta que buscábamos es :
y=8.44 x+ 3.32
3. Los datos muestran las cantidad consumidas de complemento nutricional (en KG) y el
aumento de peso de niños con signos de desnutrición.
Paciente 1 2 3 4 5 6 7 8 9 10
Complemento 1 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
Peso 8 10 9 12 14 13 15 17 14 14
Se pide obtener un modelo lineal que permita estimar el peso de niños con signos de
desnutrición a partir del complemento en kilogramos.
Se escriben los valores de la forma matricial:
A= ∙ B=
Para los valores de la matriz de incógnitas, se emplea la siguiente fórmula:
T −1 T
x=(A A) ⋅ A B
Aplicando la transposición y la inversa, llegamos a:
x=¿
Finalmente, la ecuación de la recta que buscábamos es :
y=1.58 x +7.48
4. Un estudio de mercado trata de averiguar si es efectiva la propaganda televisada de un
producto que salió a la venta con relación al tiempo de publicidad (en horas/semana). Se
recopilaron datos a partir de la segunda semana de iniciada la publicidad resultando el
cuadro que siguiente. No se pudo recopilar datos de la cuarta semana:
Semana 2 3 4 5 6 7
Venta del 300.00 310.00 _ 320.00 350.00 420.00
producto ($)
Tiempo de 20 25 22 28 36 40
propaganda
Se pide determinar si a) es efectiva la publicidad del producto y b) el estimado de ventas para la
semana 4.
Convertimos la información a matriz, ignorando la información de la semana 4:
A= ∙ B=
Para los valores de la matriz de incógnitas, se emplea la siguiente fórmula:
T −1 T
x=( A A) ⋅ A B
Aplicando la transposición y la inversa, llegamos a:
x=¿
Finalmente, la ecuación de la recta que buscábamos es :
y=5.48 x +176.82
Entonces:
Se puede decir que en efecto, la publicidad del producto es efectiva, puesto que la pendiente
de la ecuación es positiva. Con relación a la semana 4, se procede a reemplazar en la
ecuación:
y=5.48 (22)+176.82
El estimado para de ventas para la semana 4 es aproximadamente 297.38 dólares
5. En determinado proceso se realizaron una serie de 4 mediciones, que luego al graficarse se
determinó que es de naturaleza cuadrática. Se desea encontrar los parámetros del
polinomio de segundo grado, que mejor se ajusta a esta serie de datos.
La tabla con los datos medidos es la siguiente:
X Y
1 11.38
2 20.53
3 31.38
4 48.39
Para este ejercicio, al ser de ajuste cuadrático, se utiliza la forma:
2
y=ax + bx+ c
Entonces:
11.38=1 a+1 b+c
20.53=4 a+2 b+c
31.38=9 a+3 b+ c
448.39=16 a+ 4 b +c
Y se convierte a la forma matricial
A= ∙ B=
Para los valores de la matriz de incógnitas, se emplea la siguiente fórmula:
T −1 T
x=( A A) ⋅ A B
Aplicando la transposición y la inversa, llegamos a:
x=¿
Finalmente, la ecuación de la curva que buscábamos es :
2
y=1.965 x +2.363 x+7.275
6. Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es el
volumen (variable independiente) e Y es la presión de una masa dada de gas (variable
resultante).
X 1 2 3 4 5 6 7
Y 7 30 90 170 290 450 650
Se pide a) calcular la ecuación predictora y b) estimar la presión de la masa de gas de
volumen 9
Para la resolución, primero hemos de encontrar la relación lineal de nuestra tabla de datos, los
cuales se encuentran inicialmente en la siguiente forma:
b
y=a x
Entonces, la relación lineal de los datos estará en la siguiente forma:
ln a+ b ⋅ln x=ln y
Por lo tanto:
ln a+ b ⋅ln 1=ln7
ln a+ b ⋅ln 2=ln 30
ln a+ b ⋅ln 3=ln 90
ln a+ b ⋅ln 4=ln 170
ln a+ b ⋅ln 5=ln 290
ln a+ b ⋅ln 6=ln 450
ln a+ b ⋅ln 7=ln 650
Utilizando una calculadora, procedemos a pasar los datos a la forma matricial
A= ∙ B=
Para los valores de la matriz de incógnitas, se emplea la siguiente fórmula:
T −1 T
x=(A A) ⋅ A B
Aplicando la transposición y la inversa, llegamos a:
x=¿
Finalmente, la ecuación de la curva que buscábamos es :
ln y =1.8853+2.3509 ⋅ln x
O bien puede ser expresada como:
2.3509
y=6.59 x
Procedemos a evaluar cuando x=9
2.3509
y=6.59⋅ 9
Entonces y=1154.02
Conclusiones
La regresión lineal es una herramienta muy importante en el campo de la estadística y
del análisis matemático, que nos permite, de forma bastante aproximada, la estimación de
resultados en base a un conjunto de datos.
Es importante no perder de vista que si bien la regresión lineal puede proporcionar
estimaciones muy cercanas a la nube de datos, estas puede cambiar radicalmente fuera de los
parámetros bajo los que se realiza el análisis,
Referencias Bibliográficas
● Tusell, F. (2011) Análisis de Regresión. Introducción Teórica y Práctica basada en
R. Bilbao, España. Recuperado de
http://www.et.bs.ehu.es/~etptupaf/nuevo/ficheros/estad3/nreg1.pdf
● Suárez, M. (2012) Interaprendizaje de Estadística Básica. Ibarra, Ecuador.
Recuperado de https://www.academia.edu/9958993/Interaprendizaje_de_Estad
%C3%ADstica_B%C3%A1sica
● Montgomery, D., Peck E., Vining, G. (2012) Introduction to Linear Regression
Analysis. New Jersey, Estados Unidos. Recuperado de
https://books.google.com.pe/books?
id=0yR4KUL4VDkC&printsec=frontcover&source=gbs_ge_summary_r&cad=0#v=o
nepage&q&f=false