1
Consulta: Regresión Lineal Múltiple
Sareth Daniela Hazbon Manrique
Código: 2180227
Juan Esteban Rivero Sandoval
Código: 2180243
Olmedo Gonzales Herrera
Universidad Industrial de Santander
Escuela de Ingeniería Industrial
Estadística III
Grupo O3
29 de abril 2021
2
Regresión Lineal Múltiple
La regresión lineal múltiple es aquella en la que se ajustan modelos lineales o linealizables
entre una variable dependiente y más de una variable independiente. En este tipo de
modelos es importante testar la heterocedasticidad, la multicolinealidad y la especificación.
Montero, R. (2021). Este tipo de regresión, a diferencia de la regresión lineal simple,
explora un poco más la complejidad de los experimentos, al considerar e incluir su
naturaleza multi variable. La regresión lineal simple es funcional para experimentos de su
misma índole: simples. Sin embargo, en la realidad, la mayoría de sucesos y situaciones a
las que buscamos una explicación o respuesta se ven afectados por varios factores. En este
aspecto radica la importancia de la regresión lineal múltiple: permite mejores y más
completas explicaciones.
Según Richard Levin (2004) al utilizar más de una variable independiente para estimar la
variable dependiente, se aumenta la precisión de la estimación. De igual manera, ofrece la
ventaja de utilizar más información disponible para estimar la variable dependiente,
aportando como resultado una ecuación que describe aquella relación con mayor precisión.
Este autor también indica un proceso de tres pasos en la resolución de problemas de este
tipo:
1. Describir la ecuación de regresión múltiple
2. Examinar el error estándar de regresión múltiple de la estimación.
3. Utilizar el análisis de correlación múltiple para determinar qué tan bien se describen
los datos observados.
3
Modelo de regresión lineal múltiple:
Yi=(β0+β1X1i+β2X2i+⋯+βnXni)+ei
Componentes de la ecuación:
Yi = Variable explicada o respuesta.
Xni= Variables explicativas o control.
Β0 = Ordenada de origen (corte con el eje y, cuando todas las variables control son cero).
Bn = Efecto promedio que tiene el incremento de una unidad de una variable control Xn,
sobre la variable respuesta Y. Puede ser entendida como una razón de cambio, o una
derivada parcial.
ei = Residuo o error, es la diferencia entre el valor observado y el valor dado por el modelo.
Rodrigo, J. (2021).
Ejercicio de aplicación
Fig. 1. Ejercicio Tomado de Estadística para administración y economía. Levin, Richard I. y
Rubin, David S. Séptima edición, página 567.
4
El Servicio Interno de Contribuciones (IRS, Internal Revenue Service) de Estados Unidos está
Tabla. [Link]
Datos del ejercicio
de estimar tomadomensual
la cantidad de Estadística para
de impuestos noadministración y economía.
pagados descubiertos Levin,
por su departamento
de auditorías. En el pasado, el IRS estimaba esta cantidad con base en el número esperado de horas de
trabajo de auditorías
Richard I. de campo. David
y Rubin, En los últimos años, sin
S. Séptima embargo,
edición, las horas
página [Link] trabajo de auditorías
de campo se han convertido en un pronosticador errático de los impuestos no pagados reales. Como
resultado, la dependencia está buscando otro factor para mejorar la ecuación de estimación.
El departamento de auditorías tiene un registro del número de horas que usa sus computadoras
para detectar impuestos no pagados. ¿Podríamos combinar esta información con los datos referentes a las horas de trabajo de
auditorías de campo y obtener una ecuación de estimación más precisa
para los impuestos no pagados descubiertos cada mes? En la tabla 13-1 se presentan esos datos para los últimos 10 meses.
X1 X2 Y
Horas de trabajo de Impuestos realies no
Horas en computadora
Mes auditoría de campo (dos (dos ceros omitidos) pagados descubiertos
ceros omitidos) (millones de dólares)
Enero 45 16 29
Datos de los Febrero 42 14 24
registros de
auditorías Marzo 44 15 27
del IRS de Abril 45 13 25
los
últimos 10
meses
Para el desarrollo del ejercicio se toma como variable dependiente Y a los impuestos reales
no pagados, descubiertos (en millones de dólares), como variable independiente X1 a las
horas de trabajo de auditoría (dos ceros omitidos) y como variable independiente X2 a las
horas en computadora.
En primer lugar, se decide realizar la regresión lineal simple correspondiente a la variable
dependiente con cada variable independiente por separado, con el objetivo de observar el
coeficiente de determinación (R^2) ajustado (ya que el R^2 sin ajuste tiene a incrementar
hacia 1 a medida de agregar variables independientes al modelo, y no resulta muy objetivo)
en lo cual se observa:
Tabla. 2. R^2 ajustados.
Intercepción
5
Lo que permite concluir que la estimación con regresión lineal simple actual con la que se
cuenta puede mejorarse y ser más exacta al incluir el factor X2.
De igual manera en el análisis de regresión lineal múltiple se obtiene lo siguiente:
Tabla. 3. Resultados regresión lineal múltiple.
Resumen
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0.853770004335
Coeficiente de
determinación R^2 0.728923220303
R^2 ajustado 0.651472711818
Error típico 1.070638839935
Observaciones 10
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 21.5761273209549 10.7880636604775 9.41147107 0.010371059169615
Residuos 7 8.02387267904509 1.14626752557787
Total 9 29.6
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%
Superior 95,0%
Intercepción -13.8196286472 13.3232998953547 -1.03725268933061 0.33411481 -45.3242266910141 17.6849694 -45.324227 17.6849694
Con estos datos obtenidos, es posible observar que, entre otras cosas, la ecuación obtenida
que describe de una manera más exacta la correlación entre los impuestos reales no pagados
descubiertos y las horas de trabajo de auditoria de campo y las horas en una computadora
es:
Y =−13 , 82+0 , 56 x 1+1 , 10 x2
Por lo tanto, es posible concluir que el departamento de auditorías puede utilizar esta
ecuación mensualmente para estimar la cantidad de impuestos no pagados que va a
descubrir.
Bibliografía
Modelos de regresión lineal múltiple. extraído el 29 de Abril del 2021, desde
[Link]
Introducción a la Regresión Lineal Múltiple. Retrieved 29 April 2021, from
[Link]
6
levin, & richard. (2021). Tomado de 30 Abril 2021, desde [Link]
content/uploads/2017/12/Estad%C3%ADstica-para-administraci%C3%B3n-y-
economia-Richard-I.-[Link]