0% encontró este documento útil (0 votos)
203 vistas15 páginas

Regresión Lineal y Múltiple en Estadística

Este documento presenta los conceptos básicos de la regresión lineal simple y múltiple. Explica que la regresión es un procedimiento estadístico que analiza la relación entre variables dependientes e independientes. Describe la regresión lineal simple como la relación entre una variable dependiente y una independiente, mientras que la regresión lineal múltiple involucra más de una variable independiente. Finalmente, provee ejemplos para ilustrar los diferentes tipos de regresión lineal.

Cargado por

202212533g
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
203 vistas15 páginas

Regresión Lineal y Múltiple en Estadística

Este documento presenta los conceptos básicos de la regresión lineal simple y múltiple. Explica que la regresión es un procedimiento estadístico que analiza la relación entre variables dependientes e independientes. Describe la regresión lineal simple como la relación entre una variable dependiente y una independiente, mientras que la regresión lineal múltiple involucra más de una variable independiente. Finalmente, provee ejemplos para ilustrar los diferentes tipos de regresión lineal.

Cargado por

202212533g
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD TECNOLÓGICA DE LOS ANDES

FACULTAD DE CIENCIAS JURÍDICAS, CONTABLES Y SOCIALES

ESCUELA PROFESIONAL DE DERECHO

REGRESIÓN LINEAL Y MÚLTIPLE

ASIGNATURA : Estadística

DOCENTE : Dr. Fermín Urbano Sollasi Ferro

ESTUDIANTES :

 Alan Fabrizio Arotaype Pillco


 Andry Sayury Lasteros Simaraura
 Emily Ccoya Quispe
 Justina Pacocha Orccosupa

CUSCO – 2023
ÍNDICE

INTRODUCCIÓN ........................................................................................................................ 3

REGRESIÓN................................................................................................................................. 4

1.1. CONCEPTO ........................................................................................................................ 4

1.2. LA REGRESIÓN LINEAL ................................................................................................. 4

1.3. IMPORTANCIA .................................................................................................................. 4

1.4. TIPOS .................................................................................................................................. 5

1.4.1. Regresión Lineal Simple .............................................................................................. 5

1.4.2. Regresión Lineal Múltiple ............................................................................................ 7

CONCLUSIÓN ........................................................................................................................... 14

BIBLIOGRAFÍA......................................................................................................................... 15

2
INTRODUCCIÓN

El pronóstico es un dato que, con base a una serie de estudios, determinan la demanda en
un futuro de un determinado producto. Es predecir el futuro a partir de algunos indicios. El
pronóstico es una inferencia a partir de ciertos datos, permite predecir lo que ocurrirá en el futuro,
depende de los cambios en las variables externas. La Técnica de Regresión Lineal es una técnica
de tipo cuantitativo que permite el cálculo de los pronósticos para períodos futuros, para lo cual
requiere de registros históricos que sean consistentes, reales y precisos, se investiga la relación
entre variables independientes y otras dependientes. A menudo la relación entre las dos variables
permite pronosticar con exactitud la variable dependiente a partir del conocimiento que se tiene de
la variable independiente. El modelo de la regresión lineal simple se investiga la relación entre una
variable independiente y otra dependiente, pero muchos escenarios de la vida real no son tan
simples y con frecuencia se necesita más de una variable independiente para pronosticar. Los
modelos con más de una variable independiente se llaman modelos de Regresión Lineal Múltiple
que contiene los conceptos básicos de la regresión lineal simple, pero encontraremos alguno
adicionales.

3
REGRESIÓN

1.1. CONCEPTO

Se define como un procedimiento mediante el cual se trata de determinar si existe o no


relación de dependencia entre dos o más variables. Es decir, conociendo los valores de una variable
independiente, se trata de estimar los valores, de una o más variables dependientes. La regresión
en forma gráfica, trata de lograr que una dispersión de las frecuencias sea ajustada a una línea recta
o curva. El análisis de regresión es una técnica estadística que puede utilizarse para desarrollar una
ecuación matemática que muestre como se relacionan las variables. En terminología de regresión,
la variable que se predice se conoce como variable dependiente o de respuesta la variable o
variables que predicen el valor de la variable dependiente se conocen como independientes o
predictores. (David, Dennis, & Thomas, 1999).
El análisis de regresión determina la relación entre una variable dependiente (por ejemplo,
la demanda de un artículo) y una variable independiente (por ejemplo, el tiempo). La fórmula
general de regresión entre la variable independiente x y la variable dependiente y es:
y * = a +bx

[Link] REGRESIÓN LINEAL

La regresión lineal es un modelo matemático que describe la relación entre varias variables. Los
modelos de regresión lineal son un procedimiento estadístico que ayuda a predecir el futuro. Se
utiliza en los campos científicos y en los negocios, y en las últimas décadas se ha utilizado en el
aprendizaje automático. La tarea de la regresión en el aprendizaje automático consiste en predecir
un parámetro (Y) a partir de un parámetro conocido X.

1.3. IMPORTANCIA

Los modelos de regresión lineal son muy populares en diversos campos de investigación
gracias a su rapidez y facilidad de interpretación.
Debido a su capacidad para transformar datos, pueden utilizarse para simular una amplia
gama de relaciones, y debido a su forma, que es más simple que la de las redes neuronales, sus

4
parámetros estadísticos se analizan y comparan con facilidad, lo que permite que se les extraiga
información valiosa.
La regresión lineal no sólo se utiliza con fines de predicción: también ha demostrado su
eficacia para describir sistemas. Si quieres modelar los valores de una variable numérica, tendrás
una lista relativamente corta de variables independientes y, como esperas que el modelo sea
comprensible, es probable que elijas la regresión lineal como herramienta de modelización.

1.4. TIPOS

Dependiendo de los objetivos del estudio, puedes elegir entre diversos tipos de análisis de
regresión:
1.4.1. Regresión Lineal Simple
La regresión lineal simple es un método estadístico que se utiliza para
analizar y modelar la relación entre dos variables: una variable dependiente
(también llamada variable de respuesta) y una variable independiente (también
conocida como variable explicativa). Su objetivo principal es establecer una
relación lineal entre estas dos variables y utilizarla para predecir o estimar el valor
de la variable dependiente en función de los valores de la variable independiente.
Esta relación se expresa como una línea recta. No es posible trazar una
línea recta que pase por todos los puntos de un gráfico si estos se encuentran
ordenados de manera caótica. Por lo tanto, sólo se determina la ubicación óptima
de esta línea mediante una regresión lineal. Algunos puntos seguirán distanciados
de la recta, pero esta distancia debe ser mínima. El cálculo de la distancia mínima
de la recta a cada punto se denomina función de pérdida.
La ecuación de una línea recta tiene la siguiente forma:
Y = β₀ + β₁X + ε,
donde:

Y es la variable independiente.
β₀ y β₁ son dos constantes desconocidas que representan el punto de
intersección y la pendiente respectivamente.
ε (epsilon) es la función de pérdida.

5
A continuación, se muestra un ejemplo gráfico de un modelo de una
regresión lineal simple:

Aplicación de la regresión lineal simple:


Para predecir la cosecha en función de la precipitación, con la
precipitación como variable independiente y la cosecha como variable
dependiente.
Para saber qué calificación obtendrán los alumnos en función del número
de horas que estudien: aquí la cantidad de horas de estudio representa la variable
independiente y las calificaciones, la dependiente.
Para prever el salario basado en la experiencia: la experiencia se convierte
en la variable independiente y el salario en la variable dependiente.
Limitaciones de la regresión lineal simple:
La regresión lineal simple establece que existe una relación entre las
variables, pero no revela una relación causal: Y depende de, pero no implica que
genere a Y.
Si necesitas establecer algo más que la existencia de una relación, tendrás
que hacer análisis adicionales.

6
1.4.2. Regresión Lineal Múltiple
La regresión lineal múltiple es un modelo de regresión en cual se incluyen
dos o más variables independientes. Es decir, la regresión lineal múltiple es un
modelo estadístico que permite relacionar varias variables explicativas con una
variable respuesta de manera lineal.
Por lo tanto, un modelo de regresión lineal múltiple sirve para encontrar una
ecuación que relacione dos o más variables independientes con una variable
dependiente. De forma que sustituyendo el valor de cada variable independiente se
obtiene una aproximación del valor de la variable dependiente.
Asimismo, la regresión lineal múltiple permite generar un modelo lineal en
el que el valor de la variable dependiente o respuesta (Y) se determina a partir de
un conjunto de variables independientes llamadas predictores (X1, X2, X3…). Es
una extensión de la regresión lineal simple, por lo que es fundamental comprender
esta última. Los modelos de regresión múltiple pueden emplearse para predecir el
valor de la variable dependiente o para evaluar la influencia que tienen los
predictores sobre ella (esto último se debe que analizar con cautela para no
malinterpretar causa-efecto).
Los modelos lineales múltiples siguen la siguiente ecuación:
Yi=(β0+β1X1i+β2X2i+⋯+βnXni)+ei
Donde:
 Y: es la variable dependiente.
 X: es una variable independiente.
 Β: son coeficientes.
 ε(epsilon): es la función de pérdida.

 β0: es la ordenada en el origen, el valor de la variable


dependiente Y cuando todos los predictores son cero.

 βi: es el efecto promedio que tiene el incremento en una


unidad de la variable predictora Xi sobre la variable
dependiente Y, manteniéndose constantes el resto de

7
variables. Se conocen como coeficientes parciales de
regresión.

 ei: es el residuo o error, la diferencia entre el valor observado


y el estimado por el modelo.

Es importante tener en cuenta que la magnitud de cada coeficiente parcial


de regresión depende de las unidades en las que se mida la variable predictor a la
que corresponde, por lo que su magnitud no está asociada con la importancia de
cada predictor. Para poder determinar qué impacto tienen en el modelo cada una de
las variables, se emplean los coeficientes parciales estandarizados, que se obtienen
al estandarizar (sustraer la media y dividir entre la desviación estándar) las variables
predictoras previo ajuste del modelo. A continuación, se muestra un ejemplo de
gráfico de un modelo de regresión lineal múltiple:

Supuestos De La Regresión Lineal Múltiple


En un modelo de regresión lineal múltiple, se deben cumplir los siguientes
requisitos para que el modelo tenga validez:
 Independencia: Los residuos deben ser independientes entre sí. Una manera
común de garantizar la independencia del modelo es añadiendo aleatoriedad
en el proceso de muestreo.

8
 Homocedasticidad: Debe haber homogeneidad en las varianzas de los
residuos, es decir, la variabilidad de los residuos debe ser constante.

 No multicolinealidad: Las variables explicativas incluidas en el modelo no


pueden estar relacionadas entre sí o, al menos, su relación debe ser muy
débil.

 Normalidad: Los residuos deben estar distribuidos normalmente, o, dicho


de otra forma, deben seguir una distribución normal de media 0.

 Linealidad: Se supone que la relación entre la variable respuesta y las


variables explicativas es lineal.

Interpretación de un modelo de regresión lineal múltiple


Para interpretar un modelo de regresión lineal múltiple debemos fijarnos en
el coeficiente de determinación (R cuadrado), el cual expresa el porcentaje
explicado por el modelo de regresión. De manera que cuanto mayor sea el
coeficiente de determinación, mejor ajustado estará el modelo a la muestra de datos
estudiada.
No obstante, la bondad de ajuste de un modelo estadístico puede ser
engañosa, especialmente en los modelos de regresión lineal múltiple. Ya que al
añadir cualquier variable al modelo el coeficiente de determinación aumenta,
aunque la variable no sea significativa. Sin embargo, debemos maximizar el
coeficiente de determinación intentando minimizar el número de variables, ya que
así el modelo es menos complicado y más fácil de interpretar.
Para solucionar este problema debemos calcular el coeficiente de
determinación ajustado (R cuadrado ajustado), que es un coeficiente estadístico que
mide la bondad de ajuste de un modelo de regresión penalizando por cada variable
añadida al modelo, a diferencia del coeficiente de determinación sin ajustar que no
tiene en cuenta el número de variables del modelo.
Así pues, el coeficiente de determinación ajustado nos permite comparar la
bondad de ajuste de dos modelos con un número de variables diferente. En
principio, debemos escoger el modelo que tiene un coeficiente de determinación
ajustado mayor, pero si los dos modelos tienen valores muy similares, es mejor

9
seleccionar el modelo con menor número de variables ya que es más fácil de
interpretar.
Por otro lado, los coeficientes de regresión indican la relación entre la
variable explicativa y la variable respuesta. Si el coeficiente de regresión es
positivo, la variable respuesta aumentará cuando la variable explicativa aumente.
Mientras que, si el coeficiente de regresión es negativo, la variable respuesta
disminuirá cuando la variable explicativa aumente.
Lógicamente, para que la condición anterior se cumpla las otras variables
deben permanecer constantes. Por eso es importante que no haya multicolinealidad
entre las diferentes variables explicativas del modelo.
Cómo analizar la regresión lineal múltiple en 4 pasos:
Al realizar los siguientes 4 pasos y se podrá leer investigaciones que
apliquen regresión lineal múltiple, y también podréis analizar datos usando la
regresión lineal múltiple, por tanto, seréis capaces de resolver preguntas
explicativas y comprobar relaciones o hipótesis de si A explica B. Por ejemplo,
¿qué factores explican los niveles de desigualdad de un país? ¿Qué variables
explican la opinión respecto a la inmigración? ¿Son las variables religiosas, las
variables políticas, o las variables sociodemográficas las que explican en mayor
medida la opinión respecto al aborto?
Los dos primeros pasos hacen referencia a la bondad del modelo, es decir,
si el conjunto de variables independientes (explicaciones) se relacionan con la
variable dependiente (resultado)
1. Significación de F-test: si es menor de 0,05 es que el modelo es
estadísticamente significativo y por tanto las variables independientes
explican “algo” la variable dependiente, cuánto “algo” es la R-cuadrado.
2. R cuadrado: es cuánto las variables independientes explican la variable
dependiente, indica el porcentaje de la varianza de la variable dependiente
explicado por el conjunto de variables independientes. Cuanto mayor sea la
R-cuadrado más explicativo y mejor será el modelo explicativo.

Los dos siguientes pasos hacen referencia a la influencia de cada una de las
variables independientes:

10
3. Significación de t-test: si es menor de 0,05 es que esa variable independiente
se relaciona de forma significativa con la variable dependiente, por tanto,
influye sobre ella, es explicativa, ayuda a predecirla.
4. Coeficiente beta (β): indica la intensidad y la dirección de la relación entre
esa variable independiente (VI) y la variable dependiente (VD):
 Cuanto más se aleja de 0 más fuerte es la relación
 El signo indica la dirección (signo + indica que al aumentar los valores de
la VI aumentan los valores de la VD; signo – indica que al aumentar los
valores de la VI, los valores de la VD descienden).

ANÁLISIS DE REGRESIÓN MÚLTIPLE

Dispone de una ecuación con dos variables independientes adicionales:

Se puede ampliar para cualquier número "m" de variables independientes:

Para poder resolver y obtener y en una ecuación de regresión


múltiple el cálculo se presenta muy tediosa porque se tiene atender 3 ecuaciones
que se generan por el método de mínimo de cuadrados:

11
Para poder resolver se puede utilizar programas informáticos como AD+,
SPSS y Minitab y Excel.

 El error estándar de la regresión múltiple

Es una medida de dispersión la estimación se hace más precisa conforme el


grado de dispersión alrededor del plano de regresión se hace más pequeño.

Para medirla se utiliza la fórmula:

Y: Valores observados en la muestra

: Valores estimados a partir a partir de la ecuación de regresión

n: Número de datos

m: Número de variables independientes

 El coeficiente de determinación múltiple

Mide la tasa porcentual de los cambios de Y que pueden ser explicados por ,

y simultáneamente.

 El Error Estándar de Regresión Múltiple

12
Mediante esta medida de dispersión se hace más preciso el grado de dispersión
alrededor del plano de regresión, se hace más pequeño.

Para calcularla se utiliza la formula siguiente:

En los resultados de Excel se llama error típico y para explicar la relación del
aprendizaje de PHP que se viene desarrollando es de 0.861

13
CONCLUSIÓN

La regresión lineal describe la relación entre varias variables: la variable dependiente y una
o varias variables independientes. Por su rapidez de creación y su facilidad de interpretación, los
modelos de regresión lineal se han utilizado con éxito en diversos ámbitos, desde la medicina hasta
la agronomía, tanto para hacer previsiones como para describir sistemas. Existen programas
gratuitos que explican cómo hacer para que aplicar el análisis de regresión sea fácil y eficaz.

La regresión lineal y la regresión lineal múltiple son herramientas fundamentales en el


análisis de datos y en la modelización de relaciones entre variables.

Por un lado, la Regresión Lineal Simple es una de las técnicas más simples y fáciles de
comprender en el análisis de datos. Se utiliza cuando se busca establecer una relación lineal entre
una variable dependiente y una variable independiente.

Mientras que la Regresión Lineal Múltiple permite modelar la relación entre una variable
dependiente y múltiples variables independientes y es debido a esto que es más compleja que la
regresión lineal simple. Requiere técnicas estadísticas adicionales para estimar los coeficientes.

En conclusión, la regresión lineal simple es adecuada cuando se investiga la relación entre


dos variables, y es fácil de entender y aplicar. La regresión lineal múltiple, por otro lado, es más
adecuada cuando se deben considerar múltiples factores que pueden afectar la variable dependiente
y es más flexible en la modelización de relaciones complejas. Ambas técnicas son esenciales en
estadística y análisis de datos, y la elección entre una u otra depende de la complejidad y los
objetivos de tu análisis.

14
BIBLIOGRAFÍA

Cardenas, J. (2019, octubre 26). Qué es la Regresión Lineal Multiple y cómo analizarla.
Networkianos. Blog de Sociología. [Link]

Estadística, P. y. (2023, marzo 8). Regresión lineal múltiple. Probabilidad y Estadística.


[Link]

Rodrigo, J. A. (s/f). Introducción a la Regresión Lineal Múltiple. Cienciadedatos, de


[Link]

Saavedra, J. A. (2022, septiembre 16). Regresión Lineal: qué es, para qué sirve, por qué es
importante, tipos y ejemplos de uso. Ebac. [Link]

15

También podría gustarte