¿Qué es la regresión lineal?
La regresión lineal es una técnica de análisis de datos que predice el valor de datos
desconocidos mediante el uso de otro valor de datos relacionado y conocido. Modela
matemáticamente la variable desconocida o dependiente y la variable conocida o
independiente como una ecuación lineal. Por ejemplo, supongamos que tiene datos
sobre sus gastos e ingresos del año pasado. Las técnicas de regresión lineal analizan
estos datos y determinan que tus gastos son la mitad de tus ingresos. Luego calculan
un gasto futuro desconocido al reducir a la mitad un ingreso conocido futuro.
¿Por qué es importante la regresión lineal?
Los modelos de regresión lineal son relativamente simples y proporcionan una fórmula
matemática fácil de interpretar para generar predicciones. La regresión lineal es una
técnica estadística establecida y se aplica fácilmente al software y a la computación.
Las empresas lo utilizan para convertir datos sin procesar de manera confiable y
predecible en inteligencia empresarial y conocimiento práctico. Los científicos de
muchos campos, incluidas la biología y las ciencias del comportamiento, ambientales y
sociales, utilizan la regresión lineal para realizar análisis de datos preliminares y
predecir tendencias futuras.
¿Cómo funciona la regresión lineal?
En esencia, una técnica de regresión lineal simple intenta trazar un gráfico lineal entre
dos variables de datos, x e y. Como variable independiente, x se traza a lo largo del
eje horizontal. Las variables independientes también se denominan variables
explicativas o variables predictivas. La variable dependiente, y, se traza en el eje
vertical. También puede hacer referencia a los valores y como variables de respuesta
o variables pronosticadas.
Pasos en la regresión lineal
Para esta visión general, tenga en cuenta la forma más simple de la ecuación de
gráfico de líneas entre y y x; y=c*x+m, donde c y m son constantes para todos los
valores posibles de x e y. Así, por ejemplo, supongamos que los datos de entrada
para (x, y) era (1,5), (2,8) y (3,11). Para identificar el método de regresión lineal, debe
seguir los siguientes pasos:
Trace una línea recta y mida la correlación entre 1 y 5.
- Siga cambiando la dirección de la línea recta para los nuevos valores (2,8) y
(3,11) hasta que se ajusten todos los valores.
- Identifique la ecuación de regresión lineal como y = 3*x + 2.
- Extrapola o predice que y es 14 cuando x es
¿Cuáles son los tipos de regresión lineal?
Algunos tipos de análisis de regresión son más adecuados que otros para gestionar
conjuntos de datos complejos. A continuación, se muestran algunos ejemplos.
Regresión lineal simple
La regresión lineal simple se define mediante la función lineal:
Y= β0*X + β1 + ε
β0 y β1 son dos constantes desconocidas que representan la pendiente de regresión,
mientras que ε (épsilon) es el término de error.
Puede utilizar la regresión lineal simple para modelar la relación entre dos variables,
como las siguientes:
Lluvia y rendimiento de los cultivos
Edad y estatura en niños
Temperatura y expansión del mercurio metálico en un termómetro
Regresión lineal múltiple
En el análisis de regresión lineal múltiple, el conjunto de datos contiene una variable
dependiente y múltiples variables independientes. La función de línea de regresión
lineal cambia para incluir más factores, de la siguiente manera:
Y = β0*x0 + β1x1 + β2x2+…… βNxN+ ε
A medida que aumenta el número de variables predictivas, las constantes β también
aumentan en consecuencia.
La regresión lineal múltiple modela múltiples variables y su impacto en un resultado:
Lluvia, temperatura y uso de fertilizantes en el rendimiento de los cultivos
Dieta y ejercicio sobre enfermedades cardíacas
Crecimiento salarial e inflación en las tasas de préstamos hipotecarios
Regresión logística
Los científicos de datos utilizan la regresión logística para medir la probabilidad de que
se produzca un evento. La predicción es un valor entre 0 y 1, donde 0 indica un evento
que es poco probable que ocurra y 1 indica una probabilidad máxima de que suceda.
Las ecuaciones logísticas usan funciones logarítmicas para calcular la línea de
regresión.