NOMBRE DE LA ESCUELA: INSTITUTO TECNOLOGICO DE ALTAMIRA
NOMBRE DE LA CARRERA: SISTEMAS COMPUTACIONALES
GRUPO: 2 SEMESTRE
NOMBRE DE LA ASIGNATURA: probabilidad y estadística
NOMBRE DEL TEMA: regresión lineal
NOMBRE DEL DOCENTE: Angela Liliana castillo flores
NOMBRE DEL ESTUDIANTE: JULIO CESAR VAZQUEZ SANCHEZ
NUMERO DE CONTROL: 24820160
LUGAR: ALTAMIRA
FECHA: 30/05/2025
Investigación Teórica sobre la Regresión Lineal
1. Definición
La regresión lineal es una técnica estadística utilizada para modelar la relación entre una
variable dependiente (también llamada respuesta) y una o más variables independientes
(también llamadas predictoras), asumiendo que esta relación puede aproximarse mediante
una línea recta.
• En el caso de una sola variable independiente, se habla de regresión lineal
simple.
• Cuando hay más de una variable independiente, se trata de regresión lineal
múltiple.
2. Modelo Matemático
• Regresión lineal simple:
• Regresión lineal múltiple:
Donde:
• yyy: variable dependiente
• xix_ixi: variables independientes
• β0\beta_0β0: intercepto
• βi\beta_iβi: coeficientes de regresión
• ε\varepsilonε: error aleatorio
3. Supuestos del Modelo
Para que los resultados de la regresión lineal sean válidos, se deben cumplir los siguientes
supuestos:
1. Linealidad: la relación entre variables independientes y dependiente es lineal.
2. Independencia de errores: los errores son independientes entre sí.
3. Homocedasticidad: la varianza de los errores es constante.
4. Normalidad de los errores: los errores se distribuyen normalmente.
5. No multicolinealidad (en regresión múltiple): las variables independientes no
deben estar altamente correlacionadas entre sí.
4. Métodos de Estimación
El método más común para estimar los parámetros (βi\beta_iβi) es el método de los
mínimos cuadrados ordinarios (OLS), que minimiza la suma de los cuadrados de los
errores:
5. Aplicaciones
La regresión lineal se aplica en múltiples campos, entre ellos:
• Economía: para predecir precios, inflación, etc.
• Biología: para estudiar relaciones entre variables fisiológicas.
• Ingeniería: para modelar comportamientos físicos.
• Negocios: para prever ventas o ingresos.
• Educación: para analizar el rendimiento académico.
6. Evaluación del Modelo
Algunos indicadores para evaluar la calidad del modelo son:
• R2R^2R2 (Coeficiente de determinación): indica qué proporción de la
variabilidad de yyy es explicada por las variables independientes.
• Error estándar de los coeficientes
• Valor p (p-value): para evaluar la significancia estadística de los coeficientes.
• Análisis de residuos: para verificar la validez de los supuestos.
7. Ventajas
• Fácil de interpretar.
• Computacionalmente eficiente.
• Base para otros métodos más complejos.
8. Limitaciones
• No captura relaciones no lineales.
• Sensible a valores atípicos (outliers).
• Depende del cumplimiento estricto de los supuestos.
Conclusión
La regresión lineal es una herramienta fundamental en el análisis de datos y la estadística.
A pesar de sus limitaciones, su simplicidad y capacidad explicativa la convierten en un
primer paso valioso en la modelización de relaciones entre variables. Sin embargo, para
problemas más complejos, puede ser necesario aplicar modelos no lineales o métodos más
robustos como la regresión logística o el aprendizaje automático.