ESCUELA PREPARATORIA OFICIAL NU.
25
Temas selectos de Matemáticas
REGRESIONES
Mínimos Cuadrados y
Disminución del Error
___
Mendoza González Cynthia Pamela
Segundo-uno
2
INTRODUCCIÓN
La regresión es una herramienta estadística que se utiliza para predecir el comportamiento de una
variable a partir de otra. Es especialmente útil cuando queremos conocer la relación entre dos
variables numéricas, como la edad y el ingreso, o el tiempo de estudio y el resultado en un examen.
Entre los métodos más utilizados para ajustar datos está el método de mínimos cuadrados, el cual
busca encontrar una línea (modelo) que minimice los errores al predecir valores. Comprender estos
métodos ayuda a interpretar datos reales y tomar decisiones fundamentadas.Estructura de la célula
La regresión lineal es un modelo matemático que busca establecer una relación lineal entre dos
variables. Se representa con la ecuación de una recta:
1. ¿QUE ES LA REGRESIÓN?
La regresión lineal es un modelo matemático que busca establecer una relación lineal entre dos
variables. Se representa con la ecuación de una recta:
y=mx+b
Donde:
y: variable dependiente (lo que queremos predecir)
x: variable independiente (lo que conocemos)
m: pendiente de la recta (indica cuánto cambia yyy cuando xxx aumenta)
b: ordenada al origen (el valor de yyy cuando x=0x = 0x=0)
2. Método de Mínimos Cuadrados
Este método consiste en encontrar la recta que minimiza la suma de los cuadrados de los
errores, es decir, las diferencias entre los valores observados y los predichos por la recta.
Error cuadrático:Se escoge la línea que hace que esta suma de errores sea la más pequeña
posible.
3
3.Disminución del Error
La disminución del error se logra ajustando correctamente la recta para que los puntos estén lo
más cerca posible de ella. Cuanto más pequeños sean los errores, mejor es el modelo predictivo.
Una manera de evaluar esto es usando el coeficiente de determinación R², que va de 0 a 1:
● R²=1: ajuste perfecto.
● R²=0: no hay relación.
4. Conclusión
La regresión lineal mediante el método de mínimos cuadrados es una técnica eficaz para
modelar relaciones entre variables. Al minimizar el error cuadrático, se logra una mayor
precisión en las predicciones. Este conocimiento es útil no solo en matemáticas, sino también
en economía, física, psicología, y más.
Referencias Bibliográficas
Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression
Analysis. Wiley.
Larson, R., & Farber, B. (2014). Estadística Aplicada. Cengage Learning.
Triola, M. F. (2015). Estadística. Pearson.
Khan Academy. (s.f.). Regresión lineal. https://es.khanacademy.org
4
✅ REGRESIÓN: CONCEPTO Y APLICACIÓN
La regresión es una técnica que permite analizar la relación entre variables. Su uso más común
es predecir una variable (dependiente) a partir de otra (independiente).
Ejemplos cotidianos:
¿Cuánto ganará una persona según sus años de experiencia?
¿Qué calificación obtendrás según cuántas horas estudies?
📐 REGRESIÓN LINEAL SIMPLE
Es la más básica y útil para comenzar. Consiste en ajustar una recta a un conjunto de puntos
dispersos en un plano cartesiano.
🔹 Fórmula general:
y=mx+b
m: pendiente (indica cuánto crece o decrece y por cada unidad de x)
b: intersección con el eje Y (cuando x = 0, qué valor tiene y)
🔍 MÉTODO DE MÍNIMOS CUADRADOS
Es el procedimiento matemático para encontrar la recta que mejor se ajusta los puntos. Busca
minimizar el "error cuadrático".
❗ ¿Qué es el error?
El error es la diferencia entre el valor real y el valor que predice el modelo.
🔢 Cálculo:
Para los datos (x_1, y_1), (x_2, y_2), ..., (x_n, y_n), se calcula la recta que minimiza esta
expresión:
\sum_{i=1}^{n} (y_i - (mx_i + b))^2
5
Es decir, suma los errores al cuadrado para evitar que se cancelen los positivos y negativos, y así
obtener el modelo más preciso posible.
⚙️ CÁLCULO PASO A PASO DEL MÉTODO
Supongamos este conjunto de datos:
| Horas (x) | Calificación (y) |
| --------- | ---------------- |
|1 | 52 |
|2 | 63 |
|3 | 70 |
|4 | 78 |
|5 | 85 |
✏️ Paso 1: Calcular promedios
\bar{x} = \frac{1+2+3+4+5}{5} = 3, \quad \bar{y} = \frac{52+63+70+78+85}{5} = 69.6
✏️ Paso 2: Calcular m (pendiente)
m = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}
m = \frac{(1-3)(52-69.6)+(2-3)(63-69.6)+(3-3)(70-69.6)+...}{(1-3)^2+(2-3)^2+(3-3)^2+...}
m = \frac{(−2)(−17.6) + (−1)(−6.6) + (0)(0.4) + (1)(8.4) + (2)(15.4)}{4 + 1 + 0 + 1 + 4} = \frac{35.2 +
6.6 + 0 + 8.4 + 30.8}{10} = \frac{81}{10} = 8.1
# ✏️ Paso 3: Calcular $b$ (intersección)
b = \bar{y} - m\bar{x} = 69.6 - (8.1)(3) = 69.6 - 24.3 = 45.3
✅ Recta de regresión:
6
y = 8.1x + 45.3
Esto quiere decir que por cada hora de estudio, la calificación sube en promedio **8.1 puntos**,
comenzando desde 45.3 cuando no se estudia.
📈 GRÁFICA
```plaintext
Calificación (y)
100 ┤ ● (5, 85)
90 ┤ ● (4, 78)
80 ┤ ● (3, 70)
70 ┤ ● (2, 63)
60 ┤ ● (1, 52)
50 ┼─────────────────────────────────────────►
0 1 2 3 4 5 6 Horas (x)
Recta: y = 8.1x + 45.3
La línea pasa cerca de todos los puntos, lo cual indica que es una buena estimación.
7
📊 COEFICIENTE DE DETERMINACIÓN $R^2$
Sirve para medir qué tan buena es la regresión. Su valor está entre 0 y 1:
R^2 = 1$: ajuste perfecto.
R^2 = 0$: sin ajuste.
Un $R^2$ de 0.95 (por ejemplo) indica que **el 95% de la variación en la calificación se explica
por el tiempo de estudio**.
🧠 APLICACIONES DE LA REGRESIÓN EN LA VIDA REAL
Medicina: predecir la presión arterial según la edad.
Educación: predecir el rendimiento por horas de estudio.
Economía: prever gastos según ingresos.
Física: modelos de caída libre, velocidad vs. tiempo.
Ingeniería: relación entre fuerza y deformación.
📚 REFERENCIAS BIBLIOGRÁFICAS
1. Montgomery, D. C., & Runger, G. C. (2014). *Probabilidad y Estadística Aplicadas a la
Ingeniería*. McGraw-Hill.
2. Triola, M. F. (2015). *Estadística*. Pearson Educación.
3. Khan Academy. (s.f.). *Introducción a la regresión lineal*. Recuperado de:
[https://es.khanacademy.org](https://es.khanacademy.org)
4. Instituto Nacional de Estadística y Geografía (INEGI). Estadística básica
[https://www.inegi.org.mx](https://www.inegi.org.mx)
8
🔍 Origen e Historia del Método de Mínimos Cuadrados
El **método de los mínimos cuadrados** fue desarrollado de forma independiente por **Carl
Friedrich Gauss** y **Adrien-Marie Legendre** a principios del siglo XIX.
* **Legendre** lo publicó en 1805 en su obra *Nouvelles méthodes pour la détermination des
orbites des comètes*.
* **Gauss** afirmó haberlo utilizado desde 1795 para predecir la órbita del asteroide Ceres.
Fue un paso revolucionario para el análisis de datos en astronomía y después se extendió a
muchas otras áreas científicas.
🧮 Fundamento Matemático del Método
El ajuste por mínimos cuadrados se basa en minimizar una función cuadrática, lo cual garantiza
que tiene un mínimo único. La derivación de las fórmulas de la pendiente y ordenada se puede
hacer mediante cálculo diferencial derivando la función de error con respecto a m y b y
resolviendo el sistema de ecuaciones que resulta.
📌 Fórmulas Generales Estas fórmulas permiten calcular la recta óptima sin necesidad de
derivación.
9
📊 Tipos de Regresión
Además de la regresión lineal simple, existen otros tipos útiles según el número de variables o
la forma de la relación:
1. Regresión lineal múltiple
Cuando hay más de una variable independiente.
Ejemplo:
y = b_0 + b_1x_1 + b_2x_2 + ... + b_nx_n
Podría predecir la calificación según horas de estudio, horas de sueño y asistencia a clase.
2. Regresión no lineal
Cuando la relación entre las variables **no forma una recta**, sino una curva.
Ejemplo:
y = a e^{bx} \quad \text{o} \quad y = ax^2 + bx + c
3. Regresión logística*
Usada cuando la variable dependiente es **categórica** (por ejemplo: sí o no, aprobado o
reprobado).
📘 Interpretación de Resultados
Coeficientes
Pendiente (m): indica cuánto cambia la variable dependiente por cada unidad que cambia la
independiente.
*Intersección (b): valor inicial de la variable dependiente cuando x = 0$.
10
Signo de la pendiente
* Si **m > 0**, hay una relación **positiva**: cuando $x$ sube, $y$ sube.
* Si **m < 0**, la relación es **negativa**: cuando $x$ sube, $y$ baja.
🛠️ Software y Herramientas para calcular regresión
● Puedes usar muchas herramientas para realizar regresión lineal:
● Excel:usa la función `TENDENCIA()` o crea un gráfico con línea de tendencia.
● GeoGebra:util para graficar y ver resultados visuales rápidamente.
● Desmos: aplicación en línea muy visual.
● Python (con librerías como NumPy, SciPy, scikit-learn)
🧪 Ejemplo de interpretación real (Educación)
Supón que la regresión nos da:
{Calificación} = 7.2 \cdot ({horas de estudio}) + 43
Interpretación:
Cada hora relaciones adicional de estudio mejora en promedio **7.2 puntos** la calificación.
Una persona que no estudie (0 horas) tendría una predicción base de **43 puntos**.
📏 Limitaciones de la Regresión Lineal
No funciona bien si los datos tienen no lineales..
Es sensible a valores atípicos (datos que se alejan mucho del resto).
No implica causalidad, solo correlación