Universidad de Córdoba
Departamento de matemáticas y estadísticas
Programa:
Estadística
Presentado por:
Linda Marcela Solarte lopez
Marlin Morelo Marimon
Wendy Soto Acosta
Presentado a:
Roger Jesus Tovar Falon
2024
Córdoba
Respuesta:
Ajuste del modelo polinómico de diferentes grados
model1 <- lm(y ~ x)
model2 <- lm(y ~ poly(x2))
model3 <- lm(y ~ poly(x3))
model4 <- lm(y ~ poly(x4))
Ahora se comparan los modelos usando ANOVA
Res.Df RSS Df Sum of sq F Pr(>F)
1 10 0.49380
2 9 0.32080 1 0.172999 8.0655 0.02505*
3 8 0.17574 1 0.145057 6.7628 0.03540*
4 7 0.15014 1 0.025595 1.1933 0.31083
• Model1 (y ~ x):
Este es el modelo de regresión lineal simple.
Res.Df: Grados de libertad residuales, que es 10.
RSS: Suma de cuadrados de los residuos, que es 0.49380.
No se presentan estadísticas F ni p-values porque no hay términos polinomiales
adicionales en este modelo para comparar.
• Model2 <- lm(y ~ poly(x2))
Este modelo ajusta una regresión polinomial de segundo grado (cuadrática).
Se observa que tiene un p-value significativo (0.02505), lo que indica que el modelo
cuadrático es significativamente mejor que el modelo lineal simple (Modelo 1).
Esto se basa en una prueba F con 1 grado de libertad en el numerador y 9 grados de
libertad en el denominador.
• Model3 (y ~ poly(x3))
Este modelo ajusta una regresión polinomial de tercer grado (cúbica).
También muestra un p-value significativo (0.03540), indicando que el modelo cúbico es
significativamente mejor que el modelo lineal simple (Modelo 1) y que el modelo
cuadrático (Modelo 2).
La prueba F tiene 1 grado de libertad en el numerador y 8 grados de libertad en el
denominador.
• Model4 (y ~ poly(x4))
Este modelo ajusta una regresión polinomial de cuarto grado.
El p-value (0.31083) no es significativo (mayor que 0.05), lo que indica que el modelo
polinomial de cuarto grado no mejora significativamente sobre el modelo lineal simple
(Modelo 1), el modelo cuadrático (Modelo 2), ni el modelo cúbico (Modelo 3).
La prueba F tiene 1 grado de libertad en el numerador y 7 grados de libertad en el
denominador.
Interpretación general:
Los modelos polinomiales de segundo y tercer grado (Modelos 2 y 3) son
significativamente mejores que el modelo lineal simple (Modelo 1).
El modelo polinomial de cuarto grado (Modelo 4) no muestra una mejora significativa
sobre los modelos anteriores en términos de ajuste.
Esto sugiere que un modelo cúbico podría ser adecuado para describir la relación entre
𝑦 y x, ya que tiene un p-value bajo y un valor F significativo comparado con los otros
modelos evaluados.
El mejor modelo ajustado es: Model3(y ~ poly(x3))
Resumen del mejor modelo.
Coefficients
Estimate Std. error T value Pr(>|t|)
(Intercept) -1.101877 0.413479 -2.665 0.02859*
Poly(x3) 1.503809 0.376079 3.999 0.00396**
Poly(x3) -0.266255 0.093133 -2.859 0.02119
Poly(x3) 0.017159 0.006677 2.570 0.03314*
Coeficientes del modelo ajustado Model3(y ~ poly(x3))
(Intercept) poly(x3) 1 poly(x3)2
-1.10187720 1.50380891 -0.26625509
poly(x3)3
0.01715897
Tablas ANOVA individuales
• Model1 (y ~ x):
Response: y
Df Sum sq Mean sq F value Pr(>F)
X 1 7.4685 7.4685 151.25 2.318e-07 ***
Residuals 10 0.4938 0.0494
• Model2<- lm(y ~ poly(x2))
Response: y
Df Sum sq Mean sq F value Pr(>F)
Poly(x2) 2 7.6415 3.8207 107.19 5.289e-07 ***
Residuals 9 0.3208 0.0356
• Model3 (y ~ poly(x3))
Response: y
Df Sum sq Mean sq F value Pr(>F)
Poly(x3) 3 7.7866 2.59552 118.15 5.788e-07 ***
Residuals 8 0.1757 0.02197
• Model4 (y ~ poly(x4))
Response: y
Df Sum sq Mean sq F value Pr(>F)
Poly(x4) 4 7.8121 1.95304 91.054 4.083e-06 ***
Residuals 7 0.1501 0.02145
Respuesta:
Ajuste del modelo de regresión
Y=calidad~ sabor+ region
RESUMEN DEL MODELO
Coefficients
Estimate Std. Error T value Pr(>|t|)
(intercept) 7.4276 1.0370 7.163 1.66e-07***
Sabor 1.0545 0.2316 4.554 0.000119***
Region2 -1.5622 0.4794 -3.258 0.003219**
Region3 1.2406 0.5373 2.309 0.029483
ANOVA DEL MODELO
Response Calidad
Df Sum sq Mean sq F value Pr(>F)
Sabor 1 79.213 79.213 77.571 3.896e-09***
Región 2 27.037 13.519 13.239 0.00012***
Residual 25 25.529 1.021
COEFICIENTES DEL MODELO
Estimates Std. Error T value Pr(>|t|)
(Intercept) 7.427641 1.0370164 7.162510 1.699114e-07
Sabor 1.054544 0.2315852 4.553592 1.185246e-04
Region2 -1.562182 0.4794250 -3.258449 3.218882e-03
Region3 1.240629 0.5372667 2.309150 2.948271e-02
Interpretación de los coeficientes
Intercepto: 7.427641 Este es el valor esperado de la calidad del vino cuando las variables tanto el
sabor como la región son cero. En términos prácticos, representa la calidad base del vino cuando
todas las demás variables se mantienen constantes en sus valores de referencia.
Coeficiente para sabor: 1.054544 Indica el cambio esperado en la calidad del vino por cada unidad
de cambio en el sabor del vino , manteniendo constante la región. Un valor positivo como este
sugiere que un aumento en el sabor está asociado con una mejora en la calidad del vino.
Coeficiente para región2 : -1.562182. Representa el cambio esperado en la calidad del vino al
pasar de una región de referencia a otra, manteniendo constante el sabor del vino. En este caso,
no es estadísticamente significativo, lo que sugiere que no hay evidencia suficiente para afirmar
que la región geográfica tenga un impacto significativo en la calidad del vino.
En conclusión: mientras que el sabor del vino tiene un impacto significativo en su calidad, no hay
suficiente evidencia para afirmar que la región geográfica de procedencia tenga un efecto
significativo en la calidad del vino Pinot Noir