Rosibel Cordero C.I.
27649139
Fecha 9/7/2023
Verdadero y Falso
a. (5 ptos) En un modelo de regresión β1 representa el valor medio de la respuesta Y cuando la
variable explicativa X vale 0 . Justifique su respuesta.
El el coeficiente β1 representa el cambio promedio en la respuesta Y por cada unidad de cambio en la
variable explicativa X y se mantiene constante todas las demás variables explicativas.
Sabiendo esto, el valor medio de Y cuando X vale 0 depende del valor del coeficiente de intersección (β0)
Entonces, si decimos que β1 es el valor medio de la respuesta Y cuando X vale 0 podría ser incorrecto. El
valor medio de Y cuando X es igual a cero dependerá tanto de β1 como de β0 en el modelo de regresión.
En conclusión, El valor medio de Y cuando X vale 0 depende de la distribución de los datos y otros
coeficientes del modelo.
b. (5 ptos) Si la hipótesis de homocedasticidad, esto es, Var(εi ) = σ2 para todo i, no se verifica.
Considera que las varianzas de los parámetros estimados (β0 y β1) estén correctas?. (F) Justifique su
respuesta.
Los errores pueden tener una varianza que varía con el valor de X, lo que puede afectar la precisión de las
estimaciones de los coeficientes.
Si la hipótesis de homocedasticidad no se cumple, lo cual implica que la varianza del término de error (εᵢ)
no es constante para todos los valores de la variable explicativa (X), entonces las varianzas de los
parámetros estimados (β₀ y β₁) pueden no estar correctas.
si la hipótesis de homocedasticidad no se verifica y hay heterocedasticidad presente en los datos, las
varianzas de los parámetros estimados (β₀ y β₁) pueden no ser correctas y las estimaciones de los
coeficientes pueden verse afectadas y esto no garantiza un resultado optimo si no con mucha ineficiencia.
Rosibel Cordero C.I. 27649139
SE ADJUNTA EL SCRIPT POR CORREO O
Fecha 9/7/2023
PLATAFORMA A USAR
EJERCICIO 1
En su tesis para obtener el Doctorado, H. Behbahani estudió el efecto de la variación de la razón agua/cemento en la resistencia del concreto después
de 28 días. Para el concreto que contiene 200 libras por yarda cúbica de cemento obtuvo los datos que se presentan en la tabla. Si la variable Y es la
resistencia. Responda lo siguiente:
a) (2 ptos) Realice un gráfico de dispersión. Justifique usando y analice el gráfico.
Se observa un comportamiento en Residuals vs Fitted: Una
desviación un tanto irregular, por lo tanto, no hay
HOMOCEDASTICIDAD.
Se observa en Normal Q-Q: Un comportamiento en forma de S en
los errores al dibujarlos sobre los cuantiles teóricos de la
Distribución Normal, por tanto, no hay Normalidad.
b) (3 ptos) Considera que existe una relación lineal entre las variables?. Utilice un α = 0.05. Explique qué significa la relación.
El 0.0003791 p-value asociado a la prueba es menor que 0.05, se rechazar H₀ y concluimos que existe una relación lineal
significativa entre las variables. La relación lineal negativa entre las variables significa que a medida que la razón agua/cemento
aumenta, la resistencia del concreto tiende a disminuir. En este caso, cuanto mayor sea la razón agua/cemento, menor será la
resistencia del concreto después de 28 días. Esto indica una relación inversa entre estas dos variables.
c) (5 ptos) Encuentre el modelo lineal qué mejor se ajuste a los datos.
Y= 2.56 - 1.05*X + εi
d) (3 ptos) Encuentre un intervalo de confianza de 90% de la resistencia esperada de concreto cuando la razón agua/cemento es de 1.5
e) (2 ptos) ¿Qué pasa con el intervalo de confianza anterior si tratamos de estimar la resistencia media para razones de agua/cemento de 0.3 ó 2.7?
Si tratamos de estimar la resistencia media para razones de agua/cemento de 0.3 ó 2.7, estaríamos extrapolando más allá del rango de valores
observados en los datos. y ademas como bien indica el ejercicio si lo llevamos a la práctica, si la razón agua/cemento aumenta demasiado, el
concreto no servirá.
Rosibel Cordero C.I. 27649139
Fecha 9/7/2023
2. (10 ptos) Se lleva a cabo un experimento para determinar si el peso de un animal se puede predecir después de un
tiempo dado sobre la base del peso inicial del animal y la cantidad de alimento que consume. La regresión de los datos se
realizó en el paquete R, obteniéndose los siguientes resultados:
a. (2 ptos) Encuentre la ecuación de regresión múltiple.
Y= -22,99 + 1.39*X1 + 0.22*X2 + εi
b) (3 ptos) Considera que el modelo es significativo estadísticamente, es decir, explica bien los datos?. Justifique numéricamente su respuesta. Use nivel de significancia igual a 0.05.
El valor p asociado a la prueba es menor que 0.05, se rechazar H₀ y concluimos que el coeficiente es significativo. y por tanto significante estadisticamente ademas que R² es un valor
más cercano a 1, por tanto, tiene mejor ajuste y ademas se puede ver que probabilidad alta de R cuadrado Ajustado, lo que indica la regresión es MUY PROBABLE cumpla los supuestos
de homocedasticidad y/o normalidad.
c) (3 ptos) ¿Cuál será el peso final esperado de un animal que pueda tener un peso inicial de 35 kg y se alimenta con 250 kg de comida?
Y= -22.99 + 1.39*35 + 0.22*250 = 80,66 Kg aproximadamente
d) (2 ptos) Si los errores o residuos se grafican sobre papel probabilístico normal qué puede decir de ellos?. Considera que el modelo supera todos los supuestos?. ¿Por qué?
Observando en Residuals vs Fitted obtenemos un patrón de desviación muy debil en los errores residuales del modelo ajustado obteniendo una HOMOCEDASTCIDAD y en
normal Q-Q observamos una NORMALIDAD dado que los errores al dibujarlos sobre los cuantiles teóricos de la Distribución Normal, se ajustan casi perfecto a la recta de
Normalidad, por tanto, hay Normalidad, CONCLUIMOS QUE PODEMOS USARLO COMO MODELO PREDICTOR.