0% encontró este documento útil (0 votos)
392 vistas11 páginas

Proyecto Final Bioestadistica

Este documento presenta un análisis de regresión lineal simple para determinar la relación entre el peso y la circunferencia del pecho en 66 ovejas. Se calculan e interpretan el diagrama de dispersión, las estimaciones y ecuación de regresión, el coeficiente de correlación, los intervalos de confianza, la tabla ANOVA, y varias gráficas de residuales para validar el modelo. Los resultados muestran una fuerte correlación positiva entre el peso y la circunferencia del pecho de las ovejas.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
392 vistas11 páginas

Proyecto Final Bioestadistica

Este documento presenta un análisis de regresión lineal simple para determinar la relación entre el peso y la circunferencia del pecho en 66 ovejas. Se calculan e interpretan el diagrama de dispersión, las estimaciones y ecuación de regresión, el coeficiente de correlación, los intervalos de confianza, la tabla ANOVA, y varias gráficas de residuales para validar el modelo. Los resultados muestran una fuerte correlación positiva entre el peso y la circunferencia del pecho de las ovejas.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE

PUEBLA.

FACULTAD DE MEDICINA VETERINARIA Y ZOOTECNIA.

MVZ. Huitzimengari Campos García.

Bioestadística Veterinaria.

Proyecto final.

Alumno: Huitzil Flores Karim


Indicaciones.
La evaluación del tercer parcial y trabajo final constará de la solución en el programa estadístico R de
un análisis de regresión lineal simple. Para lo anterior se plantea el siguiente problema: de vez en
cuando es necesario estimar el peso de las ovejas, por ejemplo, para asignar la dosis de un
medicamento o para predecir las fechas de mercado. Desafortunadamente pesar las ovejas es difícil,
por lo que es de mucha ayuda obtener el peso de una manera indirecta que sea más fácil de medir.
Por lo tanto, se condujo una investigación para determinar la relación entre el peso vivo de las ovejas
y la circunferencia del pecho. En la tabla adjunta de Excel llamada “Datos” se muestran las medidas
aleatorias de 66 ovejas cuyas circunferencias se encuentran entre los 60 y 90 cm.
Con dichos Datos calcular e interpretar:
1. Diagrama de dispersión.
2. Estimaciones y ecuación de regresión.
3. Coeficiente de correlación.
4. Intervalos de confianza para los parámetros.
5. Tabla ANOVA del modelo de regresión.
6. Gráfica de Residuales contra Valores Estimados.
7. Gráfica de Valores Estimados contra Valores Observados.
8. Gráfica Cuantil-Cuantil de los Residuales.
9. Gráficas conjuntas de los residuales.
10. Histograma y gráfica de densidad de los residuales.
11. Prueba de Normalidad para los residuales.
12. Prueba de Homogeneidad de Varianzas de los residuales.

Interpretación.
1. Diagrama de dispersión.
En el diagrama de dispersión se elabora dentro de un plano cartesiano este mismo se divide en ejes,
aquí en este encontramos en el eje X, encontramos el Peso, y en él Y el valor de la Circunferencia. En
el presente se analiza la relación entre el peso y la circunferencia.
Código que se usó:
##Diagrama de dispersion
etiquetaY1 <-"Circunferencia (cm)"
etiquetax1 <- "Peso (kg)"
plot(x = Datos$`Peso (kg)`, y = Datos$`Circunferencia (cm)`, main =
"Diagrama de Dispersiperción", xlab = etiquetax1, ylab = etiquetaY1)
abline(modelo1, col="red"
Resultados:
2. Estimaciones y ecuación regresiva.
Para este, se tendrá que adjuntar una línea que sea constante pues está pasará cerca de los puntos
del valor observado y el cual es estimado. Para ello se utilizó el 98% de confianza el valor de p value.
Usando el código:
##Estimación y ecuacion de regresión
modelo1<- lm(Datos$`Circunferencia (cm)`~ Datos$`Peso (kg)`)
summary(modelo1)
modelo1$coefficients ##coeficientes del modelo
Resultados:
3. Coeficiente de correlación.
Esta es una correlación lineal que el resultado siempre suele ser positivo, ya que la dirección que se
toma un indicador el cual existe una correlación alta, ya que en ella se considera el acercamiento
que se tiene de 1.
Usando código:
#### Coeficiente de Correlación ####
cor(x,y)
Resultado:

4. Intervalos de confianza para los parámetros.


Lo que se permite concluir que con una confianza de 98%, se estima que el incremento de la
circunferencia por el incremento del peso se encuentra entre el resultado.
Usando código:
##intervalos de confianza
confint(modelo1, level = 0.95)
Resultado:

5. Tabla ANOVA del modelo de regresión.


En esta se tomaran en cuenta las varianzas entre las medias de diferentes grupos. Además de una
variedad de contextos lo utilizan para determinar si existe alguna diferencia entre las medias de los
diferentes grupos.
Usando el código:
##Tabla ANNOVA
anova(modelo1)
Resultado:

6. Grafica de Residuales contra Valores Estimados.


Esta es una de las cuales nos puede indicar la dispersión de los residuos se puede incrementar
conforme las magnitudes de los valores ajustados aumenta. La variabilidad de los puntos de datos
alrededor de la línea es más grande para los valores de Y grandes para pequeños. En este caso no
cumple la varianza constante.
Usando el código:
##Grafica de residuales contra valores estimados
Valores.estimados <- fitted(modelo1)
Residuos <- rstandard(modelo1)
plot(Valores.estimados, Residuos); abline (h = 0, col = "red")
Resultado:
7. Grafica de valores estimados contra valores observados.
En esta se va a determinar y evidenciar el comportamiento que se tuvieron los residuales con los
valores estimados en este caso la relación.
Usando el código:
##Grafica de valores estimados vs valores observados
plot(Datos$`Circunferencia (cm)`, Valores.estimados,main = "Gráfica de
Valores Estimados vs Valores Observados",
xlab = "Valores observados", ylab = "Valores Estimados"); abline (0,1)
Resultado:

8. Grafica Cuantil-Cuantil de los residuales.


Esta nos permite evaluar cual es la cercanía que tiene la distribución en relación con los residuales.
En este se comprueba si hay una relación similar y si es correcta.
Usando el código:
##grafica cuantil-cuantil de los residuos
qqnorm(Residuos, main = "Gráfica Cuantil-Cuantil de los residuos");
qqline(Residuos, col= "red")
Resultado:
9. Grafica conjuntas de los residuales.
En esta se presenta un estimado, con las gráficas de regresión positiva puesto que siguen una
misma dirección, en esta siguen los movimientos senoidales.
Usando el código:
##Grafica conjunta de los residuos
par(mfrow =c(2,1))
dev.off()
plot(Valores.estimados,Residuos,main = "Residuos vs Valores estimados");
abline(h=0, col="red")
qqnorm(Residuos, main = " "); qqline(Residuos, col ="red")
Resultados:
10. Histograma y grafica de densidad de los residuales.
El histograma de los residuos nos permite llevar a cabo una verificación de la normalidad. La
desviación de la curva en forma de campana no afecta las conclusiones de las pruebas o intervalos
de las predicciones.
Usando el código:
##histograma y grafica de densidad de los residuos
par(mfrow=c(2,1))
dev.off()
hist(Residuos, main = "Histograma de los residuales", xlim=c(-3,3))
plot(density(Residuos), main = "Densidad estimada de los residuales")
dev.off()
Resultados:
11. Prueba de Normalidad para los residuales.
Los resultados de las pruebas de normalidad, esta nos permite deducir que al nivel del 5% no hay
evidencia para deducir que los residuales tengan una distribución que difiera a la normal.
Usando el código:
##pruebas de normalidad para los residuales
shapiro.test(Residuos)$p.value
library(nortest)
ad.test(Residuos)$p.value
cvm.test(Residuos)$p.value
lillie.test(Residuos)$p.value
sf.test(Residuos)$p.value
Resultados:

12. Prueba de homogeidad de varianzas de los residuales.


De acuerdo a la gráfica podemos decir que hay una varianza y esta es constante lo que significa que
con relación a la prueba de homogeneidad no deberían de existir varianzas.
Usando código:
##Prueba de homogeniedad de varianza de los residuos
plot.new()
plot(Datos$`Peso (kg)`,Datos$`Circunferencia (cm)`,main = "Diagrama de
dispersión (Homogeneidad varianzas)",xlab=etiquetax1,ylab=etiquetaY1)
abline(modelo1); abline(v=median(Datos$`Peso (kg)`), col=4, lty=3)
var.test(residuals(modelo1)[Datos$`Peso (kg)`>median(Datos$`Peso
(kg)`)],residuals(modelo1)[Datos$`Peso (kg)`<median(Datos$`Peso (kg)`)])
Resultados:

También podría gustarte