Universidad de Concepción
Facultad de Ciencias Forestales
Resolución tarea 5
HADBM (4119083/4224193)
2021-2
Camilo Torres Rojas.
03/12/2021
1.
Desarrollo: A partir del siguiente script
[1] d<-read_excel("[Link]")
[2] GrC<-d$res[1:6]
[3] TrA<-d$res[7:12]
[4] TrB<-d$res[13:18]
[5] TrC<-d$res[19:24]
[6] TrD<-d$res[25:30]
[7] boxplot(GrC,TrA,TrB,TrC,TrD,names=c("GrC","TrA","TrB","TrC","TrD"))
[8] [Link](GrC)# normal
[9] [Link](TrA)# normal
[10] [Link](TrB)# normal
[11] [Link](TrC)# normal
[12] [Link](TrD)# normal
[13] [Link](res~cat, data=d)
[14] anova1<-aov(d$res~d$cat)
[15] summary(anova1)
[16] TukeyHSD(anova1)
a) Para poder aplicar un test ANOVA es necesario corroborar la normalidad de cada grupo en
particular y la homocedasticidad como set de datos, además de presentar muestras de igual
tamaño y que cada muestra sea independiente.
Inicialmente se evalúa la normalidad de cada uno de los grupos. La siguiente tabla presenta los
valores p obtenidos de los test de Shapiro evaluados entre las líneas [9-12] para cada grupo.
Tabla 1 . Resultados test de Shapiro
Grupo Valor- p
GrC 0.5868
TrA 0.6799
TrB 0.2721
TrC 0.1635
TrD 0.8995
1
Se observa que todos los grupos aprueban el test (p > 0.05) y se asume una distribución normal
para cada uno. Posteriormente, se evalúa la homocedasticidad del grupo de datos usando el test
de Bartlett [13]. El valor p obtenido es de 0.6451, lo que permite aceptar la hipótesis nula y
considerar que no hay diferencias significativas entre las varianzas de cada grupo.
A partir de las características comprobadas, se considera que el set de datos planteado en el
problema puede ser analizados utilizando ANOVA.
b) Utilizando la función aov() es posible obtener el análisis ANOVA de nuestros datos[14]. Así
se obtiene que el valor p igual a 1.64e-06*** (p<<0.05), es decir existen claramente diferencias
entre las medias de los grupos presentes. La figura 2 presenta el boxplot del set de datos, donde
se observan las diferencias entre los grupos.
Figura 1. Boxplot datos problema
c) Es posible observar diferencias significativas de medias entre varios grupos utilizando un test
de Tukey [16]. La tabla 2 presenta el resumen de valores encontrados para las relaciones.
.
Tabla 2. Resultados test de Tukey
Comparación p
TrA-GrC 0.9906699
TrB-GrC 0.0023525
TrC-GrC 0.2885043
TrD-GrC 0.0272623
TrB-TrA 0.0007482
TrC-TrA 0.1303766
TrD-TrA 0.0735131
TrC-TrB 0.2082853
TrD-TrB 0.0000008
TrD-TrC 0.0001880
Se destaca en negrita dentro de la tabla 2 las comparaciones que aprueban el test (p > 0.05). Se
observa que el tratamiento D, es el que más difiere del resto de grupos.
2
2.
Desarrollo: A partir del siguiente script
[1] x<-c(4,5,6,7,8,9,10,11,12,13,14)
[2] y1<-c(4.26,5.68,7.24,4.82,6.95,8.81,8.04,8.33,10.84,7.58,9.96)
[3] y2<-c(3.1,4.74,6.13,7.26,8.14,8.77,9.14,9.26,9.13,8.74,8.1)
[4] t5p2<-[Link](x,y1,y2)
[5] modelo1<-lm(y1~x)
[6] summary(modelo1)
[7] modelo2<-lm(y2~x)
[8] summary(modelo2)
[9] pp<-matrix(data<-c(1,2),1,2)
[10] layout(pp)
[11] plot(x,y1)
[12] abline(modelo1,col="red")
[13] plot(x,y2)
[14] abline(modelo2,col="red")
[15] y1m<-y1
[16] y1m[11]<-12
[17] modelo3<-lm(y1m~x)
[18] predict(modelo3)
a) Utilizando la función lm() se obtiene el modelo lineal [5], y se muestra posteriormente el
resumen en consola [6]. Se obtuvo un valor de intercepto de 3.0001, pendiente 0.5001 y
R2=0.6665.
b) Similar a la parte anterior, se obtiene un valor de intercepto 3.001, pendiente 0.500 y
R2=0.6662.
c) Si bien las ecuaciones de la recta ajustadas para ambos casos son prácticamente las mismas,
se puede observar que el valor de R2 en ambos casos, es lejano al óptimo. Incluso en el
grupo y2, se podrían sugerir modelos de ajuste más acorde a los datos, como un modelo
parabólico. Por otra parte el modelo ajustado para y1 presenta un valor de R2 ligeramente
superior a y2. La figura 2, presenta ambas situaciones.
3
Figura 2. Gráfico y ajustes lineales problema 2
d) Realizando un reajuste de los datos [15-17], y realizando la predicción [18], se obtiene
que el valor estimado para x=14 en el nuevo ajuste es 10.650455.