0% encontró este documento útil (0 votos)
36 vistas4 páginas

Análisis ANOVA y Modelos Lineales en R

El documento presenta el análisis de datos de dos problemas. Para el primer problema evalúa la normalidad y homocedasticidad de los grupos de datos y realiza un ANOVA y test de Tukey. En el segundo problema ajusta modelos lineales a dos conjuntos de datos y analiza la bondad de ajuste.

Cargado por

cantoniotr
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
36 vistas4 páginas

Análisis ANOVA y Modelos Lineales en R

El documento presenta el análisis de datos de dos problemas. Para el primer problema evalúa la normalidad y homocedasticidad de los grupos de datos y realiza un ANOVA y test de Tukey. En el segundo problema ajusta modelos lineales a dos conjuntos de datos y analiza la bondad de ajuste.

Cargado por

cantoniotr
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Universidad de Concepción

Facultad de Ciencias Forestales

Resolución tarea 5
HADBM (4119083/4224193)
2021-2
Camilo Torres Rojas.
03/12/2021

1.

Desarrollo: A partir del siguiente script


[1] d<-read_excel("[Link]")
[2] GrC<-d$res[1:6]
[3] TrA<-d$res[7:12]
[4] TrB<-d$res[13:18]
[5] TrC<-d$res[19:24]
[6] TrD<-d$res[25:30]
[7] boxplot(GrC,TrA,TrB,TrC,TrD,names=c("GrC","TrA","TrB","TrC","TrD"))
[8] [Link](GrC)# normal
[9] [Link](TrA)# normal
[10] [Link](TrB)# normal
[11] [Link](TrC)# normal
[12] [Link](TrD)# normal
[13] [Link](res~cat, data=d)
[14] anova1<-aov(d$res~d$cat)
[15] summary(anova1)
[16] TukeyHSD(anova1)

a) Para poder aplicar un test ANOVA es necesario corroborar la normalidad de cada grupo en
particular y la homocedasticidad como set de datos, además de presentar muestras de igual
tamaño y que cada muestra sea independiente.

Inicialmente se evalúa la normalidad de cada uno de los grupos. La siguiente tabla presenta los
valores p obtenidos de los test de Shapiro evaluados entre las líneas [9-12] para cada grupo.

Tabla 1 . Resultados test de Shapiro

Grupo Valor- p
GrC 0.5868
TrA 0.6799
TrB 0.2721
TrC 0.1635
TrD 0.8995

1
Se observa que todos los grupos aprueban el test (p > 0.05) y se asume una distribución normal
para cada uno. Posteriormente, se evalúa la homocedasticidad del grupo de datos usando el test
de Bartlett [13]. El valor p obtenido es de 0.6451, lo que permite aceptar la hipótesis nula y
considerar que no hay diferencias significativas entre las varianzas de cada grupo.

A partir de las características comprobadas, se considera que el set de datos planteado en el


problema puede ser analizados utilizando ANOVA.

b) Utilizando la función aov() es posible obtener el análisis ANOVA de nuestros datos[14]. Así
se obtiene que el valor p igual a 1.64e-06*** (p<<0.05), es decir existen claramente diferencias
entre las medias de los grupos presentes. La figura 2 presenta el boxplot del set de datos, donde
se observan las diferencias entre los grupos.

Figura 1. Boxplot datos problema

c) Es posible observar diferencias significativas de medias entre varios grupos utilizando un test
de Tukey [16]. La tabla 2 presenta el resumen de valores encontrados para las relaciones.
.
Tabla 2. Resultados test de Tukey

Comparación p
TrA-GrC 0.9906699
TrB-GrC 0.0023525
TrC-GrC 0.2885043
TrD-GrC 0.0272623
TrB-TrA 0.0007482
TrC-TrA 0.1303766
TrD-TrA 0.0735131
TrC-TrB 0.2082853
TrD-TrB 0.0000008
TrD-TrC 0.0001880

Se destaca en negrita dentro de la tabla 2 las comparaciones que aprueban el test (p > 0.05). Se
observa que el tratamiento D, es el que más difiere del resto de grupos.

2
2.

Desarrollo: A partir del siguiente script

[1] x<-c(4,5,6,7,8,9,10,11,12,13,14)
[2] y1<-c(4.26,5.68,7.24,4.82,6.95,8.81,8.04,8.33,10.84,7.58,9.96)
[3] y2<-c(3.1,4.74,6.13,7.26,8.14,8.77,9.14,9.26,9.13,8.74,8.1)
[4] t5p2<-[Link](x,y1,y2)
[5] modelo1<-lm(y1~x)
[6] summary(modelo1)
[7] modelo2<-lm(y2~x)
[8] summary(modelo2)
[9] pp<-matrix(data<-c(1,2),1,2)
[10] layout(pp)
[11] plot(x,y1)
[12] abline(modelo1,col="red")
[13] plot(x,y2)
[14] abline(modelo2,col="red")
[15] y1m<-y1
[16] y1m[11]<-12
[17] modelo3<-lm(y1m~x)
[18] predict(modelo3)

a) Utilizando la función lm() se obtiene el modelo lineal [5], y se muestra posteriormente el


resumen en consola [6]. Se obtuvo un valor de intercepto de 3.0001, pendiente 0.5001 y
R2=0.6665.
b) Similar a la parte anterior, se obtiene un valor de intercepto 3.001, pendiente 0.500 y
R2=0.6662.
c) Si bien las ecuaciones de la recta ajustadas para ambos casos son prácticamente las mismas,
se puede observar que el valor de R2 en ambos casos, es lejano al óptimo. Incluso en el
grupo y2, se podrían sugerir modelos de ajuste más acorde a los datos, como un modelo
parabólico. Por otra parte el modelo ajustado para y1 presenta un valor de R2 ligeramente
superior a y2. La figura 2, presenta ambas situaciones.

3
Figura 2. Gráfico y ajustes lineales problema 2

d) Realizando un reajuste de los datos [15-17], y realizando la predicción [18], se obtiene


que el valor estimado para x=14 en el nuevo ajuste es 10.650455.

También podría gustarte