Grupo 1
Alumnos:
Luz Espinoza C.I 19.146.330
Roberto Materrano C.I. 26.114.134
Yuarth Hernández C.I 25.822.068
Yurley Solimer C.I. 22.986.327
Ejercicio 22
Se realizó un experimento para estudiar el sabor del queso panela en función de la cantidad del cuajo y la sal. La variable de respuesta observada es el sabor
promedio reportado por un grupo de 5 panelistas que probaron todos los quesos y los calificaron con una escala hedónica
datos<-[Link]("[Link]",header=T,sep=";")
##Ver relación entre los datos y acceso directo a los datos con los que se va a trabajar
pairs(datos)
attach(datos)
##Creacion de matrices ‘Y’ (que contiene los datos de la variable dependiente) y la matriz ‘X’ (que contiene los datos de las variables ind
## Modelo en término de las observaciones
Y=matrix(Sabor)
a=matrix(1:1,8)
b=matrix(Sal)
c=matrix(Cuajo)
ab=cbind(a,b)
abc=cbind(ab,c)
X=abc
## [,1] [,2] [,3]
## [1,] 1 6.0 0.300
## [2,] 1 5.5 0.387
## [3,] 1 4.5 0.387
## [4,] 1 4.0 0.300
## [5,] 1 4.5 0.213
## [6,] 1 5.5 0.213
## [7,] 1 5.0 0.300
## [8,] 1 5.0 0.300
## [,1]
## [1,] 5.67
## [2,] 7.44
## [3,] 7.33
## [4,] 6.33
## [5,] 7.11
## [6,] 7.22
## [7,] 6.33
## [8,] 6.66
##Cálculos necesarios para obtener los valores de los parámetros B0, B1, B2 Y B3 respectivamente
sumYi=sum(Y)
sumX1i=sum(Sal)
sumX2i=sum(Cuajo)
B=matrix(c("B0","B1","B2"))
##Hacemos la traspuesta de "X"
Xt=t(X)
##X traspuesta por X
XtxX=Xt%*%X
##X traspuesta por Y
XtxY=Xt%*%Y
##Inversa de X trapuesta por X
XtxXInv=solve(XtxX)
##Inversa de X trapuesta por X por X traspuesta por Y
Betas=XtxXInv%*%XtxY
Betas
## [,1]
## [1,] 7.2986063
## [2,] -0.1833333
## [3,] 1.2643678
Encontramos las betas y la ecuación de regresión es
Y= 7.30 - 0.183 x1 + 1.26 x2
b) ¿el modelo explica la variación observada en el sabor? Argumente con base en la significancia del modelo, los residuales y el coeficiente de determinación.
Para hablar de un modelo que tiene un ajuste satisfactorio es necesario que ambos coeficientes tengan valores superiores a 0.7, y en este caso muestro coeficiente
de determinación presento un valor muy bajo del 0.05 (5%) y un coeficiente de determinación ajustado con valor negativo interpretando esto como un 0%.
Esto se debe a que en nuestro modelo hay términos que no contribuyen de manera significativa por lo tanto debemos depurar el modelo. Análisis de residuos.-
en la gráfica de probabilidad normal los puntos no se ajustan a la recta y presentan un cierto nivel de simetría en el comportamiento de los mismos por lo tanto
podemos decir que el modelo no es aceptable.
En la gráfica de residuos vs predichos si el modelo es adecuado se espera que en esta gráfica los puntos no sigan ningún patrón y que, por lo tanto, estén
distribuidos más o menos aleatoriamente a lo largo y ancho dela gráfica. Cuando esto ocurre significa que el modelo se ajusta de cualquier manera a lo largo de
los modelos de Y.
En el caso de nuestra gráfica se observa que los puntos están distribuidos a lo largo del eje de las X de forma constante. Y por último en la gráfica de residuos vs
observamos que el comportamiento de los residuos maneja un patrón, lo cual quiere decir que nuestro modelo no es adecuado.
c) Ajuste un modelo que incluya términos cuadráticos y analice con detalle la calidad del ajuste.
datos<-[Link]("[Link]",header=T,sep=";")
pairs(datos)
cor(datos)
## Sabor Sal Cuajo x1.x2 x1.2
## Sabor 1.00000000 -0.1936348 1.341541e-01 0.01616387 -2.287208e-01
## Sal -0.19363482 1.0000000 0.000000e+00 0.51043888 9.981303e-01
## Cuajo 0.13415414 0.0000000 1.000000e+00 0.85560238 -2.298093e-18
## x1.x2 0.01616387 0.5104389 8.556024e-01 1.00000000 5.094774e-01
## x1.2 -0.22872075 0.9981303 -2.298093e-18 0.50947741 1.000000e+00
## x2.2 0.22253034 0.0000000 9.949367e-01 0.85130511 -2.047689e-03
## x2.2
## Sabor 0.222530342
## Sal 0.000000000
## Cuajo 0.994936676
## x1.x2 0.851305112
## x1.2 -0.002047689
## x2.2 1.000000000
attach(datos)
## The following objects are masked from datos (pos = 3):
##
## Cuajo, Sabor, Sal, x1.x2
Y=matrix(Sabor)
a=matrix(1:1,8)
b=matrix(Sal)
c=matrix(Cuajo)
d=matrix(x1.x2)
e=matrix(x1.2)
f=matrix(x2.2)
ab=cbind(a,b)
abc=cbind(ab,c)
abcd=cbind(abc,d)
abcde=cbind(abcd,e)
abcdef=cbind(abcde,f)
X=abcdef
X
## [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] 1 6.0 0.300 1.800 36.00 0.090
## [2,] 1 5.5 0.387 2.129 30.25 0.150
## [3,] 1 4.5 0.387 1.742 20.25 0.150
## [4,] 1 4.0 0.300 1.200 16.00 0.090
## [5,] 1 4.5 0.213 0.959 20.25 0.045
## [6,] 1 5.5 0.213 1.171 30.25 0.045
## [7,] 1 5.0 0.300 1.500 25.00 0.090
## [8,] 1 5.0 0.300 1.500 25.00 0.090
## [,1]
## [1,] 5.67
## [2,] 7.44
## [3,] 7.33
## [4,] 6.33
## [5,] 7.11
## [6,] 7.22
## [7,] 6.33
## [8,] 6.66
sumYi=sum(Y)
sumX1i=sum(Sal)
sumX2i=sum(Cuajo)
sumX3i=sum(x1.x2)
sumX4i=sum(x1.2)
sumX5i=sum(x2.2)
B=matrix(c("B0","B1","B2","B3","B4","B5"))
##Hacemos la traspuesta de "X"
Xt=t(X)
##X traspuesta por X
XtxX=Xt%*%X
##X traspuesta por Y
XtxY=Xt%*%Y
##Inversa de X trapuesta por X
XtxXInv=solve(XtxX)
##Inversa de X trapuesta por X por X traspuesta por Y
Betas=XtxXInv%*%XtxY
Betas
## [,1]
## [1,] 5.59833500
## [2,] 4.77241029
## [3,] -71.35569947
## [4,] -0.01915605
## [5,] -0.49500000
## [6,] 120.50063853
Y = 5.59 + 4.77 x1 - 71.35 x2 - 0.01 x1x2 - 0.495 x12 + 120,50 x22
Cabe destacar que los valores de las nuevas columnas agregadas a la matriz para el nuevo ajuste donde incluye los términos cuadráticos, fueron redondeados a 3
decimales.
d) Compare el error estándar de estimación (√ ) y los coeficientes de determinación para ambos modelos
datos<-[Link]("[Link]",header=T,sep=";")
Yt=t(Y)
##Y traspuesta por Y
YtxY=Yt%*%Y
#Betas Transpuesta
BetasT=t(Betas)
##Betas traspuesta por X traspuesta por Y
BtXtY=BetasT%*%Xt%*%Y
##Suma de errores al cuadrado
SCE= YtxY-BtXtY
##Calculo del estimador insesgado
CMe= SCE/(8-2)
SCE
## [,1]
## [1,] 0.1835139
CMe
## [,1]
## [1,] 0.03058564
modelo <- lm(Sabor ~ Sal + Cuajo, data = datos)
summary(modelo)
##
## Call:
## lm(formula = Sabor ~ Sal + Cuajo, data = datos)
##
## Residuals:
## 1 2 3 4 5 6 7 8
## -0.9079 0.6604 0.3671 -0.6146 0.3671 0.6604 -0.4312 -0.1012
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.2986 2.4098 3.029 0.0291 *
## Sal -0.1833 0.4115 -0.446 0.6746
## Cuajo 1.2644 4.0963 0.309 0.7700
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.7127 on 5 degrees of freedom
## Multiple R-squared: 0.05549, Adjusted R-squared: -0.3223
## F-statistic: 0.1469 on 2 and 5 DF, p-value: 0.867
##Modelo 2
datos<-[Link]("[Link]",header=T,sep=";")
Yt=t(Y)
##Y traspuesta por Y
YtxY=Yt%*%Y
#Betas Transpuesta
BetasT=t(Betas)
##Betas traspuesta por X traspuesta por Y
BtXtY=BetasT%*%Xt%*%Y
##Suma de errores al cuadrado
SCE= YtxY-BtXtY
##Calculo del estimador insesgado
CMe= SCE/(8-2)
SCE
## [,1]
## [1,] 0.1835139
modelo <- lm(Sabor ~ Sal + Cuajo + x1.x2 + x1.2 + x2.2, data = datos)
summary(modelo)
##
## Call:
## lm(formula = Sabor ~ Sal + Cuajo + x1.x2 + x1.2 + x2.2, data = datos)
##
## Residuals:
## 1 2 3 4 5 6 7 8
## -0.1467 0.1475 -0.1475 0.1467 -0.1458 0.1458 -0.1650 0.1650
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.59834 10.18257 0.550 0.6377
## Sal 4.77241 3.20682 1.488 0.2751
## Cuajo -71.35570 25.19342 -2.832 0.1053
## x1.x2 -0.01916 3.46184 -0.006 0.9961
## x1.2 -0.49500 0.30291 -1.634 0.2438
## x2.2 120.50064 30.29163 3.978 0.0578 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.3029 on 2 degrees of freedom
## Multiple R-squared: 0.9318, Adjusted R-squared: 0.7612
## F-statistic: 5.462 on 5 and 2 DF, p-value: 0.162
En nuestro primer modelo al calcular los coeficientes de determinación y el ajustado del mismo, nos pudimos dar cuenta de que el modelo no era adecuado para
explicar la relación de variables debido a que el valor era demasiado bajo y por lo tanto no era un modelo confiable.
Al obtener nuestra ecuación con términos cuadráticos, nos dimos cuenta que este modelo si es significativo debido a los valores que nos arrojó el coeficiente de
determinación y su ajustado, al ver una amplia mejoría en los resultados.
Al comparar los valores del error estándar del modelo inicial con el modelo cuadrático, podemos observar la notable diferencia, el primero fue de 0,7127 y en el
modelo cuadrático que fue de 0,3029, el primer error supera en mas del doble al error del modelo cudrárico, esto no quiere decir que el segundo modelo es mas
conveniente para el estudio del sabor.
Los coeficientes de determinación difieren de manera significativa, ya que podemos observar que los coeficientes del primer modelo fueron muy bajos, incluso el
de uno fue negativo; en cambio con nel modelo cuadrático los coeficientes aumentaron en gran medida, superando ambos en mas del 70%.
e) ¿Cuál modelo prefiere para explicar el sabor?
Como lo reflejan los resultados obtenidos, es preferible el modelo cuadrático, ya que los estimadores reflejan que los términos presentes en éste modelo tienen
significancia para el estudio del sabor, demostrado por los valores de los coeficientes de determinación que muestran que el estudio hecho con el modelo
cuadrático es confiable.