0% encontró este documento útil (0 votos)
28 vistas8 páginas

Análisis de Regresión en Preferencias de Calzado

El documento presenta un análisis de regresión múltiple sobre las preferencias por zapatos deportivos, utilizando datos de 20 sujetos y evaluaciones sobre comodidad, estilo y durabilidad. Se determina la ecuación de regresión, se estima la varianza y se realizan pruebas de significancia para los coeficientes, concluyendo que solo el coeficiente de estilo es significativo. Además, se calculan intervalos de confianza y el coeficiente de determinación, que indica que el 54.84% de las variaciones en preferencias son explicadas por las variables consideradas.

Cargado por

Luis Cruz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
28 vistas8 páginas

Análisis de Regresión en Preferencias de Calzado

El documento presenta un análisis de regresión múltiple sobre las preferencias por zapatos deportivos, utilizando datos de 20 sujetos y evaluaciones sobre comodidad, estilo y durabilidad. Se determina la ecuación de regresión, se estima la varianza y se realizan pruebas de significancia para los coeficientes, concluyendo que solo el coeficiente de estilo es significativo. Además, se calculan intervalos de confianza y el coeficiente de determinación, que indica que el 54.84% de las variaciones en preferencias son explicadas por las variables consideradas.

Cargado por

Luis Cruz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA

DEPARTAMENTO DE INGENIERÍA INDUSTRIAL Y MECÁNICA


MÉTODOS DE MUESTREO
Nombre: Eckamn Rodríguez García ID 159564
Nombre: Paola Ortega Osorio ID 161180
Nombre: Emilio Rosas Andrade ID 159694

Antes de iniciar, recuerden que deben Interpretar todos los resultados

1. En un muestreo se obtuvieron datos de 20 sujetos sobre sus preferencias por zapatos


deportivos (Y) en una escala de 7 puntos, donde 1 = los menos preferidos, y 7 = los
más preferidos. Los participantes también proporcionaron sus evaluaciones de los
zapatos deportivos con respecto a la comodidad (X1), estilo (X2) y durabilidad (X3),
también en escala de 7 puntos. Donde 1 = malos y 7 = excelentes. Los datos
resultantes se presentan en la siguiente tabla:
Y X1 X2 X3
6 6 3 5
2 3 2 4
7 5 6 7
4 6 4 5
1 3 2 2
6 5 6 7
5 6 7 5
7 3 5 4
2 4 6 3
3 5 3 6
1 3 2 3
5 4 5 4
2 2 1 5
4 5 4 6
6 5 4 7
3 3 4 2
4 4 3 2
3 4 3 2
4 4 3 2
2 3 2 4

a. Determine la ecuación lineal múltiple de regresión.


Se muestra a continuación el procedimiento detallado para encontrar la ecuación
múltiple de regresión, para ello, primero separamos los componentes matriciales
necesarios aplicando las fórmulas correspondientes.

Y= X=

xTY=

xTX=

(xTX) -1=
´^ −1
Para calcular los parámetros de regresión se utilizó la fórmula β= ( x́T x́ ) x́ T Ý
y se sustituyeron los valores matriciales.

X =

De acuerdo con los cálculos realizados, la ecuación de regresión es


Ŷ = -0.54 + 0.258 X1 + 0.504 x2 + 0.336 x3

b. Estime la varianza de la regresión.

Para estimar la varianza se utilizó la fórmula y a continuación


se presentan sus componentes separados.

= 365

= X = 334.049071

De esta manera SCE = 365 – 334.049071 = 30.9509289/(20-(3+1) = 1.93443306


Con esto tenemos que la varianza de la regresión es 1.93443306

c. Pruebe la significancia individual para β1, β2 y β3 con α=0.10.

En esta parte realizaremos una inferencia concerniente a los parámetros anteriormente


mencionados, para ello, realizaremos pruebas de hipótesis donde nuestro estimador puntual
será ^β j y tendremos un caso 2 porque la varianza es desconocida y no estimable (20-(3+1))
= 16 grados de libertad < 30) . Para el estadístico de prueba, utilizaremos la fórmula
en donde sustituiremos sus componentes necesarios. La varianza que calculamos en el
ejercicio b es la misma para este, por lo que el valor de la desviación es 1.3908 y el valor de
^β 1 es .258. Finalmente, el valor de β1 en la posición (1,1) es 0.0671, mismo que también

podemos ubicar en la matriz (xTX) -1


realizada en el ejercicio a. A continuación, se
sustituyen todos los valores y se establece la prueba de hipótesis:
Ho: β1 = 0
Ha: β1 ≠ 0
( ^β1 −β1 )
t ^β 1 =
σ^ √ ¿ ¿ ¿

Se calculó también el valor de P value, el cual fue de .4841. Si lo comparamos con el valor
de nuestra α = 0.10, podemos apreciar que P value > α y que, por lo tanto, de acuerdo con
los criterios de rechazo de la hipótesis nula, no se rechaza Ho con un 90% de confianza.
Por lo tanto, con una confianza del 90% no se tiene evidencia que β1 indique significancia,
es decir, los incrementos unitarios en la variable X1 no son significativos para el modelo.

Para ^β 2 =.504 conservamos los mismos datos y realizamos los cálculos correspondientes,
sabiendo que el valor de β2 en la posición (1,1) es 0.0283,
. Ho: β2 = 0
Ha: β2 ≠ 0
( ^β 2−β 2)
t ^β 2=
σ^ √ ¿ ¿ ¿
Se calculó también el valor de P value, el cual fue de .0467. Si lo comparamos con el valor
de nuestra α = 0.10, podemos apreciar que P value < α y que, por lo tanto, de acuerdo con
los criterios de rechazo de la hipótesis nula, se rechaza Ho con un 90% de confianza.
Por lo tanto, con una confianza del 90% se tiene evidencia que β2 indica significancia, es
decir, que los incrementos unitarios en la variable X2 son significativos para el modelo.
Para ^β 3 =.336 conservamos los mismos datos y realizamos los cálculos correspondientes,
sabiendo que el valor de β3 en la posición (3,3) es 0.0236,

Ho: β3 = 0
Ha: β3 ≠ 0
( ^β 3−β 3 )
t ^β 3 =
σ^ √¿ ¿ ¿
Se calculó también el valor de P value, el cual fue de .1352. Si lo comparamos con el valor
de nuestra α = 0.10, podemos apreciar que P value > α y que, por lo tanto, de acuerdo con
los criterios de rechazo de la hipótesis nula, no se rechaza Ho con un 90% de confianza.
Por lo tanto, con una confianza del 90% no se tiene evidencia que β3 indica significancia, es
decir, que los incrementos unitarios en la variable X3 no son significativos para el modelo.

d. Pruebe la significancia para la utilidad del modelo de regresión (Prueba conjunta


para β1, β2 y β3) con α=0.05.

En esta parte realizaremos una prueba conjunta a una parte del modelo, es decir,
evaluaremos si los coeficientes de regresión anteriormente mencionados deben o no
incluirse en el modelo, lo cual es equivalente a probar la hipótesis nula de que ciertos
parámetros β son cero, para ello, estableceremos un modelo reducido y otro completo
mostrados a continuación:
Ŷ = -0.54 = Modelo reducido
Ŷ = -0.54 + 0.258 X1 + 0.504 x2 + 0.336 x3 = Modelo completo
Se utiliza el método de mínimos cuadrados para calcular SCE 1 del modelo 1 y SCE2 del
modelo 2. En el inciso b nosotros encontramos que SCE2 = 30.950928
Para calcular los SCE1 nuestra Y es la misma que en el inciso a y nuestra X sólo se
compone de unos.
xTX = 20 (xTX) -1 = 1/20
´
( x́ T x́ ) x́T Ý = 20 * (1/20) = 1
−1
^β=
= 365 – 77 = 288 = SCE1

Adicionalmente a esto, establecemos que en el modelo completo k = 3 y en el modelo


reducido g = 0. Procedemos a sustituir estos valores en nuestra fórmula y establecemos
nuestra hipótesis nula y la hipótesis alterna.
Ho: β1 = β2 = β3 = 0
Ha: al menos una de las Bj ≠ de cero

((288-30.9509)/3) / (30.9509/16) = 44.2936

Se calculó también el valor de P value, el cual fue de 5.649E-08. Si lo comparamos con el


valor de nuestra α = 0.05, podemos apreciar que P value < α y que, por lo tanto, de acuerdo
con los criterios de rechazo de la hipótesis nula, se rechaza Ho con un 95% de confianza.

Por lo tanto, con una confianza del 95% se tiene evidencia que indica que β1 o β2 o β3
difieren de cero y por lo tanto, la regresión es significativa

e. Calcule los intervalos de confianza al 90% para los coeficientes de la regresión.

En esta parte realizaremos una inferencia concerniente a los parámetros anteriormente


mencionados, para ello, realizaremos una estimación por intervalos donde nuestro
estimador puntual será ^β j y tendremos un caso 2 porque la varianza es desconocida y no
estimable (20-(3+1)) = 16 < 30. Para generan el intervalo de confianza, utilizaremos la
fórmula

en donde sustituiremos sus componentes necesarios. Esta es una prueba que se realiza a dos
colas, por lo que con un 90% de confianza y 16 grados de libertad (porque 20-(3+1)), el
valor en la tabla “puntos porcentuales de las distribuciones t” de tc es 1.746. La varianza
que calculamos en el ejercicio b es la misma para este, por lo que el valor de la desviación
es 1.3908 y el valor de ^β 1 es .258. Finalmente, el valor de β1 en la posición (1,1) es 0.0671,
mismo que también podemos ubicar en la matriz (xTX) -1
realizada en el ejercicio a. A
continuación, se sustituyen todos los valores.
.258 + ( 1.756 * 1.3908 * 0.2590 ) = .258 + 0.6325 y con esto tenemos que
P(-0.3745< β1 < 0.8905 )= 90%
Para β1 con una confianza del 90% podemos concluir que incrementos de 1 punto (de
acuerdo a la escala de 7 puntos) en la comodidad genera incrementos en la preferencia de
zapatos deportivos que se encuentran entre -0.3745 (0) puntos y 0.8905 (1) puntos.

Para β2 =.504 conservamos los mismos datos y realizamos los cálculos correspondientes,
sabiendo que el valor de β2 en la posición (1,1) es 0.0283,
.504 + ( 1.756 * 1.3908 * .1682 ) = .504 + .4108 y con esto tenemos que
P(0.0932 < β2 < 0.9148 )= 90%
Para β2 con una confianza del 90% podemos concluir que incrementos de 1 punto (de
acuerdo a la escala de 7 puntos) en el estilo genera incrementos en la preferencia de zapatos
deportivos que se encuentran entre 0.0932 (0) puntos y 0.9148 (1) puntos.

Para β3 =.336 conservamos los mismos datos y realizamos los cálculos correspondientes,
sabiendo que el valor de β3 en la posición (3,3) es 0.0236,
.336 + ( 1.756 * 1.3908 * .1536 ) = .336 + .3752 y con esto tenemos que
P(-0.0392 < β3 < 0.7112 ) = 90%
Para β3 con una confianza del 90% podemos concluir que incrementos de 1 punto (de
acuerdo a la escala de 7 puntos) en la durabilidad genera incrementos en la preferencia de
zapatos deportivos que se encuentran entre -0.0392 (0) puntos y 0.7112 (1) puntos.

f. Calcule el coeficiente de determinación múltiple.

Para poder establecer si los resultados de la muestra son estadísticamente significativos, se


calcula el coeficiente de determinación múltiple, el cual esta dado por la siguiente fórmula:
Del inciso b conocemos que SCE2 = 30.950928, por lo cual solo nos falta determinar SCY
el cual es igual a 365 – 296.45 = 68.55. Por lo tanto, nuestro coeficiente de determinación
es igual a 0.5484, lo que significa que el 54.84% de las variaciones en Y son explicados
por las X con el modelo empleado.

También podría gustarte