UNIVERSIDAD DE LAS AMÉRICAS PUEBLA
DEPARTAMENTO DE INGENIERÍA INDUSTRIAL Y MECÁNICA
MÉTODOS DE MUESTREO
Nombre: Eckamn Rodríguez García ID 159564
Nombre: Paola Ortega Osorio ID 161180
Nombre: Emilio Rosas Andrade ID 159694
Antes de iniciar, recuerden que deben Interpretar todos los resultados
1. En un muestreo se obtuvieron datos de 20 sujetos sobre sus preferencias por zapatos
deportivos (Y) en una escala de 7 puntos, donde 1 = los menos preferidos, y 7 = los
más preferidos. Los participantes también proporcionaron sus evaluaciones de los
zapatos deportivos con respecto a la comodidad (X1), estilo (X2) y durabilidad (X3),
también en escala de 7 puntos. Donde 1 = malos y 7 = excelentes. Los datos
resultantes se presentan en la siguiente tabla:
Y X1 X2 X3
6 6 3 5
2 3 2 4
7 5 6 7
4 6 4 5
1 3 2 2
6 5 6 7
5 6 7 5
7 3 5 4
2 4 6 3
3 5 3 6
1 3 2 3
5 4 5 4
2 2 1 5
4 5 4 6
6 5 4 7
3 3 4 2
4 4 3 2
3 4 3 2
4 4 3 2
2 3 2 4
a. Determine la ecuación lineal múltiple de regresión.
Se muestra a continuación el procedimiento detallado para encontrar la ecuación
múltiple de regresión, para ello, primero separamos los componentes matriciales
necesarios aplicando las fórmulas correspondientes.
Y= X=
xTY=
xTX=
(xTX) -1=
´^ −1
Para calcular los parámetros de regresión se utilizó la fórmula β= ( x́T x́ ) x́ T Ý
y se sustituyeron los valores matriciales.
X =
De acuerdo con los cálculos realizados, la ecuación de regresión es
Ŷ = -0.54 + 0.258 X1 + 0.504 x2 + 0.336 x3
b. Estime la varianza de la regresión.
Para estimar la varianza se utilizó la fórmula y a continuación
se presentan sus componentes separados.
= 365
= X = 334.049071
De esta manera SCE = 365 – 334.049071 = 30.9509289/(20-(3+1) = 1.93443306
Con esto tenemos que la varianza de la regresión es 1.93443306
c. Pruebe la significancia individual para β1, β2 y β3 con α=0.10.
En esta parte realizaremos una inferencia concerniente a los parámetros anteriormente
mencionados, para ello, realizaremos pruebas de hipótesis donde nuestro estimador puntual
será ^β j y tendremos un caso 2 porque la varianza es desconocida y no estimable (20-(3+1))
= 16 grados de libertad < 30) . Para el estadístico de prueba, utilizaremos la fórmula
en donde sustituiremos sus componentes necesarios. La varianza que calculamos en el
ejercicio b es la misma para este, por lo que el valor de la desviación es 1.3908 y el valor de
^β 1 es .258. Finalmente, el valor de β1 en la posición (1,1) es 0.0671, mismo que también
podemos ubicar en la matriz (xTX) -1
realizada en el ejercicio a. A continuación, se
sustituyen todos los valores y se establece la prueba de hipótesis:
Ho: β1 = 0
Ha: β1 ≠ 0
( ^β1 −β1 )
t ^β 1 =
σ^ √ ¿ ¿ ¿
Se calculó también el valor de P value, el cual fue de .4841. Si lo comparamos con el valor
de nuestra α = 0.10, podemos apreciar que P value > α y que, por lo tanto, de acuerdo con
los criterios de rechazo de la hipótesis nula, no se rechaza Ho con un 90% de confianza.
Por lo tanto, con una confianza del 90% no se tiene evidencia que β1 indique significancia,
es decir, los incrementos unitarios en la variable X1 no son significativos para el modelo.
Para ^β 2 =.504 conservamos los mismos datos y realizamos los cálculos correspondientes,
sabiendo que el valor de β2 en la posición (1,1) es 0.0283,
. Ho: β2 = 0
Ha: β2 ≠ 0
( ^β 2−β 2)
t ^β 2=
σ^ √ ¿ ¿ ¿
Se calculó también el valor de P value, el cual fue de .0467. Si lo comparamos con el valor
de nuestra α = 0.10, podemos apreciar que P value < α y que, por lo tanto, de acuerdo con
los criterios de rechazo de la hipótesis nula, se rechaza Ho con un 90% de confianza.
Por lo tanto, con una confianza del 90% se tiene evidencia que β2 indica significancia, es
decir, que los incrementos unitarios en la variable X2 son significativos para el modelo.
Para ^β 3 =.336 conservamos los mismos datos y realizamos los cálculos correspondientes,
sabiendo que el valor de β3 en la posición (3,3) es 0.0236,
Ho: β3 = 0
Ha: β3 ≠ 0
( ^β 3−β 3 )
t ^β 3 =
σ^ √¿ ¿ ¿
Se calculó también el valor de P value, el cual fue de .1352. Si lo comparamos con el valor
de nuestra α = 0.10, podemos apreciar que P value > α y que, por lo tanto, de acuerdo con
los criterios de rechazo de la hipótesis nula, no se rechaza Ho con un 90% de confianza.
Por lo tanto, con una confianza del 90% no se tiene evidencia que β3 indica significancia, es
decir, que los incrementos unitarios en la variable X3 no son significativos para el modelo.
d. Pruebe la significancia para la utilidad del modelo de regresión (Prueba conjunta
para β1, β2 y β3) con α=0.05.
En esta parte realizaremos una prueba conjunta a una parte del modelo, es decir,
evaluaremos si los coeficientes de regresión anteriormente mencionados deben o no
incluirse en el modelo, lo cual es equivalente a probar la hipótesis nula de que ciertos
parámetros β son cero, para ello, estableceremos un modelo reducido y otro completo
mostrados a continuación:
Ŷ = -0.54 = Modelo reducido
Ŷ = -0.54 + 0.258 X1 + 0.504 x2 + 0.336 x3 = Modelo completo
Se utiliza el método de mínimos cuadrados para calcular SCE 1 del modelo 1 y SCE2 del
modelo 2. En el inciso b nosotros encontramos que SCE2 = 30.950928
Para calcular los SCE1 nuestra Y es la misma que en el inciso a y nuestra X sólo se
compone de unos.
xTX = 20 (xTX) -1 = 1/20
´
( x́ T x́ ) x́T Ý = 20 * (1/20) = 1
−1
^β=
= 365 – 77 = 288 = SCE1
Adicionalmente a esto, establecemos que en el modelo completo k = 3 y en el modelo
reducido g = 0. Procedemos a sustituir estos valores en nuestra fórmula y establecemos
nuestra hipótesis nula y la hipótesis alterna.
Ho: β1 = β2 = β3 = 0
Ha: al menos una de las Bj ≠ de cero
((288-30.9509)/3) / (30.9509/16) = 44.2936
Se calculó también el valor de P value, el cual fue de 5.649E-08. Si lo comparamos con el
valor de nuestra α = 0.05, podemos apreciar que P value < α y que, por lo tanto, de acuerdo
con los criterios de rechazo de la hipótesis nula, se rechaza Ho con un 95% de confianza.
Por lo tanto, con una confianza del 95% se tiene evidencia que indica que β1 o β2 o β3
difieren de cero y por lo tanto, la regresión es significativa
e. Calcule los intervalos de confianza al 90% para los coeficientes de la regresión.
En esta parte realizaremos una inferencia concerniente a los parámetros anteriormente
mencionados, para ello, realizaremos una estimación por intervalos donde nuestro
estimador puntual será ^β j y tendremos un caso 2 porque la varianza es desconocida y no
estimable (20-(3+1)) = 16 < 30. Para generan el intervalo de confianza, utilizaremos la
fórmula
en donde sustituiremos sus componentes necesarios. Esta es una prueba que se realiza a dos
colas, por lo que con un 90% de confianza y 16 grados de libertad (porque 20-(3+1)), el
valor en la tabla “puntos porcentuales de las distribuciones t” de tc es 1.746. La varianza
que calculamos en el ejercicio b es la misma para este, por lo que el valor de la desviación
es 1.3908 y el valor de ^β 1 es .258. Finalmente, el valor de β1 en la posición (1,1) es 0.0671,
mismo que también podemos ubicar en la matriz (xTX) -1
realizada en el ejercicio a. A
continuación, se sustituyen todos los valores.
.258 + ( 1.756 * 1.3908 * 0.2590 ) = .258 + 0.6325 y con esto tenemos que
P(-0.3745< β1 < 0.8905 )= 90%
Para β1 con una confianza del 90% podemos concluir que incrementos de 1 punto (de
acuerdo a la escala de 7 puntos) en la comodidad genera incrementos en la preferencia de
zapatos deportivos que se encuentran entre -0.3745 (0) puntos y 0.8905 (1) puntos.
Para β2 =.504 conservamos los mismos datos y realizamos los cálculos correspondientes,
sabiendo que el valor de β2 en la posición (1,1) es 0.0283,
.504 + ( 1.756 * 1.3908 * .1682 ) = .504 + .4108 y con esto tenemos que
P(0.0932 < β2 < 0.9148 )= 90%
Para β2 con una confianza del 90% podemos concluir que incrementos de 1 punto (de
acuerdo a la escala de 7 puntos) en el estilo genera incrementos en la preferencia de zapatos
deportivos que se encuentran entre 0.0932 (0) puntos y 0.9148 (1) puntos.
Para β3 =.336 conservamos los mismos datos y realizamos los cálculos correspondientes,
sabiendo que el valor de β3 en la posición (3,3) es 0.0236,
.336 + ( 1.756 * 1.3908 * .1536 ) = .336 + .3752 y con esto tenemos que
P(-0.0392 < β3 < 0.7112 ) = 90%
Para β3 con una confianza del 90% podemos concluir que incrementos de 1 punto (de
acuerdo a la escala de 7 puntos) en la durabilidad genera incrementos en la preferencia de
zapatos deportivos que se encuentran entre -0.0392 (0) puntos y 0.7112 (1) puntos.
f. Calcule el coeficiente de determinación múltiple.
Para poder establecer si los resultados de la muestra son estadísticamente significativos, se
calcula el coeficiente de determinación múltiple, el cual esta dado por la siguiente fórmula:
Del inciso b conocemos que SCE2 = 30.950928, por lo cual solo nos falta determinar SCY
el cual es igual a 365 – 296.45 = 68.55. Por lo tanto, nuestro coeficiente de determinación
es igual a 0.5484, lo que significa que el 54.84% de las variaciones en Y son explicados
por las X con el modelo empleado.