Estadística II- Grupo 1
ANP N°12 Análisis de Regresión y Correlación Lineal Múltiple con
SPSS
Nombre de los Integrantes:
● Acuña Jiménez Citlally Faviana ● García Méndez Gretel Cristina.
● Ibarra Zepeda Adriana Geraldine.
● Méndez Vallecillo María de Fátima.
● Montenegro González Axel Jesús.
● Salmerón Muñoz Carlos Fernando.
Nombre del Docente:
● Guillermo Ruiz.
Fecha de entrega: 19/11/2024
Utilice la base de datos que se le facilitó, sobre Real State, que contiene
información acerca de casas que se vendieron en Goodyear, Arizona el año
anterior. Utilice el precio de venta de la casa (en miles de $) como variable
dependiente y determine la Ecuación de Regresión con el número de recámaras,
tamaño de la casa (en pie cuadrados), si tiene alberca, distancia desde el centro
de la ciudad (en millas), si tiene garaje y el número de baños como variables
independientes. Utilizando el SPSS:
a. Escriba la Ecuación del Análisis de Regresión Múltiple y comente cada
variable.
𝑦̂ = 38.713 + 7.118𝑋1 + 0.038𝑋2 + 18.321𝑋3 − 0.929𝑋4 + 35.810𝑋5 +
23.315𝑋6
- El precio de venta de la casa se estima en $38.71 cuando el número de
recamaras, aumenta tamaño de la casa, alberca, distancia del centro de la
ciudad, garaje y el número de baños son 0.
- El precio de venta de la casa se incrementa en $7.12 por cada aumento en
el número de recamaras de la casa, suponiendo que el tamaño de la casa,
si tiene alberca, distancia desde el centro de la ciudad, si tiene garaje y el
número de baños permanecen constantes.
- El precio de venta de la casa se incrementa en $0.04 por cada aumento en
pie cuadrado de la casa, suponiendo que la alberca, el número de
recamaras, la distancia desde el centro de la ciudad, el garaje y el número
de baños permanecen constantes.
- El precio de venta de la casa se incrementa en $18.32 si tiene alberca,
suponiendo que la distancia desde el centro de la ciudad, numero de
recamaras, si tiene garaje, tamaño de la casa y el número de baños
permanecen constantes.
- El precio de venta de la casa disminuye en $0.93 por cada aumento en las
millas de distancia entre la casa y el centro de la ciudad, suponiendo que el
garaje, número de recamaras, tamaño de la casa, alberca y el número de
baños permanecen constantes.
- El precio de venta de la casa se incrementa en $35.81 si esta tiene garaje,
suponiendo que el número de recamaras, tamaño de la casa, alberca,
distancia desde el centro de la ciudad y el número de baños permanecen
constantes.
- El precio de venta de la casa se incrementa en $ 23.32 por cada aumento
en el número de baños, suponiendo que el número de recamaras, tamaño
de la casa, alberca, distancia desde el centro de la ciudad y el garaje
permanecen constantes.
b. Determine e interprete el valor R2.
𝑟2 = 0,532
El 53.2% de la variación del precio de venta de la casa se debe a la variabilidad
del número de recamaras, tamaño de la casa, si tiene alberca, la distancia en
millas desde el centro de ciudad, si tiene garaje y el número de baños.
c. Elabore una matriz de correlación. ¿Qué variables independientes tienen
correlaciones fuertes o débiles con la variable dependiente? ¿Detecta
algunos problemas de multicolinealidad?
La correlación entre el precio de venta y el número de recamaras es moderada
directa (0.467), precio de venta y tamaño de la casa es moderada directa
(0.371), precio de venta en correlación a la distancia desde el centro de la
ciudad es moderada indirecta y débil (-0.347), precio de venta y numero de
baños es moderada directa (0.382). La correlación entre precio de venta y si
tiene alberca es moderada directa y débil (0.294). La correlación entre el precio
de venta y s tiene garaje es moderada directa (0.526).
Los coeficientes de correlación indican la correlación entre cada par de
variables independientes se observa que todos los valores están dentro del
intervalo [-0.7, 0.7] y por tanto no hay indicios de multicolinealidad.
d. Realice una prueba global de hipótesis en el conjunto de variables
independientes e interprete sus resultados. Utilice un nivel de
significancia de 0.05.
Valor p= 0.000
Hay evidencia que de que alguno de los es distinto de 0 y por lo tanto algunas
de las variables independientes es útil para el modelo.
e. Realice una prueba de hipótesis con cada una de las variables
independientes. Utilice un nivel de significancia de 0.05. ¿Consideraría
eliminar alguna de ellas? Si es así ¿Cuáles?
𝐻 𝑜 : 𝛽1 = 0
𝐻1: 𝛽1 ≠ 0
𝛼 = 0.05
Valor p= 0.006 𝑝 < 𝛼 𝐻𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎
Hay evidencia que 𝛽1 es distinto de 0 y por tanto la variable independiente número
de recamaras es útil para el modelo.
Valor p= 0.011
Hay evidencia que es distinto de 0 y por lo tanto la variable independiente
tamaño de la casa es útil para el modelo.
Valor p= 0.010
Hay evidencia que es distinto de 0 y por lo tanto la variable independiente si
tiene alberca es útil para el modelo.
Valor p= 0.205
No hay evidencia que es distinto de 0 y por lo tanto la variable distancia desde el
centro de la ciudad no es útil para el modelo.
Valor p= 0.000
Hay evidencia que es distinto de 0 por lo tanto la variable independiente si tiene
garaje es útil para el modelo.
Valor p= 0.011
Hay evidencia que es distinto de 0 por lo tanto la variable independiente número de
baños es útil para el modelo.
Se considera eliminar la variable independiente “Distancia desde el centro de la
ciudad”. Es decir, se mantienen las variables independientes número de recamaras,
tamaño de la casa, si tiene alberca, si tiene garaje y numero de baños.
f. Realice de nuevo el análisis hasta que solo queden los coeficientes de
regresión significativos e identifique estas variables.
7)
𝑦̂ = 17.013 + 7.169𝑋1 + 0.039𝑋2 + 19.110𝑋3 + 38.847𝑋4 +
24.624𝑋5
- El precio de venta de la casa se incrementa en $7.17 por cada recamara
que se aumente en la casa, suponiendo que el tamaño de la casa, si tiene
alberca y garaje, además del número de baños permanecen constantes.
- El precio de venta de la casa incrementa en $0.04 por cada aumento en pie
cuadrado en el tamaño de la casa, suponiendo que el número de
recamaras, si tiene alberca y garaje, además del número de baños
permanecen constantes.
- El precio de venta de la casa se incrementa en $19.11 si tiene alberca,
suponiendo que el número de recamaras, el tamaño de la casa, si tiene
garaje y el número de baños permanecen constantes.
- El precio de venta de la casa incrementa en $38.85 si tiene garaje,
suponiendo que el número de recamaras, el tamaño de la casa, si tiene
alberca y el número de baños permanecen constantes.
- El precio de venta de la casa incrementa en $24.62 por cada baño que se
aumenta en la casa, suponiendo que el número de recamaras, el tamaño
de la casa, si tiene alberca y garaje permanecen constantes.
g)
g. Elabore un histograma de los residuos a partir de la ecuación de
regresión final desarrollada en el punto f. ¿Es razonable concluir que se
cumplió la suposición de normalidad?
El histograma de los residuos muestra una aproximación a la Distribución Normal
y se puede concluir que el supuesto de normalidad de los residuos se cumple.
h)
h. Trace los residuos contra los valores ajustados a partir de la ecuación de
regresión final. Trace los residuos en el eje vertical y los valores
ajustados en el eje horizontal. Comente el gráfico.
El grafico de los residuos contra valores ajustados no siguen un patrón, sino
que más bien parece aleatorio por lo que se concluye que el modelo cumple
con el supuesto de homocedasticidad.