0% encontró este documento útil (0 votos)
37 vistas6 páginas

Análisis Estadístico de Empleo y Ventas

El documento presenta los resultados de varios análisis estadísticos realizados sobre diferentes conjuntos de datos. Incluye pruebas de hipótesis para comparar promedios y varianzas, análisis de regresión lineal para explorar relaciones entre variables y determinar ecuaciones de modelos predictivos.

Cargado por

diegoyjosema17
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
37 vistas6 páginas

Análisis Estadístico de Empleo y Ventas

El documento presenta los resultados de varios análisis estadísticos realizados sobre diferentes conjuntos de datos. Incluye pruebas de hipótesis para comparar promedios y varianzas, análisis de regresión lineal para explorar relaciones entre variables y determinar ecuaciones de modelos predictivos.

Cargado por

diegoyjosema17
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

ESCUELA SUPERIOR DE AMINISTRACION PUBLICA

ESTADISTICA II
ESTUDIANTES: DIEGO ANDRES JIMENEZ NUÑEZ
AYDEE PATRICIA CASTRO BARRIOS
1. Seleccionada una muestra en el sector productivo de una ciudad se obtienen los
siguientes datos (Base de datos empleo)
a. Pruebe la hipótesis nula de que el promedio de empleo en la industria es igual a
120.

pruebas de hipótesis para la industria


media de la muestra = 116,118
mediana de la muestra = 322,0
desviación típica de la muestra = 29,3421

x̄ = 120 (se rechaza)


x̄ ≠ 120 (se acepta)

b. Pruebe la hipótesis de que existe diferencia entre el promedio de la


industria y construcción.
comparación de medias
intervalo de confianza del 95,0% para la media de industria:
116,118 +/- 6,73562 [109,383; 122,854].
95,0% intervalo de confianza para la media de construcción:
86,3121 +/- 7,61454 [78,6976; 93,9267]
intervalo de confianza del 95,0% para la diferencia entre las medias
suponiendo varianzas iguales: 29,8061 +/- 9,97045 [19,8356; 39,7765]

prueba t para comparar medias


hipótesis nula: media1 = media2
hipótesis alternativa: media1 ne media2
suponiendo varianzas iguales: t = 5,9721 valor p = 1,13093e-7
rechazar la hipótesis nula para alfa = 0,05.

una prueba t para comparar las medias de las dos muestras. También construye
intervalos de confianza o límites para cada media y para la diferencia entre las
medias. Resulta especialmente interesante el intervalo de confianza para la
diferencia entre las medias, que va de 19,8356 a 39,7765. Desde intervalo no
contiene el valor 0, existe una diferencia estadísticamente significativa entre las
medias de las dos muestras al 95,0%

c. Pruebe la hipótesis de que existe diferencia entre la variabilidad de la


industria y construcción.

Radio de Varianzas = 0,782471


F-test to Compare Standard Deviations
Hipótesis nula: 𝛔1 = 𝛔2
Hipótesis alternativa: 𝛔1 ≠ 𝛔2
F = 0,782471 Valor P = 0,491731
No rechazar la hipótesis nula para alfa = 0,05

2. De una determinada empresa se conocen los siguientes datos, referidos al


volumen de ventas (en millones de pesetas) y al gasto en publicidad (en miles de
pesetas) de los últimos 6 años:

Volumen de Gastos de
ventas Y publicidad X
10 16
15 32
20 48
22 56
30 64
32 80

a. ¿Existe relación lineal entre las ventas de la empresa y sus gastos en


publicidad? Razona la respuesta.

R-cuadrado = 95,6584 por ciento


R-cuadrado (ajustado para d.f.) = 94,573 por ciento
Error estándar de Est. = 1,97536
Error medio absoluto = 1,25714
Estadística de Durbin-Watson = 2,72723 (P=0,6747)
Autocorrelación residual Lag 1 = -0,387327

El StatAdvisor
La salida muestra los resultados de ajustar un modelo de regresión lineal múltiple
para describir la relación entre Volumen de ventas(Y) y 1 variables independientes.
La ecuación del modelo ajustado es Volumen de ventas(Y) = 3,60408 +
0,362755*Gastos de publicidad(X)

Dado que el valor P de la tabla ANOVA es inferior a 0,05, existe una relación
estadísticamente significativa entre las variables al 95,0%. entre las variables con un
nivel de confianza del 95,0%.

El estadístico R-cuadrado indica que el modelo ajustado explica el 95,6584% de la


variabilidad del Volumen de ventas(Y). El estadístico R-cuadrado ajustado, más
adecuado para comparar modelos con diferentes números de variables
independientes, es del 94,573%. El error estándar de la estimación muestra que la
desviación de los residuos es de 1,97536. Este valor puede utilizarse para construir
límites de predicción para nuevas observaciones seleccionando la opción Informes
del menú de texto. El error medio absoluto (MAE) de 1,25714 es el valor medio de
los residuos. El estadístico Durbin-Watson (DW) comprueba los residuos para
determinar si existe una correlación significativa entre ellos.
Para determinar si existe una correlación significativa basada en el orden en que
aparecen en el archivo de datos.
Dado que el valor P es superior a 0,05, no hay indicios de autocorrelación serial en
los residuos con un nivel de confianza del 95,0%.

Para determinar si el modelo puede simplificarse, observe que el valor P más alto en
las variables independientes es 0,0007, perteneciente a Gastos de publicidad(X).
Como el valor P es inferior a 0,05, ese término es estadísticamente significativo con
un nivel de confianza del 95,0%. En consecuencia, probablemente no quieras
eliminar ninguna variable del modelo.

b. Obtener las rectas de regresión mínimo cuadrático.

la salida muestra los resultados de ajustar un modelo de regresión lineal múltiple para
describir la relación entre volumen de ventas (y) y 1 variables independientes.
la ecuación del modelo ajustado es
volumen de ventas (y) = 3,60408 + 0,362755*gastos de publicidad (x)
c. ¿qué volumen de ventas de la empresa se podría esperar en un año que se
gaste de publicidad 60000 pesos? ¿y para un gasto en publicidad de 200000
pesos?

VOLUMEN DE VENTAS (Y) = 3,60408 + 0,362755* GASTOS DE


PUBLICIDAD (X)

d. sí lo único que interesase fuese la evolución del volumen de ventas en términos


de gastos en publicidad, sin tener en cuenta la cantidad concreta de cada uno de
ellas, ¿existiría correlación ordinal entre ambas variables?

3,60408 x 16 = 57.66528
3,60408 x 32 = 115.33056
3,60408 x 48 = 172.99584
3,60408 x 56 = 201.82848
3,60408 x 64 = 230.66112
3,60408 x 80 = 288.3264

3. Se realiza un estudio dirigido al gasto familiar. Se desea conocer la relación que


afecte el gasto de alimentación mensual de una familia con el ingreso mensual, los
componentes de la familia y el ahorro familiar conseguido.

Gastos Ingreso Integrante de Ahorro


mensuales en mensual familia mensual
alimentos (Y)
5000 10000 6 500
6000 45000 9 2000
2000 11000 5 1000
3000 12000 6 500
1500 10500 3 1000
5000 10000 6 2000
6000 24000 6 2000
3000 6000 3 1800
6000 45000 6 1500
5000 45500 5 3000

a. Halla la ecuación del modelo de regresión lineal

Gastos mensuales en alimentos (Y = -443,857 + 0,0160889*Ingreso mensual +


589,584*Integrante de
familia + 0,718168*Ahorro mensual

b. Interprete los parámetros β0, β1, β2 y β3

B0:
-443,8565008

B1: si el ingreso mensual aumenta en una unidad los gastos mensuales aumenta en
0,0160889
B2: si el número de integrantes de una familia aumenta en una unidad se espera que
el gasto mensual en alimento aumente en 589,584
B3: si el ahorro mensual aumenta se espera que el ingreso mensual en alimento
aumente en 0,718168

c. Hallar el coeficiente de regresión lineal e interprételo


R-squared = 67,7907 percent
R-squared (adjusted for d.f.) = 51,6861 percent
Standard Error of Est. = 1195,53
Mean absolute error = 834,071
Durbin-Watson statistic = 1,36497 (P=0,0507)
Lag 1 residual autocorrelation = 0,196554

El coeficiente cuadrado es de 67,7907 por ciento y el coeficiente de correlación


ajustado es de 51,6861 por ciento
d. Construir una tabla de análisis de varianza

e. Determine las hipótesis

PRUEBA DE HIPÒTESIS
𝐻_0 = El modelo no es significativo
𝐻_1 =El modelo es significativo

f. ¿Considera usted que el modelo es significativo?

Dado que el valor P es mayor o igual a 0,05, ese término no es estadísticamente


significativo en el nivel de confianza del 95,0% o superior. En consecuencia,
debería considerar eliminar Ingreso mensual del modelo.

También podría gustarte