Matrícula Alumno
2888272 Jorge Adrian Quiroz
Actividad 4: Métodos para evaluar técnicas de pronósticos, modelos de
lineal simple e inferencia estadística
Descripción:
Objetivo de la actividad:
Utilizar métodos para evaluar técnicas de pronósticos, realizar la prueba de significancia de los estimadores y construir lo
confianza para el coeficiente de regresión para una serie de datos de pronósticos.
Descripción de la actividad:
A través de estos ejercicios, el alumno comprenderá cómo evaluar la relación entre dos variables cuantitativas y determin
relación es significativa por medio de la prueba de hipótesis.
Requerimientos para la actividad:
Calculadora científica y Excel.
Instrucciones (actividad colaborativa o individual):
Recomendación: Consulta la explicación del tema 8 y 9.
Recursos de apoyo: En el siguiente link encontrarás los recursos de apoyo del tema 8 y apoyos a los temas 9-10.
SITUACIÓN 1
Utiiza dos modelos de pronóstico para producir los valores futuros de una serie de tiempo del mes 1 al mes 10; estos valo
muestran en la siguiente tabla junto con los valores reales observados (Yt). Para el modelo 1, emplearás un promedio mó
para el modelo 2 emplearás una suavización exponencial con alfa=0.2 y el primer valor del pronóstico será 70.
Valores de pronóstico
Ŷt
Valor observado
Mes Modelo 1 Modelo 2
Yt
1 70
2 89
3 94
4 80
5 68
6 72
7 60
8 75
9 86
10 90
Calcula:
a) La desviación absoluta media (DAM).
b) El error cuadrático medio (ECM).
c) El error porcentual absoluto medio (EPAM).
d) El error porcentual medio.
e) ¿Alguno de los dos métodos parece superior? Justifica tu respuesta.
SITUACIÓN 2
Un vendedor observa el precio y volumen de las ventas de 10 semanas, elegidas aleatoriamente, de galones de
obtenidos se presentan en la tabla.
Nivel semanal de ventas en Precio de venta en
Semana miles de galones pesos
(y) (x)
1 10 1.30
2 6 2.00
3 5 1.70
4 12 1.50
5 10 1.60
6 15 1.20
7 5 1.60
8 12 1.40
9 17 1.00
10 20 1.10
Calcula:
a) Un diagrama de dispersión de los datos.
b) El modelo de regresión lineal.
c) El coeficiente de correlación.
SITUACIÓN 3
El Director de Seguridad Pública de una localidad quiere emplear el método científico para relacionar los bares y centros
número de accidentes automovilísticos en una ciudad del país. Ha extraído de las bases de datos los siguientes números
Accidentes
5 4 7 9
automovilísticos (Y)
Bares y centros de baile
12 10 15 30
(X)
Realiza lo siguiente:
a. Realiza un diagrama de dispersión.
b. Ajusta e interpreta los datos en un modelo de regresión lineal simple.
c. Prueba la significancia de la pendiente β 1.
d. Calcula e interpreta el coeficiente de determinación (R 2).
e. Elabora un intervalo de confianza del 90% para β 1.
f. Pronostica el número de accidentes automovilísticos cuando se tiene 11, 13 y 18 bares y centros de baile.
Preguntas de discusión en el aula
Con los conceptos vistos y puestos en práctica, da una respuesta justificada a las siguientes cuestiones:
a. ¿Para qué utilizarías la regresión lineal simple en un problema de tu especialidad?
b. ¿Qué relación tiene con la correlación?
c. ¿Cómo medirías el ajuste del modelo de regresión lineal obtenido?
d. ¿Qué es el coeficiente de determinación?
e. ¿Por qué crees que se llama regresión lineal?
f. ¿Cuál es la relación de la prueba de hipótesis con el intervalo de confianza en la regresión?
Nota para el alumno: Considera que tu actividad debe estar documentada (proceso) y fundamentada.
Entregable(s): Proceso y resultado de los ejercicios.
Criterios de evaluación de la actividad:
1. Soluciona los incisos planteados en las tres situaciones.
2. Respuesta justificada a cuestiones sobre los conceptos vistos.
os, modelos de regresión
estimadores y construir los intervalos de
es cuantitativas y determinar si esta
oyos a los temas 9-10.
es 1 al mes 10; estos valores (Ŷt) se
mplearás un promedio móvil de tamaño 2,
óstico será 70.
iamente, de galones de leche. Los datos
cionar los bares y centros de baile con el
os los siguientes números:
8 9 6
25 34 20
res y centros de baile.
estiones:
gresión?
entada.
SITUACION 1
Utiliza dos modelos de pronóstico para producir los valores futuros de una serie de tiempo del mes 1 al mes 10; est
observados (Yt).
Valores de pronóstico
Ŷt
Valor
Mes observado Modelo 1 Modelo 2
Yt
1 70 70
2 89 79.5 70
3 94 91.5 73.8
4 80 87 77.84
5 68 74 78.272
6 72 70 76.2176
7 60 66 75.37408
8 75 67.5 72.299264
9 86 80.5 72.8394112
10 90 88 75.47152896
Calcula:
a) La desviación absoluta media (DAM). Suma
Errores
Fórmula para calcular la desviación absoluta media
11.75 10.161347584
b) El error cuadrático medio (ECM).
Fórmula para calcular el error cuadrático medio
165.125 152.494161287
c) El error porcentual absoluto medio (EPAM).
Fórmula para calcular el error porcentual absoluto medio.
14.98% 12.72%
d) El error porcentual medio.
Fórmula para calcular el error porcentual medio.
1.77% 3.40%
e) ¿Cuál método parece superior? Justifica tu respuesta.
empo del mes 1 al mes 10; estos valores (Ŷt) se muestran en la siguiente tabla junto con los valores reales
Fórmula para calcular de forma manual la suavización exponencial
n 8
n 10
Error Valor Absoluto Error al cuadradError % Abso Error % Medio Error
0 0 0 0 0
14.5 14.5 210.25 0.1629213483146 0.1629213483 19
-11.5 11.5 132.25 0.1223404255319 -0.1223404255 20.2
-19 19 361 0.2375 -0.2375 2.16
-2 2 4 0.0294117647059 -0.0294117647 -10.272
-10 10 100 0.1388888888889 -0.1388888889 -4.2176
9 9 81 0.15 0.15 -15.37408
18.5 18.5 342.25 0.2466666666667 0.2466666667 2.700736
9.5 9.5 90.25 0.1104651162791 0.1104651163 13.160589
14.528471
9 94 1321 1.198194210387 0.1419120521 Suma 41.886116
Errores
.
valores reales
a suavización exponencial
Valor Absoluto Error al cuadrado Error % Abso Error % Medio
0 0 0 0
19 361 0.213483146 0.2134831461
20.2 408.04 0.214893617 0.214893617
2.16 4.6656 0.027 0.027
10.272 105.513984 0.151058824 -0.1510588235
4.2176 17.78814976 0.058577778 -0.0585777778
15.37408 236.3623358464 0.256234667 -0.2562346667
2.700736 7.293974941696 0.036009813 0.0360098133
13.1605888 173.20109756269 0.153030102 0.1530301023
14.52847104 211.07647076012 0.161427456 0.161427456
101.61347584 1524.941613 1.271715403 0.3399728668
SITUACIÓN 2
Un vendedor observa el precio y volumen de ventas de galones de leche de 10 semanas elegidas en forma aleato
obtenidos se presentan en la tabla.
Nivel semanal de
Precio de venta en
ventas en miles de
Semana pesos
galones
(x) (y)
1 1.30 10
2 2.00 6
3 1.70 5
4 1.50 12
5 1.60 10
6 1.20 15
7 1.60 5
8 1.40 12
9 1.00 17
10 1.10 20
Sumatorias 14.40 112.00
Medias 1.44 11.20
Calcula: B1 -14.5388349514562
a) Un diagrama de dispersión de los datos. B0 32.1359223300969
b) El modelo de regresión lineal. Y=32.1359-14.5388X +e
c) Y el coeficiente de correlación.
Sx 0.30258148581094
Sy 5.09465951321142
r -0.863488967253596
Coeficiente de Corre -0.863488967253602
egidas en forma aleatoria, los datos
x*y x^2 y^2 Grafico de Dispersion
13 1.69 100 25
12 4.00 36
8.5 2.89 25 20
18 2.25 144
15
16 2.56 100
Ventas
18 1.44 225
10
8 2.56 25
16.8 1.96 144 5
17 1.00 289
22 1.21 400 0
0.80 1.00 1.20 1.40 1.60 1.80 2.00 2.20
149.30 21.56 1488.00
Precio
1.80 2.00 2.20
SITUACIÓN 3
El Director de Seguridad Pública de una localidad quiere emplear el método científico para relacionar los ba
Ha extraído de las bases de datos los siguientes números:
Accidentes
automovilísticos 5 4 7 9 8 9
(Y)
Bares y centros 12 10 15 30 25 34
de baile (X)
x y x*y x^2 y^2
1 12 5 60 144 25
2 10 4 40 100 16
3 15 7 105 225 49
4 30 9 270 900 81 n
5 25 8 200 625 64
34 9 306 1156 81
6
20 6 120 400 36
7
Sumatoria 146 48 1101 3550 352
Media 6.85714286 20.8571429
B1 0.19779287 Se
B0 2.73174873 Sb1
y=0.19x+2.73+e
a. Realiza un diagrama de dispersión.
b. Ajusta e interpreta los datos en un modelo de regresión lineal simple.
c. Prueba la significancia de la pendiente β1.
d. Calcula e interpreta el coeficiente de determinación (R 2).
e. Elabora un intervalo de confianza del 90% para β 1.
1.- Establecimiento de hipotesis Intervalo de confianza del
2.- Estadistica de prueba
5.6386005
3.- Establecer la region de rechazo
ttabulada 2.015
4.- Regla de decision
Rechazar Ho si (tcalculada) es mayor a t tabulada
5.- Toma de decision
Si rechaza Ho puesto que en este caso es el valor absoluto de tcalculada = 5.6386 es mayor que ttabulada =
2.015 se concluye que hay suficientes evidencia de que exista relacion entre los bares y centros de bailes y
accidentes automovilisticos
f. Pronostica el número de accidentes automovilísticos cuando se tiene 11, 13 y 18 bares y centros
x y
11 4.90747029
13 5.30305603
18 6.29202037
o para relacionar los bares y centros de baile con el número de accidentes automovilísticos en una ciudad del país.
6
Grafico de Dispersion
10
20 9 f(x) = 0.197792869269949 x + 2.73174872665535
8 R² = 0.86410759762309
7
6
Axis Title
5 Column D
4 Linear (Column D)
3
7 2
1
0
5 10 15 20 25 30 35 40
Axis Title
0.78817664 Coef de corre 0.92957388
0.03507836 r2 0.8641076
86%
tervalo de confianza del %90
0.12710997
0.26847577
mayor que ttabulada =
s y centros de bailes y
3 y 18 bares y centros de baile.