Pronósticos en Investigación Operativa II
Pronósticos en Investigación Operativa II
Investigación Operativa II
Introducción
Investigación Operativa II
Pronósticos
✓ Es el arte y la ciencia de predecir los acontecimientos
futuros, de manera que las proyecciones se puedan
incorporar en el proceso de toma de decisiones.
Investigación Operativa II
Los Inventarios y los Pronósticos
✓ Sistema de inventario: conjunto de políticas que monitorean y determinan los
niveles de inventario que se deben mantener, momentos de reposición de
existencias y tamaño de los pedidos.
✓ Costo total de inventario
✓ Costo de compra (~ D)
✓ Costo de pedido o de preparación (~ D/Q )
✓ Costo de mantenimiento: instalaciones, roturas, depreciación , etc. (~ Q)
✓ Costo de agotamiento ✓ Q = cantidad económica de pedido.
✓ S = costo de pedido
✓ Siendo D= Demanda estimada ✓ H = costo de mantenimiento.
y Q= (2*D*S/H)1/2
Por lo tanto:
✓ Comercialización
✓ Planificación financiera
✓ Planificación de la producción
Investigación Operativa II
Tipo de Datos
✓ Los datos de individuos o entidades diferentes: trabajadores;
consumidores; empresas; administraciones públicas; etc., para
un único periodo de tiempo se denominan datos de sección
cruzada o de corte transversal.
✓ Los datos de series temporales o serie de tiempos son datos
para un único individuo o entidad (persona, empresa, país)
recogidos para múltiples periodos.
✓ Los datos de panel, asimismo denominados datos
longitudinales, son datos sobre varios individuos en los que
cada individuo se observa durante uno, dos o más periodos de
tiempo.
Investigación Operativa II
Métodos de Pronósticos
✓ Métodos Cualitativos
✓ Métodos Causales
Investigación Operativa II
Métodos Cualitativos
✓ Se fundamentan en juicios gerenciales y son útiles cuando faltan datos
o cuando los anteriores no son indicadores confiables de situaciones
futuras, o para la introducción de nuevos productos.
✓ Estos métodos se utilizan en general para realizar pronósticos en el
mediano y largo plazo.
▪ El Método Delphi
▪ Consenso de Panel
▪ Encuestas de mercado
Investigación Operativa II
Métodos Causales
✓ Comúnmente, se dice que una acción causa un resultado si el
efecto es el resultado directo, o consecuencia, de esta acción.
La causalidad significa que una acción específica (aplicar
fertilizante) conlleva una consecuencia específica, medible
(más tomates).
✓ Estos métodos desarrollan un modelo de causa y efecto entre
la variable en estudio y otras variables que pueden afectar su
comportamiento (ejemplo de demanda: políticas
gubernamentales, promociones publicitarias, etc.).
✓ Pueden ser de naturaleza estadística como es el caso de los
modelos de regresión y econométricos o descriptivos como el
caso de los modelos de entrada-salida, ciclo de vida y
simulación por computadora.
Investigación Operativa II
Métodos de Proyección Histórica o Serie de
Tiempo
✓ Estos métodos sirven para el análisis detallado de los patrones de la
variable en estudio, anterior en el transcurso del tiempo y para
proyectar tales patrones hacia el futuro.
✓ Una serie de tiempo puede verse como la representación de los
resultados de una variable aleatoria de interés, por lo general
registrados a intervalos igualmente espaciados durante un período
fijo.
✓ Predecir, es estimar el futuro utilizando información del pasado y del
presente. El conocimiento del futuro capacita para planificar, prever
o prevenir.
✓ La idea de estimar X(t) en un instante n+k posterior al último dato
observado en t = n, k = 1, 2, 3, 4, … (trimestre, mes, etc.).
✓ Se utilizan para realizar pronósticos en el corto plazo.
✓ Son técnicas utilizadas en general para realizar la planificación y
control de inventarios, programación de envíos, etc.
Investigación Operativa II
Exploración de Patrones de Datos o
Componentes Sistemáticas de Serie de
Tiempos
Patrón • Las observaciones fluctúan alrededor de un nivel constante o promedio.
Horizontal
o Nivel
• Es la oscilación alrededor de la tendencia que por lo común es afectada por las condiciones
Patrón
económicas generales. Se fundamenta en la teoría de los ciclos económicos, los que muestran
Cíclico sucesivamente períodos de prosperidad y depresión.
• Es el patrón de cambios que se repite año a año. La estacionalidad está afectada por el clima,
Patrón patrones de compra, fechas importantes, festividades religiosas.
Estacional
Investigación Operativa II
Descomposición de la Serie de Tiempo
Investigación Operativa II
Demanda a lo largo de 4 años
Investigación Operativa II
Exploración de Patrón de Datos con Análisis
de Autocorrelación
Coeficiente de autocorrelación k
Investigación Operativa II
Exploración de Patrón de Datos con Análisis
de Autocorrelación
Coeficiente de autocorrelación k
Investigación Operativa II
Promedio Móvil y
Suavizado
Exponencial
Exploración de Patrones de
Datos de Serie de Tiempos
Investigación Operativa II
Suavización de una serie de tiempo
Investigación Operativa II
Promedios Móviles
Investigación Operativa II
Pronóstico con Promedio Móvil
✓ Como se supone que la serie es plana, el mejor
pronóstico para el período t+1 es simplemente una
continuación del valor promedio que se observa a lo
largo del período t. De esta manera se tiene:
Ft +1 = Pt
Ft +1 = Pt = W1 xt + W2 xt −1 + ... + WN xt − N +1
Investigación Operativa II
Pronóstico con Promedio Móvil Doble
✓ El método consiste en calcular un conjunto de promedios
móviles y en seguida se calcula un segundo conjunto como
promedio móvil del primero.
✓ Este método se utiliza para realizar pronósticos de series que
tienen una tendencia lineal, es una corrección del “Método del
Promedio Móvil Simple”, para incorporar la tendencia, el cual
presenta un rezago respecto de la serie original en estos casos.
✓ La siguiente expresión es la ecuación con la cual se calcula el
primer promedio móvil. x + x + ... + xt −1
Ft +1 = t t − N +1
Investigación Operativa II
Suavización Exponencial
Investigación Operativa II
Método de Suavizado
Exponencial (SE)
El pronóstico se calcula a partir de la siguiente expresión:
Ft +1 = Ft + (xt − Ft ) con k ≤ t ≤ n
k
xt
Ft =
Cuando t=k
i =1 k
Investigación Operativa II
F = pronóstico [$ ó Kg]
Investigación Operativa II
✓ Desarrollando la ecuación llegamos a la siguiente
relación recursiva entre Ft+1 y Ft de manera
alternativa, Ft+1 se puede expresar como:
Ft +1 = xt + (1 − ) xt −1 + (1 − )2 xt −2 + ...
Investigación Operativa II
✓ El modelo básico de ajuste exponencial da buenos
resultados cuando los cambios en los componentes
de tendencia y estacionalidad no son tan grandes.
Investigación Operativa II
Método de Suavizado
Exponencial corregido por Tendencia (SET)
Método Holt
✓ Cuando existe una tendencia, el modelo anterior se corrige
con los siguientes factores:
St +1 = xt + (1 − )(St + Tt )
Tt +1 = (St +1 − St ) + (1 − )Tt
Ft +1 = St +1 + Tt +1 con k ≤ t ≤ n
Cuando t = k si k = 1; Tt=0
k
xt
St = si k>1; Tt=b1 pendiente
i =1 k
Investigación Operativa II
Ft+1= pronóstico con tendencia
corregida para el período (t+1)
St = Pronóstico inicial para el período t
Tt = tendencia para el período t
β = constante de ajuste de tendencia (0≤β≤1)
✓ En el caso especial que α = β, el método de
Holt es equivalente al doble suavizado
exponencial de Brown.
Investigación Operativa II
Método de SuavizadoExponencial corregido por
Tendencia y Estacionalidad (SETE)
Método Holt - Winters
Cuando existe tendencia y estacionalidad, el modelo es:
St +1 = (xt / I (t − L ) ) + (1 − )(St + Tt )
Tt +1 = (St +1 − St ) + (1 − )Tt con k ≤ t ≤ n
I t = (xt / St ) + (1 − )I ( t−L )
Ft +1 = (St +1 + Tt +1 )I (t −L+1)
Cuando t = k
k
xt Tt=b1 pendiente
St = y
i =1 k
I (t − L ) = xt / xt
Investigación Operativa II
Ft+1= pronóstico con tendencia y estacionalidad
corregidas para el período (t+1)
Investigación Operativa II
✓ Estos métodos de pronóstico intuitivos y de fácil
comprensión, son muy útiles y con muy buenos
resultados empíricos especialmente en el área de
negocios y empresas.
✓ No obstante sufren una crítica fundamental:
✓ no existe un modelo estadístico que sustente la representación de
los datos.
Investigación Operativa II
Descomposición de
Serie de Tiempo
Exploración de Patrones de
Datos de Serie de Tiempos
Investigación Operativa II
Método de Descomposición Clásica de Series
de Tiempo
✓ Considerando los cuatro factores en los podemos descomponer el patrón de una serie de
tiempo, se obtiene:
F = T I C R ó F =T + I +C + R
Siendo: R = C = 1 (modelo multiplicativo)
R = C = 0 (modelo aditivo)
I t = xt / Pt
La estacionalidad se obtiene a través de una
relación con la línea de tendencia o con el I t = xt / Tt ó
promedio o promedio móvil, como:
Ft = Tt I (t − L ) ó Ft = Tt + I (t − L )
Investigación Operativa II
F = Pronóstico de la v. (en unidades o en $)
I = Índice de estacionalidad
C = Índice cíclico
R = Índice residual
Investigación Operativa II
✓ Variación estacional aditiva: este tipo de variación
supone simplemente que la cantidad estacional es
constante independientemente de la cantidad de la
tendencia o promedio.
Proyección: Tendencia + Factor Estacional
Investigación Operativa II
Tendencia Lineal
✓ El factor componente de una serie de tiempo que se estudia
con mayor frecuencia es la tendencia.
yˆ = b0 + b1 xi
yˆ = 0 + 1 xi
Siendo:
bo = y − b1 x ordenada al origen
n
n
( xi − x )( yi − y ) x y i i − xy
b1 = i =1
n = i =1
n
( xi − x )2
i − 2 2
i =1 x x pendiente
i =1
Investigación Operativa II
Confiabilidad del Modelo
SCR (
i i
y − ˆ
y )2
✓ SCT= Suma de cuadrados total
R2 = = 1−
(yi − y )
2
SCT
✓ Coeficiente de correlación
r= R2
Investigación Operativa II
Medidas de variación
Investigación Operativa II
Test de Significación
✓ Estadístico
S xy
Sb1 =
b −0
= i
( x)
2
tn−2 x − n
2 i
i
Sbi
✓ Con t crítico:
1 x2
t * ,n −2 Sb0 = S xy n+
2
( xi )2
xi 2 −
n
Investigación Operativa II
Test t de Significación
-t* t*
Investigación Operativa II
Regresión no lineal
✓ Regresión Semilogarítmica
ˆy = ab x
log yˆ = log a + x log b
✓ Regresión Logarítmica
ˆy = axb
log yˆ = log a + b log x
Investigación Operativa II
Regresión no lineal
✓ Regresión Polinómica
yˆ = bo + b1 x + b2 x + ... + bk x
2 k
Investigación Operativa II
Regresión Lineal Múltiple
✓ En los modelos analizados hasta aquí el
tiempo es la única variable que se ha
considerado. En la medida que otras variables
muestren una relación con el valor a
pronosticar estas también pueden incluirse en
el modelo.
(y − yˆ i )
2 k: Cantidad de variables
SCE
S xy = =
i independientes
n − k −1 n − k −1
✓ Coeficiente de determinación múltiple
SCR ( y − ˆ
y )2
R2 = = 1− i i
SCT (
i y − y )2
✓ Coeficiente de correlación
r = R2
✓ R^2 Ajustado
n −1
= 1 − (1 − R )
2 2
R
n − k − 1
aj
Investigación Operativa II
Test F de Significación
✓ Con F crítico:
F ( , k , n − k −1)
Investigación Operativa II
Distribución F
Investigación Operativa II
Test F de Significación: ejemplo
t*
Investigación Operativa II
Test t de Significación
Investigación Operativa II
Variaciones Estacionales
It = 1 estación promedio
It < 1 estación por debajo del promedio
It > 1 estación por arriba del promedio
Investigación Operativa II
Ventas mensuales de los dos últimos años (unidades)
Mes Demanda Demanda Demanda Índice
Año 1 Año 2 promedio del promedio estacional
período total promedio
Enero 80 100 90 1128/12=94 90/94=0.957
Febrero 85 75 80 94 80/94=0.851
Marzo 80 90 85 94 85/94=0.904
Abril 110 90 100 94 100/94=1.064
Mayo 115 131 123 94 123/94=1.309
Junio 120 110 115 94 115/94=1.223
Julio 100 110 105 94 105/94=1.117
Agosto 110 90 100 94 100/94=1.064
Septiembre 85 95 90 94 90/94=0.957
Octubre 75 85 80 94 80/94=0.851
Noviembre 85 75 80 94 80/94=0.851
Diciembre 80 80 80 94 80/94=0.851
Demanda total promedio = 1128
Investigación Operativa II
✓ Si se espera que la demanda anual para el
tercer año sea de 1200 unidades.
✓ No se puede pronosticar que en cada mes la
demanda sea de 100 u, pero puede ajustarse
con base a los índices estacionales de la
siguiente forma:
Ene. 100*0.957 = 96 Dic. 100*0.851 = 85
Feb. 100*0.851 = 85
Mar. 100*0.904 = 90
Abr. 100*1.064 = 106
.
.
.
Investigación Operativa II
Variaciones Estacionales con Tendencia
✓ Paso 1: Determinar el factor estacional, se realiza un
promedio de los mismos trimestres en el período. Se
hace un promedio de todas las variaciones que
ocurren dentro de una estación.
✓ 1.1 Se calculan los promedios móviles con un período
m correspondiente a una estación completa.
✓ 1.2 Si m es par se deben centrar los promedios (PMC).
Investigación Operativa II
✓Paso 1: Obtención de los índices estacionales
0.5(108) + 125 + 150 + 141+ 0.5(116)
PMC = = 132
4
Año Trimestre Ventas PMC Proporción
(millones $) Estacional
1 1 108
2 125
3 150 132 1.136
4 141 134.125 1.051
2 1 116 136.375 0.851
2 134 138.875 0.965
3 159 141.125 1.127
4 152 143 1.063
3 1 123 145.125 0.848
2 142 147.875 0.960
3 168
4 165
Investigación Operativa II
Proporción estacional = Ventas trimestre 3/PMC = 150/132=1.136
Investigación Operativa II
✓ La suma de los índices estacionales es 4, no se deben corregir.
Investigación Operativa II
✓ Paso 3: Desarrollar una línea de regresión para los datos
desestacionalizados
Investigación Operativa II
Después de probar confiabilidad y significación de los coeficientes
Modelo:
𝐹𝑖𝑇1 = 127,178 + 2,33 ∗ 𝑥𝑖 * 0,85
𝐹𝑖𝑇2 = 127,178 + 2,33 ∗ 𝑥𝑖 * 0,96
𝐹𝑖𝑇3 = 127,178 + 2,33 ∗ 𝑥𝑖 * 1,13
𝐹𝑖𝑇4 = 127,178 + 2,33 ∗ 𝑥𝑖 * 1,06
Investigación Operativa II
✓ Pronóstico
Período xi Pronóstico
Investigación Operativa II
Uso de la regresión lineal múltiple con
componentes de tendencia y estacionales
yˆ = b0 + b1 x1 +b2 x2 + b3 x3 + b4 x4
Donde:
x1 = período
x2 = 1 si el trimestre es 2
= 0 si no es así
x3 = 1 si el trimestre es 3
= 0 si no es así
x4= 1 si el trimestre es 4
= 0 si no es así
si x2 = x3 = x4 = 0 entonces el trimestre tendría que ser el 1
Investigación Operativa II
Ejemplo
Año Trimestre Ventas x1 x2 x3 x4
(millones)
1 T1 108 0 0 0 0
T2 125 1 1 0 0
T3 150 2 0 1 0
T4 141 3 0 0 1
2 T1 116 4 0 0 0
T2 134 5 1 0 0
T3 159 6 0 1 0
T4 152 7 0 0 1
3 T1 123 8 0 0 0
T2 142 9 1 0 0
T3 168 10 0 1 0
T4 165 11 0 0 1
Investigación Operativa II
Modelo
Investigación Operativa II
Significado de las pendientes del ejemplo
Investigación Operativa II
ARIMA
Exploración de Patrón de
Datos con Análisis de
Autocorrelación
Investigación Operativa II
Modelado Autorregresivo para Ajuste de la
Tendencia y Pronóstico
✓ Con frecuencia se encuentra que los valores de una
serie de datos en puntos específicos del tiempo tienen
una correlación alta con los valores que les preceden
y que les siguen.
✓ Una autocorrelación de primer orden se refiere a la
magnitud de asociación entre valores consecutivos en
una serie de tiempo.
✓ Una autocorrelación de orden p se refiere a la
magnitud de asociación entre valores de una serie de
tiempo con p períodos de separación también
llamados retrasos, retardos o rezagos.
Investigación Operativa II
✓ La propia historia de la variable influye sobre
el comportamiento de los procesos dinámicos.
✓ Para obtener un mejor ajuste histórico de los
datos y, al mismo tiempo hacer pronósticos
útiles de su comportamiento futuro, deben
aprovecharse las características de la
autocorrelación potencial inherentes a este tipo
de datos mediante la aplicación de los métodos
de modelado autorregresivos.
Investigación Operativa II
Datos autocorrelacionados
Investigación Operativa II
Correlograma
Coeficiente de autocorrelación k
Investigación Operativa II
Correlograma
Investigación Operativa II
Correlograma
Investigación Operativa II
Correlograma
Investigación Operativa II
Significación de los coeficientes de
autocorrelación
Investigación Operativa II
Significación de los coeficientes de
autocorrelación
✓ Una forma de calcular la desviación estándar, 𝑆𝐸 𝑟𝑘 de la
autocorrelación en el retraso k, es:
1+2 σ𝑘−1
𝑖=1 𝑟𝑖
2
𝑆𝐸 𝑟𝑘 =
𝑛
Investigación Operativa II
Análisis de la tendencia en autocorrelación
Investigación Operativa II
Análisis de la estacionalidad en
autocorrelación
✓ Si una serie es estacional, se repite el mismo patrón año a año
en fechas o períodos específicos del calendario.
Investigación Operativa II
Análisis de la estacionalidad en
autocorrelación
Investigación Operativa II
Modelos ARIMA
Modelo Autorregresivo
✓ Modelo autorregresivo de primer orden AR(1) o
ARIMA(1,0,0):
yi = A0 + A1 yi −1 + i
Investigación Operativa II
✓ Una vez que se selecciona el modelo y que se usan los métodos de
regresión de mínimos cuadrados para obtener las estimaciones de los
parámetros, el siguiente paso es determinar si el modelo es
adecuado.
Investigación Operativa II
Prueba t para la significancia del parámetro
Ap de autorregresión de orden más alto
✓ H0: Ap = 0 no hay relación significativa el parámetro
de orden más alto es 0
✓ H1: Ap≠ 0 existe relación significativa, el parámetro
de orden más alto es significativo
✓ Estadístico
a p − Ap
t=
Sa p
✓ Con t crítico:
t , n − 2 p −1
2
Investigación Operativa II
Modelo autorregresivo ajustado de orden p
yˆi = a0 + a1 yi −1 + a2 yi −2 + ... + a p yi − p
Investigación Operativa II
Uso del modelo autorregresivo de orden p
para pronosticar
yˆ n+ j = ao + a1 yˆ n+ j −1 + a2 yˆ n+ j −2 ... + a p yˆ n+ j − p
Investigación Operativa II
✓ a0, a1, a2,…,ap= estimadores regresivos de los
parámetros A0, A1, A2,…,Ap
Investigación Operativa II
Pasos para el modelado autorregresivo para
datos de una serie de tiempo anual
✓ 1. Seleccionar un valor de p (parámetro de orden más alto)
Investigación Operativa II
Pasos para el modelado autorregresivo para
datos de una serie de tiempo anual
✓ 2. Probar la significancia de Ap
Investigación Operativa II
Modelo ARIMA (p, d, q)
✓ Modelo de Medias Móviles MA(q) también describe una serie
temporal estacionaria. En este modelo el valor actual puede
predecirse a partir de la componente aleatoria de este momento
y en menor medida teniendo en cuenta los impulsos o errores
aleatorios anteriores. El modelo ARIMA(0,0,1), también
denotado por MA(1), viene dado por la expresión:
yt = + t − 1 t −1
Donde:
= valor promedio que permanece constante en el proceso
1 = coeficiente que será estimado
εt-1= errores en períodos anteriores al tiempo t, incorporados en la respuesta yt
Investigación Operativa II
Modelo ARIMA (p, d, q)
y t = + t − 1 t −1 − 2 t − 2 − ... − q t − q
Investigación Operativa II
Modelo ARIMA (p, d, q)(P,D,Q)n
✓ Una serie regular y variaciones de tendencia o cíclicas se
puede representar mediante un modelo
ARIMA(p,d,q)(P,D,Q)n. El primer paréntesis se refiere a la
parte regular, y el segundo a las variaciones estacionales o
cíclicas, n corresponde a los períodos que conforman la
estación completa, por ejemplo n = 4 indica que una estación
está formada por 4 períodos, esto indica que la serie es
trimestral. Es decir, las veces que la serie se mide al año.
✓ Por ejemplo: el parámetro d significa aplicar primeras
diferencias d veces, D indica que para hacer la serie
estacionaria se deben emplear n diferencias D veces.
Investigación Operativa II
Metodología Box - Jenkins
Investigación Operativa II
Metodología Box - Jenkins
✓ Recogida de datos: es conveniente disponer de 50 o más datos.
✓ Representación gráfica de la serie: para decidir sobre la estacionariedad
(medias y varianzas invariantes en el tiempo) de la serie es de gran utilidad
disponer de un gráfico de la misma. Se pueden utilizar medias y
desviaciones típicas por subperíodo para juzgar sobre la estacionariedad. La
estimación de un modelo ARIMA exige que el proceso estocástico
subyacente que generó la serie no varíe con respecto al tiempo. Si las
características del proceso estocástico cambian no resultará posible la
obtención de una estimación con propiedades estadísticas razonables.
✓ Si el futuro es como el pasado, entonces las relaciones históricas se pueden
utilizar para predecir el futuro, se habla de una serie estacionaria. No ocurre
estacionariedad cuando:
✓ La serie presenta movimientos persistentes a largo plazo
✓ La serie puede ser inestable en el tiempo, muestra puntos de ruptura
Investigación Operativa II
Metodología Box - Jenkins
✓ Transformación previa de la serie: La transformación de
Box-Cox o transformación lambda, es una transformación de
potencia, W=Y^, donde se determina el mejor valor para λ.
Una apropiada transformación estabiliza la variabilidad de Y y
produce que las desviaciones alrededor del modelo sean más
normalmente distribuidas.
✓ Si el valor de lambda es igual a cero, se lleva a cabo la
transformación logarítmica de la serie inicial, y si dicho valor
es distinto a cero la transformación es potencial.
✓ La mejor estimación de lambda (λ) podría ser cualquier
número entre -5 y 5, en cualquier situación práctica se desea
un valor de λ que corresponda a una transformación
comprensible, como la raíz cuadrada (λ=0.5, 𝑊 = 𝑌) o el
logaritmo natural (λ=0, 𝑊 = ln 𝑌).
Investigación Operativa II
Metodología Box - Jenkins
✓ La transformación logarítmica es muy frecuente,
incluso en series con dispersión relativamente
constante en el tiempo. Una posibilidad es ensayar
con y sin transformación y comprobar resultados.
✓ Si la serie en niveles presenta un crecimiento
exponencial (crece a un determinado porcentaje
medio anual) el logaritmo de la serie muestra un
crecimiento lineal.
✓ La variación en el logaritmo de una variable es
aproximadamente igual a la variación porcentual de la
variable en niveles.
Investigación Operativa II
Metodología Box - Jenkins
Investigación Operativa II
Metodología Box - Jenkins
Investigación Operativa II
Metodología Box – Jenkins
Identificación
Investigación Operativa II
Metodología Box - Jenkins
✓ Identificación del modelo: consiste en determinar el tipo del
modelo más adecuado para la serie objetivo de estudio, es
decir, el orden de los procesos autorregresivos y de medias
móviles de las componentes regular y estacional.
Técnicamente esta decisión se tomará en base a las funciones
de autocorrelación y autocorrelación parcial. Habitualmente se
seleccionan los procesos más sencillos AR(1), AR(2), MA(1),
MA(2), ARMA(1,1), tanto en la parte regular como la
estacional. En caso de duda se eligen varios modelos los que
serán estimados y contrastados posteriormente.
✓ Estimación de los coeficientes del modelo: decidido el
modelo se procede a la estimación de sus parámetros, dado que
se trata de un procedimiento iterativo de cálculo, pueden
sugerirse valores iniciales.
Investigación Operativa II
Metodología Box - Jenkins
✓ Contraste de validez conjunta del modelo: se utilizan
diversos procedimientos para valorar el o los modelos
inicialmente seleccionados: contraste de significación de los
parámetros, covarianzas entre estimadores, coeficientes de
correlación, suma de cuadrados de los errores, etc.
✓ Análisis detallado de los errores: las diferencias entre
valores reales y estimados por el modelo constituyen una
fuente de especial interés para la valoración final del modelo.
Deberá comprobarse un comportamiento no sistemático de los
mismos, así como analizarse la posible existencia de errores
especialmente significativos.
Investigación Operativa II
Metodología Box - Jenkins
Investigación Operativa II
Criterios para la selección de un modelo
Investigación Operativa II
Criterios para la selección de un modelo
✓ En la elección del orden de un modelo resulta
necesario equilibrar el beneficio marginal de incluir
más órdenes, con el costo marginal de la
incertidumbre adicional de la estimación.
✓ Por un lado, si el orden de una autorregresión
estimada es demasiado bajo, se omite información
potencialmente valiosa.
✓ Por otro lado, si el orden es demasiado elevado, se
estiman más coeficientes que los necesarios, lo que a
su vez introduce errores de estimación adicionales en
las predicciones. El modelo está sobreparametrizado.
Investigación Operativa II
Criterios para la selección de un modelo
✓ Se ha desarrollado una metodología para la selección
que considera el ajuste del modelo y los parámetros.
✓ Criterio de la información de Akaike o AIC,
selecciona el modelo de un grupo de candidatos como
aquel que minimice el siguiente estadístico:
2 2
𝐴𝐼𝐶 = ln 𝜎ො + 𝑟
𝑛
Donde:
𝜎ො 2 = suma de cuadrado de los residuales dividida por el
número de observaciones
𝑛 = el número de observaciones residuales
𝑟 = el número total de los parámetros del modelo ARIMA
incluyendo el término constante
Investigación Operativa II
Criterios para la selección de un modelo
✓ Criterio Bayesiano de información que desarrolló Schwarz o
BIC, selecciona el modelo que minimiza, el siguiente
estadístico:
ln 𝑛
𝐵𝐼𝐶 = ln 𝜎ො 2 + 𝑟
𝑛
✓ El segundo término en ambos criterios es un factor de castigo
por incluir parámetros adicionales en el modelo.
✓ El criterio BIC impone un castigo mayor por el número de
parámetros.
✓ Estos criterios deben tomarse como procedimientos
adicionales que ayudan a la selección del modelo. No deben
emplearse como sustitutos de un examen de autocorrelaciones
de la muestra y autocorrelaciones parciales.
Investigación Operativa II
ERRORES DE
PRONÓSTICO
Investigación Operativa II
Errores en la proyección
Error = xt − Ft
✓ La desviación media absoluta MAD es una
forma sencilla y útil de medir el error.
n
xt − Ft
MAD = t = k
n
Investigación Operativa II
Errores en la proyección
Señal de Rastreo (TS)
✓ La señal de rastreo TS es otra forma de analizar el error de la
proyección y es una medida que indica si el promedio de
proyección está manteniendo el ritmo de los cambios reales
de la variable. Es el número de desviaciones medias
absolutas en que el valor de la proyección se encuentra por
arriba o por debajo de la ocurrencia real.
Se calcula como:
RSFE
TS =
MAD
n
Investigación Operativa II
Otra forma de medir el error
𝑛
1 2
𝑀𝑆𝐸 = 𝑥𝑡 − 𝐹𝑡 Error cuadrático medio
𝑛
𝑡=1
𝑛
1 2
Raíz cuadrada del error cuadrático
𝑅𝑀𝑆𝐸 = 𝑀𝑆𝐸 = 𝑥𝑡 − 𝐹𝑡
𝑛 medio
𝑡=1
𝑛
1 𝑥𝑡 − 𝐹𝑡
𝑀𝐴𝑃𝐸 = Error porcentual absoluto medio
𝑛 𝑥𝑡
𝑡=1
(cuan grande es el error)
𝑛
1 (𝑥𝑡 − 𝐹𝑡 )
𝑀𝑃𝐸 = Error porcentual medio
𝑛 𝑥𝑡
𝑡=1
(sesgo del pronóstico)
Investigación Operativa II
Otra forma de medir el error
FA (forecast accuracy)
✓ La forma más común de medir la precisión de un pronóstico (forecast
accuracy) es comparar los resultados del pronóstico contra los valores
reales del siguiente periodo. El objetivo es encontrar valores cercanos a 1
para emitir juicios favorables sobre el modelo de pronóstico seleccionado.
La fórmula utilizada para este efecto es:
𝑥𝑡 −𝐹𝑡
𝐹𝐴 = 1 − %
𝑥𝑡
✓ Aun cuando ésta es una de las medidas más utilizada entre los
pronosticadores, sólo se recomienda utilizarla en el corto plazo (no más de
tres períodos).
✓ Si el modelo seleccionado se ajustó muy bien a los datos históricos no
necesariamente es igual de efectivo en el momento de pronosticar.
Investigación Operativa II
Otra forma de medir el error
U de Theil
✓ El coeficiente de desigualdad U de Theil es otra medida que permite analizar la
efectividad del modelo seleccionado en la predicción. Las medidas de errores
absolutos en lugar de los cuadráticos, suelen presentar sesgos y éstos últimos
penalizan en mayor medida los errores grandes. La elección dependerá de la
importancia que se les dé a los grandes errores.
✓ El coeficiente de desigualdad U de Theil presenta una solución para estos
escenarios.
✓ Si el valor de U es cercano a cero, supone una predicción perfecta. Su formulación
está basada en la diferencia cuadrática que existe entre las tasas de crecimiento de
la variable real y la estimada. Este coeficiente se puede utilizar para evaluar la
efectividad del pronóstico a mediano plazo. Si U toma el valor unitario la
predicción no mejora el método naive (Ft+1 = xt), si U es mayor a 1 la capacidad
predictiva del modelo es menor a la del método naive.
σ𝑛𝑖=1 𝑥𝑡 − 𝐹𝑡 2
𝑈𝑡 =
σ𝑛𝑡=1 𝑥𝑡 − 𝑥𝑡−1 2
Investigación Operativa II
Otra forma de medir el error
✓ MAPE ajustado
𝑛
1 𝑥𝑡 − 𝐹𝑡
𝑆𝑀𝐴𝑃𝐸 =
𝑛 𝑥𝑡 + 𝐹𝑡
𝑡=1
2
Investigación Operativa II
Otra forma de medir el error
SMAPE
✓ Error porcentual absoluto medio simétrico
✓ SMAPE o sMAPE es una medida de precisión basada en errores porcentuales o
relativos
✓ Expresión:
𝑛
100% 𝑥𝑡 − 𝐹𝑡
𝑆𝑀𝐴𝑃𝐸 =
𝑛 𝑥𝑡 + 𝐹𝑡
𝑡=1
2
✓ La expresión tiene límite inferior y superior, varía entre 0 y 200%
✓ Otra representación que también se utiliza es más fácil de interpretar varía
entre 0 y 100%, el SMAPE también se puede calcular de la siguiente
forma:
𝑛
100% 𝑥𝑡 − 𝐹𝑡
𝑆𝑀𝐴𝑃𝐸 =
𝑛 𝑥𝑡 + 𝐹𝑡
𝑡=1
Investigación Operativa II
Otra forma de medir el error
GMRAE
✓ Error absoluto de la media geométrica relativa.
✓ Es calculado usando el error relativo entre el modelo seleccionado y el
modelo naive. Si GMRAE es del 54% indica que el tamaño del error del
modelo calculado es del 54% del error calculado empleando el modelo
naive.
✓ Expresión:
𝑛
𝑛 𝑥𝑡 − 𝐹𝑡
𝐺𝑀𝑅𝐴𝐸 = ෑ
𝑥𝑡 − 𝐹𝑡∗
𝑡=1
𝑥 , 𝑠𝑖 𝑙𝑎 𝑠𝑒𝑟𝑖𝑒 𝑒𝑠 𝑛𝑜 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑙
Donde 𝐹𝑡∗ ቊ 𝑡−1
𝑥𝑡−𝑀 , 𝑠𝑖 𝑙𝑎 𝑠𝑒𝑟𝑖𝑒 𝑒𝑠 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑙,
Siendo M la estación completa
Investigación Operativa II
Reducción del error
Investigación Operativa II
Guía para seleccionar un modelo con el
propósito de pronosticar
1. Realizar un análisis residual
2. Medir la magnitud del error residual mediante
los cuadrados de las diferencias.
3. Medir la magnitud del error residual mediante
las diferencias absolutas.
4. Utilizar el principio de parsimonia: el cual
indica que se debe elegir el modelo más
sencillo y adecuado.
Investigación Operativa II
Análisis Residual
✓ Para evaluar si el modelo es idóneo, se grafican los
residuos en función del período.
✓ Se evalúa que los residuos cumplan las siguientes
suposiciones:
✓ Homocedasticidad: deben presentar varianzas iguales para cada
período.
Investigación Operativa II
Test de Durbin Watson
✓ Además de la gráfica de los residuales, la autocorrelación se
puede detectar y medir con el estadístico de Durbin-Watson,
que mide la correlación entre cada residual para el período
inmediato anterior, al de interés. El estadístico se define de la
siguiente forma:
σ𝑛𝑖=2 𝑒𝑖 − 𝑒𝑖−1 2
𝐷=
σ𝑛𝑖=1 𝑒𝑖2
Donde: 𝑒𝑖 = residual del período i
Investigación Operativa II
Test de Durbin Watson
✓ El estadístico indica que cuando los residuales sucesivos
tienen correlación positiva el valor de D se acerca 0.
Investigación Operativa II
Test de Durbin Watson
✓ Se obtienen 2 valores críticos dL y dU (limite inferior
y superior):
• Si D es menor a dL, se concluye que hay evidencia de
autocorrelación positiva ( > 0, H0: > 0).
• Si D es mayor a dU, se concluye que no hay evidencia de
autocorrelación entre los residuales ( = 0, H0: = 0). No
hay correlación positiva.
• Si D se encuentra entre dL y dU no es posible llegar a
ninguna conclusión.
Investigación Operativa II
Predicciones o Pronósticos vs. Valores de
Predicción o Ajuste
✓ Los valores de predicción o ajuste se refieren a
los obtenidos para las observaciones de la
muestra utilizada para calcular el modelo
(dentro de la misma muestra o serie).
✓ Por otro lado, el pronóstico o predicción se
obtiene para valores más allá del conjunto de
datos empleado para encontrar el modelo
(fuera de la muestra o serie).
Investigación Operativa II
Residuo vs. Error de Predicción
Investigación Operativa II