La metodología para construir el modelo ARIMA(p,d,q)(P,D,Q)s apropiado para la serie
estacional Yt consta de las fases de Identificación, Estimación, Validación y Predicción. Se
ilustrará el proceso de construcción del modelo con la serie temporal Total Viajeros
Transportados en España, desde Julio de 2010 hasta Octubre de 2018. Valor en miles.
Fuente: I.N.E. (INEbase/servicios/transporte/estadística de transporte de viajeros).
En el archivo Viajeros1.sav se encuentran los datos pertenecientes al Total de Viajeros en
España en el período especificado anteriormente con una periodicidad mensual y un total
de 100 observaciones.
En la etapa de identificación o especificación se deberá determinar el orden de integración
de la serie temporal, es decir cuál es el número y naturaleza (regular o estacional,
incluyendo trimestral, mensual, etc) de diferencias que se requerirán para convertir en
estacionaria a la variable objeto de análisis Yt=Viajerost.
Zt=(1-B)d(1-Bs)DYt
Para ello se utiliza tanto el análisis gráfico de la serie, que nos revela determinadas
características de la misma, como sus correlogramas simple y parcial estimadas y los tests
de raíces unitarias.
Al observar los gráficos de la serie original y su transformación logarítmico natural se llega
a la conclusión que la serie es estacionaria en varianza luego no será necesario aplicar la
transformación logarítmica.
Inspeccionando el gráfico de la serie original vemos que no es estacionaria en media
porque, por un lado, su tendencia (a largo plazo) en un tanto creciente y, por otro lado,
presenta un ciclo estacional sistemático en los meses de invierno en los valores máximos
y los de verano en los mínimos con lo que la media de cada mes es distinta.
En cuanto a las funciones de autocorrelación y autocorrelación parcial estimadas (Graficos
3 y4 respectivamente) también validan los períodos estacionales porque los coeficientes de
la ACF para retardos múltiplos del período estacional de la serie son significativamente
distintos de cero. Por otro lado, los coeficientes de la ACF no decaen rápidamente,
indicando falta de astacionariedad en media.
Diferenciación Parte Regular
Al diferenciar solo la parte regular, las funciones de autocorrelación y autocorrelación parcial
estimadas (Gráficos 5 y 6) no superan el problema de la falta de estacionariedad, pues la
ACF no decae rápidamente. Observando el gráfico de la variable diferenciada (gráfico 7)
se aprecia que fluctúa sobre una misma media pero tiene picos periódicos, la
transformación parece que ha corregido la tendencia regular pero persiste una cierta
tendencia estacional, lo que sugiere considerar al mismo tiempo la parte integrada
estacional S=12 así como una diferencia regular. El gráfico 8 corresponde a la serie sólo
diferenciada en su parte estacional, observándose que existe cierta tendencia lo que indica
que hay que tener en cuenta tanto la integración regular como la estacional.
Parte Integrada regular e integrada estacional (12)
El gráfico de la serie transformada (1-B)(1-B12)Yt muestra una clara esacionariedad en
media y el correlograma de esta variable que se muestran a continuación parece que no
ofrecen dudas sobre la estacionariedad.
No obstante, realizamos el test de DFA tanto para la serie original como para la
transformada (1-B)(1-B12)Yt para verificar si esta transformación es estacionaria:
Cuadro 1: Contrastes de raíces unitarias para Viajeros1t
Null Hypothesis: VIAJEROS1 has a unit root
Exogenous: Constant
Lag Length: 11 (Automatic - based on SIC, maxlag=12)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic 0.424710 0.9830
Test critical values: 1% level -3.506484
5% level -2.894716
10% level -2.584529
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(VIAJEROS1)
Method: Least Squares
Date: 01/08/19 Time: 20:24
Sample (adjusted): 2011M07 2018M10
Included observations: 88 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
VIAJEROS1(-1) 0.073067 0.172041 0.424710 0.6723
D(VIAJEROS1(-1)) -0.967949 0.170206 -5.686927 0.0000
C -26942.34 66096.38 -0.407622 0.6847
R-squared 0.904785 Mean dependent var 609.2614
Adjusted R-squared 0.889550 S.D. dependent var 49145.84
S.E. of regression 16333.13 Akaike info criterion 22.37538
Sum squared resid 2.00E+10 Schwarz criterion 22.74135
Log likelihood -971.5169 Hannan-Quinn criter. 22.52282
F-statistic 59.39065 Durbin-Watson stat 1.933443
Cuadro 2: Contrastes raíces unitarias para (1-B)(1-B12)Viajeros1t
Augmented Dickey-Fuller test statistic -10.15676 0.0000
Test critical values: 1% level -3.510259
5% level -2.896346
10% level -2.585396
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(DD12VIAJEROS1)
Method: Least Squares
Date: 01/08/19 Time: 20:24
Sample (adjusted): 2011M11 2018M10
Included observations: 84 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
DD12VIAJEROS1(-1) -3.158595 0.310984 -10.15676 0.0000
D(DD12VIAJEROS1(-1)) 1.078268 0.227123 4.747503 0.0000
D(DD12VIAJEROS1(-2)) 0.290278 0.107494 2.700419 0.0084
C 474.3394 1602.571 0.295987 0.7680
R-squared 0.868364 Mean dependent var 265.3571
Adjusted R-squared 0.863428 S.D. dependent var 39737.29
S.E. of regression 14685.20 Akaike info criterion 22.07352
Sum squared resid 1.73E+10 Schwarz criterion 22.18927
Log likelihood -923.0877 Hannan-Quinn criter. 22.12005
F-statistic 175.9119 Durbin-Watson stat 2.086695
Prob(F-statistic) 0.000000
Podemos concluir que la serie (1-B)(1-B12)Viajeros1t es estacionaria, por lo que la serie
Viajeros1 es integrada de orden 1 en la parte recular, d=1 e integrada de orden 1 en la
parte estacional, D=1.
Para identificar la parte autoregresiva AR y la parte de medias móviles MA se utiliza la
ACF y ACFP con la que se ha obtenido la estacionariedad y la estacionalidad atendiendo
a las siguientes directrices:
Con respecto a la ACF:
La ACF del proceso ARIMA multiplicativo es una mezcla delas ACF
correspondientes a su estructura regular y su estructura estacional por separado,
con términos de interacción porque ambas estructuras no son independientes.
Los coeficientes de los retardos más bajos, k= 1,2,…, que recogen la estructura
regular (observaciones contiguas) se reproduce la estructura de la parte regular.
Así si es un MA(1) se tiene que el ρ1≠0 y luego el resto son significativamene cero.
Mientras que si es un AR(1) la parte regular es infinia (no se trunca) y decrece
exponencialmente.
En los coeficientes de los retardos estacionales, k= s, 2s, 3s, …, se representa la
estructura estacional. Para la estructura de medias móviles SMA tendremos en
cuenta los retardos estacionales significativamente distintos de cero. Para la
estructura autoregresiva estacional SAR la ACF debe ser infinita para los retardos
estacionales y decrece exponencialmente.
Alrededor de los coeficientes de los retardos estacionales se observa la interacción
de la estructura regular y la estacional que se manifiesta en la repetición a ambos
lados de cada retardo estacional de la función de correlación simple de la parte
regular debiendo observarse a ambos lados de los retardos estacionales el
decrecimiento exponencial impuesto por la estructura autoregresiva regular
.
Con respecto a la ACFP:
En los coeficientes de los retardos más bajos, k=1,2,…, se reproduce la estructura
marcada por la parte regular. Si es un MA(q) ó ARMA(p,q) presentaría el
decaimiento rápido y continuado característico de estos modelos, mientras que si
fuera un AR(p) se truncaría en el retardo k=p.
En los coeficientes de los retardos estacionales, k=s, 2s, 3s, …, se representa la
estructura estacional. Si es un modelo MA(Q)s ó un ARMA(P,Q)s presentaría un
decaimiento rápido y continuado característico de estos modelos, mientras que si
fuera un AR(P)s se truncaría en el retardo k=Ps.
Alrededor de los coeficientes de los retardos estacionales se observa la interacción
entre la pare regular y la estacional que se manifiesta como sigue:
o A la derecha de cada coeficiente estacional, k=js+1, js+2, …, se reproduce
la ACFP de la parte regular.
o A la izquierda de los coeficientes estacionales, k=js-1, js-2, …, se reproduce
la ACF de la parte regular.
Observando el gráfico de abajo (grafico 12) correspondiente las funciones de correlación
simple y parcial estimadas del modelo con una integración regular y otra estacional, sus
coeficientes no se anulan bruscamente con periodicidades por lo que tendríamos:
Un AR(1) de la parte regular que proviene del decrecimiento rápido inicial de la ACF
añadido a que la ACFP presenta solo un coeficiente significativo en la mayoría de los
períodos (salvo en el primero), anulándose bruscamente el resto de los coeficientes.
Un MA(1) de la parte regular que proviene de que la ACF presenta un solo retardo
significativo en la mayoría de los períodos (salvo en el primero) añadido que la ACFP
presenta un decrecimiento rápido inicial.
Atendiendo que la ACF, en sus retardos estacionales (k=12,24,36) es infinita y decrece
exponencialmente lo mismo que con los retardos estacionales en la ACFP que también
presentan un decaimiento hace pensar en un ARMA(0,1)12 ARMA(1,0)12 .
Gráfico 12
Los modelos sugeridos son:
M1: ARIMA(1,1,1)(1,1,0)12 con constante* = δ+(1-ɸ1B)(1-B)(1-B12)Viajerost=(1-θ1B)εt
M2: ARIMA(1,1,1)(1,1,0)12 sin constante = (1-ɸ1B)(1-Φ1)12(1-B)(1-B12)Viajerost=(1-θ1B)εt
M3: ARIMA(1,1,1)(0,1,1)12 con constante* = δ+(1-ɸ1B)(1-B)(1-B12)Viajerost=(1-θ1B)(1-Θ1B12)εt
M4: ARIMA(1,1,1)(0,1,1)12 sin constante = (1-ɸ1B)(1-B)(1-B12)Viajerost=(1-θ1B)(1-Θ1B12)εt
*
Aunque, observando la gráfica de la serie (1-B)(1-B12)Viajerost se deduce que la media del
proceso aparentemente es cero.
M1: ARIMA(1,1,1)(1,1,0)12 con constante = δ+(1-ɸ1B)(1-B)(1-B12)Viajerost=(1-θ1B)εt
Estadísticos del modelo
Estadísticos de ajuste del modelo Ljung-Box Q(18)
Número R Número
de cuadrado de
predictor estaciona R Estadístic valores
Modelo es ria cuadrado RMSE os DF Sig. atípicos
viajeros-Modelo_1 0 ,676 ,911 12667,3 20,791 15 ,144 0
Dependent Variable: DD12VIAJEROS1
Method: ARMA Maximum Likelihood (OPG - BHHH)
Date: 01/09/19 Time: 14:01
Sample: 2011M08 2018M10
Included observations: 87
Convergence achieved after 39 iterations
Coefficient covariance computed using outer product of gradients
Variable Coefficient Std. Error t-Statistic Prob.
C 259.6654 151.8133 1.710425 0.0910
AR(1) -0.328169 0.128188 -2.560069 0.0123
SAR(12) -0.501676 0.108283 -4.633012 0.0000
MA(1) -0.804359 0.094789 -8.485744 0.0000
R-squared 0.688979 Mean dependent var 386.1379
Adjusted R-squared 0.673807 S.D. dependent var 21859.33
S.E. of regression 12484.58 Akaike info criterion 21.81761
Sum squared resid 1.28E+10 Schwarz criterion 21.95933
Log likelihood -944.0662 Hannan-Quinn criter. 21.87468
F-statistic 45.41196 Durbin-Watson stat 2.109553
Prob(F-statistic) 0.000000
Inverted AR Roots .91-.24i .91+.24i .67+.67i .67-.67i
.24-.91i .24+.91i -.24-.91i -.24+.91i
-.33 -.67-.67i -.67-.67i -.91+.24i
-.91-.24i
Inverted MA Roots .80
M2: ARIMA(1,1,1)(1,1,0)12 sin constante = (1-ɸ1B)(1-Φ1)12(1-B)(1-B12)Viajerost=(1-θ1B)εt
Estadísticos del modelo
Estadísticos de ajuste del modelo Ljung-Box Q(18)
Número R Número
de cuadrado de
predictor estaciona R Estadístic valores
Modelo es ria cuadrado RMSE os DF Sig. atípicos
viajeros-Modelo_1 12747,06
0 ,668 ,909 21,488 15 ,122 0
7
Dependent Variable: DD12VIAJEROS1
Method: ARMA Maximum Likelihood (OPG - BHHH)
Date: 01/09/19 Time: 14:10
Sample: 2011M08 2018M10
Included observations: 87
Convergence achieved after 32 iterations
Coefficient covariance computed using outer product of gradients
Variable Coefficient Std. Error t-Statistic Prob.
AR(1) -0.348966 0.126097 -2.767430 0.0070
SAR(12) -0.476808 0.110387 -4.319422 0.0000
MA(1) -0.749084 0.110793 -6.761090 0.0000
R-squared 0.678234 Mean dependent var 386.1379
Adjusted R-squared 0.666604 S.D. dependent var 21859.33
S.E. of regression 12621.68 Akaike info criterion 21.82132
Sum squared resid 1.32E+10 Schwarz criterion 21.93469
Log likelihood -945.2273 Hannan-Quinn criter. 21.86697
Durbin-Watson stat 2.129054
Inverted AR Roots .91+.24i .91-.24i .66+.66i .66-.66i
.24-.91i .24+.91i -.24-.91i -.24+.91i
-.35 -.66+.66i -.66-.66i -.91-.24i
-.91+.24i
Inverted MA Roots .75
M3: ARIMA(1,1,1)(0,1,1)12 con constante = δ+(1-ɸ1B)(1-B)(1-B12)Viajerost=(1-θ1B)(1-Θ1B12)εt
Estadísticos del modelo
Estadísticos de ajuste del modelo Ljung-Box Q(18)
Número R Número
de cuadrado de
predictor estaciona R Estadístic valores
Modelo es ria cuadrado RMSE os DF Sig. atípicos
viajeros-Modelo_1 12038,59
0 ,707 ,919 18,269 15 ,249 0
9
Dependent Variable: DD12VIAJEROS1
Method: ARMA Maximum Likelihood (OPG - BHHH)
Date: 01/09/19 Time: 14:18
Sample: 2011M08 2018M10
Included observations: 87
Failure to improve objective (non-zero gradients) after 28 iterations
Coefficient covariance computed using outer product of gradients
Variable Coefficient Std. Error t-Statistic Prob.
C 289.7828 81.80954 3.542164 0.0007
AR(1) -0.275443 0.142363 -1.934789 0.0565
MA(1) -0.801908 0.091421 -8.771555 0.0000
SMA(12) -1.000000 1586.206 -0.000630 0.9995
R-squared 0.788541 Mean dependent var 386.1379
Adjusted R-squared 0.778226 S.D. dependent var 21859.33
S.E. of regression 10294.19 Akaike info criterion 21.68194
Sum squared resid 8.69E+09 Schwarz criterion 21.82366
Log likelihood -938.1644 Hannan-Quinn criter. 21.73901
F-statistic 76.44559 Durbin-Watson stat 2.065542
Prob(F-statistic) 0.000000
Inverted AR Roots -.28
Inverted MA Roots 1.00 .87-.50i .87+.50i .80
.50+.87i .50-.87i .00+1.00i -.00-1.00i
-.50+.87i -.50-.87i -.87-.50i -.87+.50i
-1.00
Estimated MA process is noninvertible
M4: ARIMA(1,1,1)(0,1,1)12 sin constante = (1-ɸ1B)(1-B)(1-B12)Viajerost=(1-θ1B)(1-Θ1B12)εt
Estadísticos del modelo
Estadísticos de ajuste del modelo Ljung-Box Q(18)
Número R Número
de cuadrado de
predictor estaciona R Estadístic valores
Modelo es ria cuadrado RMSE os DF Sig. atípicos
viajeros-Modelo_1 0 ,690 ,915 12322,15 18,643 15 ,230 0
Dependent Variable: DD12VIAJEROS1
Method: ARMA Maximum Likelihood (OPG - BHHH)
Date: 01/09/19 Time: 14:26
Sample: 2011M08 2018M10
Included observations: 87
Convergence achieved after 24 iterations
Coefficient covariance computed using outer product of gradients
Variable Coefficient Std. Error t-Statistic Prob.
AR(1) -0.333181 0.147035 -2.265998 0.0261
MA(1) -0.679949 0.139763 -4.865001 0.0000
SMA(12) -0.765678 0.142010 -5.391725 0.0000
R-squared 0.727292 Mean dependent var 386.1379
Adjusted R-squared 0.717435 S.D. dependent var 21859.33
S.E. of regression 11619.73 Akaike info criterion 21.73702
Sum squared resid 1.12E+10 Schwarz criterion 21.85040
Log likelihood -941.5604 Hannan-Quinn criter. 21.78267
Durbin-Watson stat 2.105358
Inverted AR Roots -.33
Inverted MA Roots .98 .85+.49i .85-.49i .68
.49+.85i .49-.85i -.00-.98i -.00+.98i
-.49-.85i -.49+.85i -.85+.49i -.85-.49i
-.98
A continuación se muestra una tabla resumen del resultado de algunos estadísticos de
ajuste de los modelos como el R cuadrado estacionario, el de ajuste global de Ljung-box,
el error estándar, el Criterio de Información de Akaike (AIC); así como los los resultados de
las estimaciones y de los contrastes t individuales para los parámetros estimados. También
recoge la matriz de covarianzas entre los parámetros estimados.
R2 Estacionario Ljung-Box (p-valor) S.E. of regresion AIC
MODELO 1 0.676 20,791 (0.144) 12484.58 21.81761
Coef. Prob.
C 259.6654 0.0910
AR(1) -0.328169 0.0123
SAR(12) -0.501676 0.0000
MA(1) -0.804359 0.0000
MATRIZ COVARIANZAS
C AR(1) SAR(12) MA(1)
C 23047.29 -3.093480 -0.951669 4.102032
AR(1) -3.093480 0.016432 0.001342 -0.009291
SAR(12) -0.951669 0.001342 0.011725 -0.004292
MA(1) 4.102032 -0.009291 -0.004292 0.008985
MODELO 2 0.668 21.488 (0.122) 12621.68 21.82132
Coef. Prob.
AR(1) -0.348966 0.0070
SAR(12) -0.476808 0.0000
MA(1) -0.749084 0.0000
MATRIZ COVARIANZAS
AR(1) SAR(12) MA(1)
AR(1) 0.015901 0.002189 -0.010729
SAR(12) 0.002189 0.012185 -0.005860
MA(1) -0.010729 -0.005860 0.012275
MODELO 3 0.707 18.269 (0.249) 10294.19 21.68194
Coef. Prob.
C 289.7828 0.0007
AR(1) -0.275443 0.0565
SMA(12) -0.801908 0.0000
MA(1) -1.000000 0.9995
MATRIZ COVARIANZAS
C AR(1) MA(1) SMA(12)
C 6692.801 -1.178615 1.466596 -17511.98
AR(1) -1.178615 0.020267 -0.010683 -10.85556
MA(1) 1.466596 -0.010683 0.008358 -10.18926
SMA(12) -17511.98 -10.85556 -10.18926 2516049.
MODELO 4 0.690 18.643 (0.230) 11619.73 21.73702
Coef. Prob.
AR(1) -0.333181 0.0261
SMA(12) -0.679949 0.0000
MA(1) -0.765678 0.0000
MATRIZ COVARIANZAS
AR(1) MA(1) SMA(12)
AR(1) 0.021619 -0.017163 0.002726
MA(1) -0.017163 0.019534 -0.006716
SMA(12) 0.002726 -0.006716 0.020167
En cuanto al modelo 1, todos los coeficientes son individualmente significativamente
aceptables menos la constante. Estimado el modelo 2 (modelo 1 sin constante) todos los
coeficientes son individualmente significativos y, atendiendo a Ljung-Box (0,122) el ajuste
también es globalmente aceptable.
En cuanto al modelo 3 resulta que algunas raíces del polinomio de Medias Móviles son
unitarios por lo que hace al proceso MA no invertible. (Ver la estimación para el modelo 3
en el apartado de Inverted MA Roots). Estimado el modelo 4 (modelo 3 sin constante) todos
los coeficientes son individualmente significativos al igual que el ajuste global con un p-valor
para Ljung-Box de 0,230.
Por lo tanto, nos queda discernir entre el modelo 2 y el modelo 4, para ello analizaremos
los residuos de los modelos seleccionados.
El análisis de los residuos delos dos modelos seleccionados a través de sus
correspondientes correlogramas, que se presentan a continuación, nos indica que ambos
cumplen las condiciones para ser considerados como ruido blanco. Respecto a los gráficos
probabilísticos normales podemos concluir que en ninguno de los dos modelos se puede
rechazar la normalidad, aunque se aprecia que los valores del modelo 2 están más
cercanos a la recta.
Por último calculamos las correlaciones entre los estimadores:
MATRIZ CORRELACIONES MODELO 2
AR(1) MA(1) SAR(12)
AR(1) 1
MA(1) 0,157260907 1
SAR(12) -0,767955891 -0,477955891 1
MATRIZ CORRELACIONES MODELO 4
AR(1) MA(1) SMA(12)
AR(1) 1
MA(1) -0,83517947 1
SMA(12) 0,130553164 0,338372022 1
Concluímos en quedarnos con el modelo 2, aunque hay que destacar que existe una
correlación entre los coeficientes estimados que es superior a 0,7 (-0,767955891).
Modelo2: ARIMA(1,1,1)(1,1,0)12 sin cte. = (1-ɸ1B)(1-Φ1)12(1-B)(1-B12)Viajerost=(1-θ1B)εt
(1+0,348966B)(1+0,476808)12(1-B)(1-B12)Viajerost=(1+0,749084B)εt
Por último se muestra el gráfico conjunto de los valores de la serie, sus valores ajustados y
las previsiones desde el 12/2018 hasta el 10/2019.
Predicción
Nov Dic Ene Feb Mar Abr Mayo Jun Jul Ago Sep Oct
Modelo 2018 2018 2019 2019 2019 2019 2019 2019 2019 2019 2019 2019
viajeros- Predicción 428753 395490 405043 408551 447943 422416 461409 439707 387149 314759 418954 470423
Modelo_ LCS 453702 420557 431108 434891 474747 449604 489000 467687 415516 343506 448077 499917
1 LCI 403804 370422 378977 382211 421139 395227 433817 411727 358782 286012 389832 440930