Anlisis de Datos en Economa Prof: Salvador Carrasco Arroyo
ANALISIS ESTOCASTICO DE SERIES TEMPORALES.
BIBLIOGRAFIA:
1 ) PEA SANCHEZ DE RIVERA, DANIEL (1992). "Modelos y Mtodos.
Modelos lineales y series temporales" V.2 ; Ed. Alianza Universidad. Madrid.
CAPITULO 15
2 ) FERRAN ARANAZ, MAGDALENA (1996), " SPSS para Windows.
Programacin y anlisis estadstico" ; Ed. McGraw Hill. Madrid. CAPITULO 20
INTRODUCCION
El enfoque clsico del anlisis de series temporales, basado en la
descomposicin, tiene a su favor el carcter intuitivo de la argumentacin original y
la sencillez relativa de las tcnicas e instrumentos que requiere.
Desde una perspectiva estocstica, una serie temporal observada se
considera como realizacin (o muestra) de cierto proceso terico, integrado por
variables aleatorias referidas a momentos o periodos de tiempo.
Y(t) = { . . .Yt - 2 , Yt - 1 , Yt , Yt +1, Yt +2 .... }
y(t) = { ... yt - 2 , yt - 1 , yt , yt +1, yt +2 ..... }
El anlisis estocstico de la serie temporal consiste en realizar una inferencia
estadstica sobre las propiedades del proceso terico a partir de la informacin
contenida en la serie observada. Por tanto, hay un elevado grado de paralelismo
entre el anlisis estocstico de series temporales y el anlisis estadstico general.
El anlisis estocstico da origen, adems, a los mtodos de series
temporales que se utilizan con mayor frecuencia en la prctica profesional.
El camino inferencial que conduce desde las observaciones de una serie temporal
al proceso terico (muestra - poblacin) sigue el procedimiento conocido, aunque
presenta algunas particularidades.
Tras el anlisis inicial y la descripcin de los datos, en que intervienen las tcnicas
habituales en estadstica y algunas especficas de series temporales, el objetivo
del anlisis se centra en la construccin un modelo que reproduzca adecuadamente
las propiedades del proceso que se supone ha originado los datos.
Anlisis de Datos en Economa Prof: Salvador Carrasco Arroyo
PROCESOS ESTOCASTICOS
Un proceso estocstico es un conjunto de variables aleatorias que representan una
misma magnitud (responden a la misma definicin) en distintos momentos del
tiempo. En general suponemos que el proceso es lineal, es decir, que cada variable
puede ser obtenida como combinacin lineal de las que la preceden.
Una muestra de n datos ser una muestra de un vector de n variables
aleatorias ordenadas en el tiempo ( z1 .. zt .. zn ). Se denomina proceso estocastico
al conjunto de estas variables { zt } donde t = 1......n
Conocer el proceso terico implica:
conocer la funcin de distribucin conjunta del vector de variables aunque,
bajo normalidad, bastar con su vector de medias y su matriz de varianzas-
covarianzas.
Funcion de medias
t = E [zt ]
Funcion de Varianzas
t = Var [zt ]
Funcion de autocovarianzas
Cov ( t , t +j) = E [( zt - t ) ( zt+j - t+j ]
Funcion de autocorrelacion
(t, t+j) = Cov ( t , t +j) / t t+j
Estos elementos pueden ser inferidos a partir de las observaciones pero solo
cuando se cumple una serie de condiciones.
Las condiciones que deben verificarse para que la inferencia a partir de una nica
realizacin sea posible son dos (no las definimos formalmente, solo las principales
implicaciones):
Anlisis de Datos en Economa Prof: Salvador Carrasco Arroyo
Estacionariedad. ( Proceso Estacionario)
Implica que las variables integrantes del proceso tienen
media y varianza constantes y finitas, y que la
covarianza entre pares de ellas solo depende de su
separacin temporal.
t = E [zt ] = Cte
t = Var [zt ] = Cte
Cov ( t , t +k) = Cov ( t , t - k) = k
k = k / o Donde o =
2
Ergodicidad.
Implica que la covarianza entre pares de variables del
proceso tiende a reducirse cuanto mayor es su
separacin temporal.
AUTOCORRELACION
Cuando el proceso es estacionario y ergdico, la media y la varianza constantes
reflejan sus caractersticas estticas (nivel y variabilidad). Las caractersticas
dinmicas, la manera en que cada variable se ve afectada por las variables previas,
aparecen recogidas por las covarianzas que solo dependen de la separacin
temporal.
El valor de la correlacin para sucesivos valores del retardo k proporciona
la llamada funcin de autocorrelacin. La funcin de autocorrelacin expresa las
caractersticas dinmicas del proceso, porque recoge la influencia del pasado en el
presente (k=1,2,3...). As, un proceso en el cual cada variable dependa slo de la
anterior tendr nulos todos los coeficientes de autocorrelacin excepto el primero.
Si cada variable depende de las dos previas, entonces la autocorrelacin ser no
nula para los ordenes uno y dos, y nula para rdenes superiores. En otras palabras,
la funcin de autocorrelacin refleja la memoria del proceso: el nmero de periodos
durante los cuales una variable continua teniendo influencia en la evolucin del
proceso.
La autocorrelacin, tanto total como parcial, puede ser estimada a partir de las
covarianzas de los datos. La autocorrelacin estimada sirve para inferir los ordenes
de retardos que son significativos en el estudio de una serie temporal, es decir, los
Anlisis de Datos en Economa Prof: Salvador Carrasco Arroyo
ordenes de retardos implicados en el proceso terico que subyace a los datos. El
modelo que se elija para representar el proceso deber incluir, precisamente, los
rdenes de retardo correspondientes a coeficientes de autocorrelacin
significativos.
FUNCION DE AUTOCORRELACION SIMPLE (FAS). (Correlograma) La
representacin de los coeficientes de autocorrelacin en funcin del
retardo.
FUNCION DE AUTOCORRELACION PARCIAL (FAP). (Correlograma) La
representacin de los coeficientes de autocorrelacin parcial en funcin del
retardo.
MODELOS ARIMA ( AR I MA)
Los procesos lineales estacionarios y ergdicos pueden ser representados
mediante un modelo de la clase ARIMA. Las siglas corresponden a autorregresivos,
integrados y de media mvil.
Antes de examinarlos, definimos unos tipos especiales de proceso:
ruido blanco ( at ), que se caracteriza por ser normalmente
distribuido, tener media nula, varianza constante y no presentar
autocorrelacin. En estos procesos conocer los valores
pasados no proporciona ninguna informacin sobre el futuro).
El ruido blanco interviene en la formulacin de cualquier modelo
ARIMA.
Integrados. La mayora de los procesos que observamos no
son estacionarios y su nivel medio varia con el tiempo. El
XCES
N de retardos
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
A
C
F
1,0
,5
0,0
-,5
-1,0
Lmites confidencial
es
Coeficiente
Anlisis de Datos en Economa Prof: Salvador Carrasco Arroyo
proceso se convertir en estacionario al diferenciarlo. As
obtenemos como primera diferencia.
Wt = zt - zt-1
Segunda diferencia ( de orden 2)
Yt = Wt - Wt-1 = zt - 2z t-1 + zt-2
Ser de orden d cuando al diferenciarlo d veces se obtiene
un proceso estacionario
Modelo autorregresivo AR (p):
Expresa el valor de la serie en cada tiempo t como una combinacin de variables
previas ms un ruido blanco:
Yt = c + 1 zt-1 + 2 zt-2 + + p zt-p + at
La funcin de autocorrelacin :
p = p / o = p-1 / o = p-1 p =
p
Cuando P es grande , p tiende a cero con rapidez ( SEGN SE PUEDE VER EN UNA
FAS)
Modelo de media mvil MA (q):
Expresa el valor de la serie en cada tiempo t como un ruido blanco contemporneo
menos una combinacin de ruidos blancos previos
Yt = at - 1 at-1 - 2 at-2 -.. - q at-q
En ocasiones, el nmero de retardos implicados en las representaciones AR o MA
de una serie es demasiado elevado para que resulte operativo. Por esa razn, no
es infrecuente representar el valor de la serie como una combinacin de arnbos
tipos de modelos, lo que da origen a los modelos ARMA(p, q)
Yt = c + 1 zt-1 + + p zt-p + at - 1 at-1 .. - q at-q
Anlisis de Datos en Economa Prof: Salvador Carrasco Arroyo
En muchas ocasiones, la representacin ARMA(p,q) no es adecuada para una serie
temporal observada pero si lo es para su incremento. En estos casos, la
representacin ARMA(p,q) se formula sobre !a serie diferenciada. Cuando se aplica
una representacin ARMA sobre los incrementos o diferencias de orden d de la
serie original, entonces el modelo resultante es un ARlMA (p,d,q), donde la inicial I
se refiere a "integrado" y d es el orden del incremento aplicado.
LA ESTRATEGIA BOX-JENKINS
Se trata de una manera de proceder al anlisis de una serie temporal utilizando un
modelo de la clase ARIMA. El procedimiento consta de tres fases o etapas que se
aplican de manera iterativa hasta alcanzar un resultado satisfactorio
Identificacin:
Consiste en proponer un modelo de la clase ARIMA para representar el proceso
que ha generado las observaciones. Se trata de determinar Ios rdenes (p,d,q) que
debe tener el modelo para representar adecuadamente el proceso que ha generado
las observaciones. A efectos prcticos, podemos descomponer la identificacin en
dos etapas:
Determinacin del orden de integrabilidad ( d )
En economa es razonable admitir la Ergodicidad de las magnitudes (el
pasado reciente influye ms que el pasado remoto) pero, en cambio, las series
temporales no suelen ser estacionarias sino que presentan cambios de nivel y
variabilidad a lo largo del tiempo.
Sin embargo, es posible aproximar el comportamiento de una serie a la
Estacionariedad mediante transformaciones matemticas (Box-Cox). Las
transformaciones consisten, por lo general:
Tomar logaritmos (para reducir los cambios en varianza) y/o diferencias
(para reducir los cambios en nivel).
En general, se procede de manera iterativa, observando el grfico y la funcin de
autocorrelacin de sucesivas transformaciones de la serie hasta dar con la
transformacin ms adecuada.
Determinacin del orden autorregresivo ( p ) y de media mvil.(q )
Anlisis de Datos en Economa Prof: Salvador Carrasco Arroyo
Una vez la serie presenta un comportamiento aproximadamente estacionario, se
puede calcular una f.a.s. y una f.a.p. estimadas a partir de los datos que sugieren
los rdenes de retardos p y q correspondientes al proceso que ha generado las
observaciones. En teora, los coeficientes significativos de la f.a.s. y f.a.p. estimadas
sealan cuales son los rdenes de retardos que hay que incluir en el modelo. En la
prctica, hay que tomar en consideracin las caractersticas conocidas de la
magnitud bajo estudio a la hora de elegir los ordenes p y q del modelo que se va a
estimar. No conviene que sean ordenes muy elevados (porque consumen mas
observaciones a la hora de estimar). En series econmicas son frecuentes los
rdenes 1, 2, 4 (trimestral) y 12 (mensual).
Estimacin
Una vez identificado a partir de las observaciones el modelo tentativo, es decir, una
vez elegidos los rdenes (p. d. q) se procede a estimar los parmetros
autorregresivos y de medias mviles que intervienen. No estudiaremos en detalle
los mtodos de estimacin. Los procedimientos suelen ser iterativos y, en general,
requieren la disponibilidad de observaciones anteriores al perodo muestral. Esta
caracterstica determina que el procedimiento completo no sea recomendable en
situaciones de escasez de datos. El modelo con los parmetros estimados se
denomina estructura.
Validacin:
El modelo estimado (la estructura) debe representar adecuadamente el proceso que
se supone ha generado las observaciones. Una estructura adecuada ser aquella
que verifique, al menos, las siguientes condiciones:
Admisibilidad: el modelo estimado es coherente con el
conocimiento previo del fenmeno y no quebranta restricciones
definicionales de la magnitud objeto de estudio
Parametrizacin: el nmero de parmetros estimados debe ser
lo ms reducido posible
Coherencia con los datos: La estructura presenta un buen
ajuste a las observaciones, los residuos son pequeos y
aleatorios (ruido blanco)
Estabilidad estructural: La estructura representa
adecuadamente la evolucin de la serie tanto en su conjunto
como en distintos subperiodos.
Estos requisitos son comunes a todo tipo de modelos economtricos. En el caso de
los modelos ARIMA hay dos cuestiones que revisten especial importancia:
Anlisis de Datos en Economa Prof: Salvador Carrasco Arroyo
Cumplimiento de las condiciones de estacionariedad
Todo el procedimiento se basa en la hiptesis de que el proceso estocstico es
estacionario. Un modelo estimado ser inaceptable si implica la no estacionariedad
del proceso aleatorio. Las condiciones de estacionariedad (invertibilidad) dependen
de las races de los polinomios de retardos y son diferentes segn el orden del
modelo. Cuando las races de los polinomios de retardos de la estructura se
aproximan a la unidad, hay que volver a la fase inicial de transformaciones para
aproximar todava ms el comportamiento de los datos a la estacionariedad.
Comportamiento de los residuos
El residuo de cualquier modelizacin economtrica aceptable debe ser pequeo y
errtico. En series temporales es importante, adems, cornprobar que la evolucin
de los residuos no presente regularidades, que no muestre ningn tipo de esquema
temporal. De lo contrario, el modelo estimado no sera aceptable por estar
incompleto, al no haber captado ese esquema. La comprobacin se realiza a travs
de la identificacin de la propia serie de residuos: si la f.a.s. o la f.a.p. de los
residuos presentan algn coeficiente significativo, cabe pensar que los residuos
estn autocorrelacionados y, por tanto, que el modelo estimado no es aceptable.
La estrategia es iterativa: cuando el modelo tentativo estimado no produce buenos
resultados (no supera la evaluacin), hay que volver al principio, a la fase de
identificacin y empezar de nuevo hasta alcanzar una modelizacin aceptable. Una
vez aceptada una estructura, podremos utilizarla para la prediccin.