Tema 8
Tema 8
INTRODUCCIÓN
1. PROCESOS ESTOCÁSTICOS
2. PROCESOS ESTACIONARIOS
3. PROCESOS DE RUIDO BLANCO
4. TRANSFORMACIONES PARA LA ESTACIONARIEDAD
RESUMEN Y CONCLUSIONES
CUESTIONES
08.2 MODELOS DE SERIES TEMPORALES UNIVARIANTES
INTRODUCCIÓN
En esta unidad temática se presentará el concepto de serie temporal desde un punto vista
más riguroso que el visto en la unidad temática anterior, el estadístico. Porque el concepto
clásico de serie temporal es bastante sencillo, y los modelos propuestos a partir del mismo
podrían calificarse como "ingenuos" o "simples", por lo que se hace necesario crear unos
modelos más sólidos que permitan un análisis más riguroso de una serie de tiempo. Este es el
objeto de la presente unidad temática, volver a definir el concepto de serie temporal, y
presentar los fundamentos de la teoría estadística necesaria para describirla, los procesos
estocásticos. Con ello será posible proponer modelos más complejos, flexibles y cercanos a la
realidad, como son los modelos ARIMA que se presentarán en la siguiente unidad temática.
1. PROCESOS ESTOCÁSTICOS
El modelo estadístico que se propone para describir a una serie temporal es el llamado
proceso estocástico. A diferencia de la definición clásica de serie temporal, donde una variable
aleatoria toma valores en cada instante de tiempo, ahora se propone la existencia de una
variable aleatoria en cada instante de tiempo. Una serie temporal compuesta por n datos será
en realidad un vector de n variables aleatorias ordenadas en el tiempo (Z1, Z2, ..., Zn). Se
denomina proceso estocástico al conjunto de estas variables {Zt}, con t = 1, 2, ..., n y la serie
observada (valores) se considera una realización o trayectoria del proceso estocástico.
1600
1400
En ese caso sólo queda por conocer los parámetros de la distribución, vector de medias y
matriz de varianzas-covarianzas, para que la distribución quede totalmente determinada. Una
versión simplificada del vector y de la matriz son las funciones de medias, de varianzas y de
covarianzas.
Un proceso estocástico es una variable aleatoria n-dimensional, donde cada una de las n variables
que la componen están un instante de tiempo, y cada una de ellas está relacionada con todas las
demás, en los restantes instantes de tiempo. Un coeficiente de autocorrelación cuantifica la
importancia de cada variable con las demás.
Función de medias
Se llama función de medias del proceso a una función del tiempo que proporciona las medias
de las distribuciones marginales Zt en cada instante de tiempo:
Un caso particular de las series temporales es que todas las variables tengan la misma media,
o lo que es lo mismo, la función de medias sea constante.
Función de varianzas
Se define la función de varianzas del proceso como una función que proporciona las varianzas
de las distribuciones marginales Zt en cada instante de tiempo:
Función de autocovarianzas
Se define la función de autocovarianzas del proceso como la función que describe las
covarianzas en dos instantes de tiempo cualesquiera:
, [ − − ]
Una propiedad que poseen muchos procesos temporales es que la dependencia entre dos
observaciones cualesquiera sólo sea función del intervalo de tiempo o retardo que existe entre
ellas (k) y no del origen de tiempo t considerado. En ese caso
, , ⋯ k 0, ±1, ±2,...
esto quiere decir que la relación del PIB del mes de marzo con el PIB del mes de Febrero (k=1),
es la misma que existe entre el PIB del mes de febrero con el PIB del mes de enero, enero con
diciembre, y así sucesivamente. O que la relación del PIB del mes de marzo con el PIB del mes
de enero (k=2), es la misma que existe entre el PIB del mes de febrero con el PIB del mes de
diciembre, y así sucesivamente.
Función de autocorrelación
Como es sabido, la covarianza no es precisamente el mejor parámetro para medir el grado de
relación lineal entre dos variables, y por ello se creó el coeficiente de correlación. La función
de autocorrelación del proceso estocástico es la función que proporciona los coeficientes de
correlación entre dos observaciones cualesquiera, y se obtiene dividiendo la función de
covarianzas por el producto de las desviaciones típicas de ambas observaciones (variables).
2. PROCESOS ESTACIONARIOS
Autoevaluación 1: Si la media de la serie es constante, ¿las medias en cada instante de tiempo son
diferentes de la media de todos los datos? Si la varianza de la serie es constante, ¿las varianzas en cada
instante de tiempo son iguales a la varianza de todos los datos?
!"#
!"#
, $ ,
Zt Zt
t t
(a) (b)
Figura 3 Tipos de procesos estocásticos: estacionarios (a) y evolutivos (b).
Es bastante obvio que si un proceso es estacionario (Figura 3a), será mucho más sencillo
predecir sus valores futuros que en el caso de un proceso que sea evolutivo (Figura 3b).
Un proceso es estacionario si tanto su media como su varianza son constantes. En realidad, hay otras
dos condiciones, una sobre la covarianza y otra sobre la normalidad de su distribución, pero no se
suele entrar a comprobarlas.
Los procesos que representan a los sistemas económicos no se ajustan nunca a las
condiciones de estacionariedad expuestas, pero es posible eliminar sus tendencias y
estabilizar sus varianzas para transformarlos en otros procesos que sean aproximadamente
estacionarios, con lo que será posible describirlos y realizar predicciones. La condición
impuesta sobre la covarianza suele cumplirse en la realidad y no es necesario comprobarla.
La media de una serie temporal no será constante si ésta presenta tendencia y/o estacionalidad.
Recordemos que la estacionalidad es el efecto de la estación del año en la variable estudiada. Si una
serie es estacional, entonces su media no es constante, pues las medias de cada mes o trimestre no
son iguales. Si la media de cada mes o trimestre no es constante entonces no puede ser estacionaria.
08.6 MODELOS DE SERIES TEMPORALES UNIVARIANTES
Todo lo visto hasta ahora se refiere a la población, y se supone que pueden obtenerse las
correspondientes funciones a través de la expresión del modelo de la serie, que se supone
conocido, aunque nunca será así. Cuando un proceso es estacionario, pueden utilizarse las
siguientes expresiones para estimar a partir de una muestra sus funciones de medias, de
varianzas, de autocovarianzas y autocorrelación:
∑(
')* &'
+
Función de medias
∑( , -
')* &' $&
+$
Función de varianzas
∑( , ,
')/0* &' $& &'./$&
+$
Función de autocovarianzas, según el retardo (k)
∑( , ,
')/0* &' $& &'./$&
∑( &
')* '
,
$& -
Función de autocorrelación, según el retardo (k)
Es posible exigir una condición más al proceso estacionario, en este caso a la distribución del
proceso estacionario. Se dice que un proceso es estacionario en sentido estricto cuando las
distribuciones marginales y las de cualquier subconjunto de variables que lo componen tienen
la misma distribución, con los mismos parámetros. Lo habitual será admitir que un proceso
estocástico tenga distribución normal multivariante, y que la distribución para cada variable
en cada instante de tiempo sea también normal.
Finalmente hay que señalar que lo que realmente caracteriza a un proceso estacionario es
la relación existente entre la variable en el instante de tiempo actual y las variables en
instantes de tiempo anteriores. Por ello, de todos los parámetros presentados, el que define
realmente a un proceso estacionario (serie temporal) es la función de autocovarianza, más
que su valor medio o su varianza. Ahora bien, y como se ha mencionado anteriormente, la
función de autocovarianza no es realmente el mejor ni el único parámetro que mide el grado
de relación lineal entre dos variables, ya que depende de las unidades de medida de la variable
y no constituye una escala para medir el grado de relación.
∑+3 − ̅ − ̅
1
$
∑+3 − ̅
Si la dependencia que existe entre todas las observaciones, medida como el coeficiente de
autocorrelación ρk tiende a cero cuando aumenta el retardo k, entonces el proceso
estacionario recibe el nombre de ergódico. Esto quiere decir que cuanto más atrás en el
tiempo (k) se encuentre una observación, menor será la influencia que tendrá en el momento
actual. Es una cualidad muy razonable para las variables económicas, así que a partir de ahora
se considerarán únicamente procesos estacionarios ergódicos.
La ergodicidad es una cualidad necesaria para poder estimar las características del proceso a
partir de una única realización o trayectoria. Esto es lo que ocurre con las variables económicas
macro, que no se puede volver a vivir un mes o trimestre para obtener un nuevo valor. Otra
cuestión son las variables micro, al menos algunas de ellas.
Autoevaluación 3: ¿Son ergódicas las series temporales reales (PIB, Renta, ...)?
Se ha indicado que la relación cuantificada en la FAS es una relación total, y es que la relación
existente entre dos variables separadas un cierto tiempo o retardo k puede ser directa,
indirecta o ambas (total). Así, si se considera el proceso de la Figura 5, se tiene una cadena de
variables con unas flechas que indican la existencia de un efecto o relación, del tipo “conocido
Zt-1 se puede conocer Zt". Entonces:
Las variables Zt-1 y Zt tienen una relación que se denominará como directa, señalado por
la flecha dibujada entre ellos. El coeficiente de autocorrelación parcial cuantifica esta
relación. El coeficiente de autocorrelación simple tendrá el mismo valor que el
coeficiente de autocorrelación parcial, pues esta relación es la única que existe entre
ambas variables.
Las variables Zt-2 y Zt tienen también relación entre ellas, pero es una relación indirecta,
una relación a través de Zt-1. El coeficiente de autocorrelación parcial valdrá cero, por no
08.8 MODELOS DE SERIES TEMPORALES UNIVARIANTES
Las variables Zt-4 y Zt tienen relación tanto directa como indirecta. Hay relación directa
por la flecha que los une, y hay relación indirecta a través de los valores intermedios. El
coeficiente de autocorrelación parcial cuantificará la relación directa existente, mientras
que el coeficiente de autocorrelación simple entre ambos cuantificará las relaciones
directa e indirecta juntas, la relación total.
4 5 4 $ 65 4 $ 6 ⋯6 5 4 $ 67
en donde el parámetro αkk que acompaña a la última variable del modelo (más retrasada en
el tiempo) es la estimación del coeficiente de autocorrelación parcial de orden k, ak. Para
obtener los coeficientes no hay más que realizar una secuencia de ajustes por regresión, que
incluye cada vez una nueva variable explicativa.
Las expresiones anteriores permiten estimar los coeficientes de correlación, pero en realidad
interesa averiguar si algún coeficiente de autocorrelación poblacional (ya sea simple o parcial)
es distinto de cero. La determinación de los coeficientes de autocorrelación que son
significativos se hace mediante una prueba de hipótesis, que aparece en los propios gráficos
de la FAS y la FAP en forma de dos líneas simétricas respecto al eje de abscisas. Si algún
coeficiente de autocorrelación sobrepasa dicha línea, eso significa dos cuestiones: la primera
es que el correspondiente coeficiente de autocorrelación poblacional es distinto de cero y la
segunda que ese es su orden, ya que el retardo k implica la relación entre Zt y Zt-k.
PROCESOS ESTOCÁSTICOS 08.9
Formalmente, se realiza la prueba para los coeficientes de autocorrelación simple, ρi, a partir
de su estimación en la muestra, ri, y de la comparación con un valor, rlimite, que delimita la zona
de aceptación de la prueba.
H0 ρi=0
Se acepta que ρi =0 si │ri │≤ rlimite
H1 ρi ≠0
1
;
81 1 16 29 :
<
:3
Con esta varianza se puede calcular el intervalo de aceptación de la prueba de hipótesis para
el coeficiente rk, condicionado a que los coeficientes ρ1, ρ2, ..., ρk-1 son no nulos, y los siguientes
ρk, ρk+1, ... sí lo son. El intervalo así obtenido (más menos dos veces la desviación típica) sería
más amplio a medida que aumenta el retardo, como se aprecia en la Figura 4.
1
;
1=>?> @ ±2 A 1 6 2 9 :
<
:3
Y lo mismo ocurre con los coeficientes de autocorrelación parcial, αi, a partir de su estimación
en la muestra, ai, y de la comparación con un valor, alimite, que delimita la zona de aceptación
de la prueba.
H0 αi=0
Se acepta que αi =0 si │ai │≤ alimite
H1 αi≠0
utilizarán como varianza 1⁄<, donde n es el tamaño de la muestra utilizada para su estimación.
Para determinar si un coeficiente de autocorrelación parcial poblacional es significativo, se
En la Figura 6 se aprecian los límites, dos líneas paralelas al eje de abscisas situadas de forma
simétrica respecto al cero.
1
8=>?> @ ±2
√<
0
!"#
", " 6 D ", " − D 0
El proceso de ruido blanco se utiliza en los modelos para series temporales, cumpliendo en ellos el
mismo papel que el término de error o perturbación en un modelo de regresión.
Autoevaluación 6: ¿Qué tiene que ver la población con la varianza del número de pasajeros de una
compañía aérea?
Pese a todo ello, en la mayoría de los casos es posible transformar los procesos reales para
eliminar de ellos la tendencia y la estacionalidad, estabilizar la varianza, y de esa manera
transformarlos en otros procesos que sean estacionarios, con lo que será posible aplicar toda
la teoría desarrollada para este tipo de procesos.
este caso es obvio que el promedio no es constante por ser diferente en invierno y en verano.
Además, puede observarse que la variabilidad del número de pasajeros aumenta con el
tiempo, puesto que en el primer año representado la amplitud de la oscilación, o la distancia
vertical de pico a pico (valor máximo y mínimo del año) es considerablemente menor que la
distancia de pico a pico en el último año representado. Cada vez hay más población, y más
personas dispuestas a viajar, o a no hacerlo (según quieran), y por ese motivo en un mismo
mes es posible que cada vez más personas decidan viajar, o decidan no hacerlo.
Esta serie incumple todos los requisitos para ser considerada como un proceso estacionario,
y no ha sido necesario buscarla con mucho ahínco. Lo realmente complicado es encontrar una
serie real que cumpla las condiciones de estacionariedad.
La inmensa mayoría de los procesos de tipo económico no son estacionarios porque su nivel
medio cambia (aumenta) con el tiempo, es decir, tienen tendencia. La presencia de tendencia
suele quedar bastante clara al representar gráficamente el proceso estudiado y también
puede observarse por el aspecto de su FAS. Es posible realizar una prueba de hipótesis para
determinar su existencia, como la prueba de Dickey-Fuller ampliada, entre otras, aunque no
es el objeto de este texto.
0.5 0.5
0 0
-0.5 -0.5
-1 -1
0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16 18
lag lag
(a) (b)
Figura 7 FAS de un proceso no estacionario en media. Esto se aprecia en el lento decrecimiento de los coeficientes de
autocorrelación simple (a), y/o bien en un decrecimiento más o menos lineal de los mismos (con un cambio de signo) (b).
Decrecen rápidamente, con un paso por el cero y un posterior mantenimiento del signo
(Figura 8b), aunque finalmente llegará a valer cero, claro.
E − $
El nuevo proceso {Wt} se representa de forma gráfica para observar si los nuevos valores
oscilan alrededor de un valor central. Si es así, se ha eliminado la tendencia de la serie original.
En caso contrario, la tendencia no ha desaparecido del todo, y es necesario diferenciar de
nuevo la serie. El proceso segunda diferencia del proceso {Zt} es un nuevo proceso {Yt}
obtenido mediante la diferenciación de {Wt}
F E −E$ −2 $ 6 $
Una importante propiedad que tienen los procesos que son estacionarios es que sus
incrementos son también estacionarios. Así, si el proceso Zt es estacionario, entonces su
proceso diferenciado Wt = Zt-Zt-1 es también estacionario, por lo que diferenciar en exceso no
tiene (en principio) consecuencias negativas para la serie en este aspecto.
Por otra parte, el aspecto de la FAS de la serie temporal es también muy característico
cuando existe estacionalidad.
ACF ACF
1 1
0.5 0.5
0 0
-0.5 -0.5
-1 -1
0 5 10 15 20 25 0 2 4 6 8 10 12 14 16
lag lag
(a) (b)
Figura 8 Ejemplos de FAS de series estacionales, el caso (a) junto con tendencia en la serie temporal y el caso (b) sin ella.
∇H F F − F $H
donde s es el periodo estacional del proceso analizado, con un valor de 12 para los datos
mensuales, o 4 para los datos trimestrales (según sea el caso).
4.3 VARIANZA
Una forma más elaborada de conseguir una varianza constante es utilizar la transformación
de Box-Cox, que propone transformar la serie de acuerdo a la relación observada entre la
media y la varianza. No se entran en mayores detalles con esta transformación, pues tomar
logaritmo de la variable suele funcionar bien y resolver el problema.
PASAJEROS
varianza tampoco es constante. Fallan, por tanto, las 2000
ellas, más que del instante de tiempo en que se Figura 9 Número de pasajeros de una compañía
observan. aérea española.
Existe tendencia, puesto que el promedio del número de pasajeros aumenta con el tiempo.
La estacionalidad se aprecia en que existe una oscilación que tiene la duración de un año,
oscilación que se repite más o menos igual en cada uno de los años representados, con
un máximo anual en el mes de Agosto (o un mínimo en Enero, como se prefiera).
8
400 500
7.8
200 400
7.6
7.4
sd_PASAJEROS
d_PASAJEROS
l_PASAJEROS
0 300
7.2
-200 200
7
6.8
-400 100
6.6
-600 0
6.4
Tomando logaritmos en la serie original (Figura 11a) la varianza se vuelve más o menos
constante, porque la amplitud de la oscilación es más o menos igual en todos los años, o
por lo menos ya no aumenta con el tiempo como lo hacía antes.
Mediante una diferencia regular aplicada a la serie original (Figura 11b) se elimina la
tendencia creciente de la serie. La serie está ahora más o menos horizontal, si bien la
varianza no constante puede distorsionar el aspecto.
Mediante una diferencia estacional de periodo 12, también en la serie original (Figura 11c)
se consigue eliminar la estacionalidad. No se observan oscilaciones de duración anual que
se repiten de forma similar todos los años.
08.16 MODELOS DE SERIES TEMPORALES UNIVARIANTES
Según dicen los libros de teoría, si las transformaciones se aplican una a una sobre la serie
original, tras cada transformación es posible apreciar mejor el incumplimiento de las restantes
condiciones de estacionariedad. En realidad, tras cada transformación puede que no se
consiga ver nada, y donde se ven claros todos los problemas es en la serie original.
Para que la serie sea realmente estacionaria necesitamos aplicar simultáneamente todas las
transformaciones propuestas. La Figura 12 presenta a la serie transformada, aunque es poco
útil, pues no puede verse nada interesante. Eso sí, la serie es estacionaria.
PASAJEROS - ESTACIONARIA
0.2
0.15
0.1
0.05
sd_ld_PASAJEROS
-0.05
-0.1
-0.15
-0.2
-0.25
1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980
mes
Figura 11 Pasajeros transformada en una serie estacionaria, con una diferencia para la tendencia, una diferencia estacional
de periodo 12 y logaritmos.
A medida que una serie se transforma para ser estacionaria se pierde la noción de lo que
realmente se está analizando. La aplicación de las correspondientes diferencias para la
tendencia y la estacionalidad, así como los logaritmos, hace que la variable estudiada sea "otra
cosa"... difícil de interpretar. Incluso no conveniente de interpretar.
Una diferencia para la tendencia hace que se trabaje con el incremento de la variable, el
aumento de valor de un instante de tiempo respecto al anterior. Esto sería el crecimiento
absoluto de la variable.
E − $
Una diferencia estacional hace que se trabaje con el incremento interanual de la variable,
el crecimiento absoluto de un instante de tiempo al correspondiente instante de tiempo
en la estación anterior.
E − $H
−
E ln − ln
$
$
$
− $H
de la variable
E ln − ln $H
$H
Autoevaluación 9: ¿Cómo se interpretaría una serie resultante de tomar una diferencia para la
tendencia, una diferencia estacional y logaritmos?
CONCLUSIONES
1. El modelo estadístico que permite explicar a una serie temporal de forma racional son los
llamados procesos estocásticos, conjuntos ordenados de variables aleatorias con una
distribución normal multivariante, con un vector de medias y una matriz de varianzas-
covarianzas como parámetros.
3. Las variables económicas no son procesos estacionarios, porque todas ellas presentan
tendencia, lo más seguro es que sean estacionales y no es extraño que su varianza
aumente con el tiempo. Sin embargo, es posible conseguir que sean estacionarios
mediante transformaciones sencillas. Para eliminar la tendencia se tiene la diferenciación
(incrementos), para eliminar la estacionalidad se tiene la diferenciación estacional
(incrementos interanuales), y para una varianza constante se pueden tomar logaritmos.
4. Para explicar la relación de una variable con sus valores pasados se dispone de las
funciones de autocorrelación simple y parcial. La autocorrelación parcial (FAP) cuantifica
la relación directa que existe entre las variables situadas en dos instantes de tiempo
cualesquiera, mientras que la autocorrelación simple (FAS) cuantifica la relación total
existente entre las variables separadas en dos instantes de tiempo.
CUESTIONES
P1.- Describe las principales características de la serie temporal trimestral CONSUMO FINAL
EN LOS HOGARES y determina las transformaciones que son necesarias para conseguir que
la serie sea estacionaria.
CONSUMOFH
100000
95000
90000
85000
CONSUMOFH
80000
75000
70000
65000
60000
1995 1996 1997 1998 1999 2000 2001 2002
trimestre
P2.- Las siguientes figuras corresponden a la serie NÚMERO de LLAMADAS de TELÉFONO (en
millones de unidades) realizadas en España desde enero de 1992 hasta mayo de 1996. A
partir de ellas indicar de forma razonada las transformaciones que parecen razonables
para conseguir la estacionariedad.
LLAMADAS
1800
1700
1600
LLAMADAS
1500
1400
1300
1200
1100
1992 1993 1994 1995 1996 1997
mes
P3.- Se desea transformar la serie CONSUMO DE VERDURAS en la ciudad de Valencia para que
sea estacionaria. Por ello se pide determinar las características más relevantes de la serie,
así como las transformaciones que deben realizarse para convertirla en estacionaria.
Comentar las siguientes figuras, con la serie y la FAS originales, la FAS de la serie con una
diferencia para la tendencia (d_VERDURA) y la FAS de la serie con una diferencia estacional
de periodo 12 (sd_VERDURA).
VERDURA
13000
12000
11000
10000
VERDURA
9000
8000
7000
6000
5000
1998 2000 2002 2004 2006 2008
mes
PROCESOS ESTOCÁSTICOS 08.19
P4.- Describe las principales características del gasto en PUBLICIDAD de NETFLIX, en miles de
dólares USA, observada trimestralmente desde el primer trimestre de 2010 hasta el cuarto
trimestre de 2017. A partir de ellas determina las transformaciones que deben realizarse
para convertirla en estacionaria.
0.5
400000 0
-0.5
350000 -1
0 2 4 6 8 10
lag
+- 1.96/T^0.5
0.5
250000
200000 -0.5
-1
0 2 4 6 8 10
150000 lag
100000
50000
2010 2011 2012 2013 2014 2015 2016 2017 2018
trimestre
P5.- Describe las principales características de la serie temporal mensual VOLUMEN DE FRUTA
COMERCIALIZADO EN LA CIUDAD DE VALENCIA (toneladas). A partir de ellas determina las
transformaciones que deben realizarse para convertirla en estacionaria.
0.5
9000
-0.5
-1
0 5 10 15 20 25
lag
8000
0.5
7000
-0.5
6000
-1
0 5 10 15 20 25
lag
5000
4000
1994 1996 1998 2000 2002 2004 2006 2008
mes
P6.- Describe las principales características de la serie número de PASAJEROS del tranvía de
València, línea 6, medido en personas, desde septiembre de 2007. A partir de ellas
determina las transformaciones que deben realizarse para convertirla en estacionaria.
08.20 MODELOS DE SERIES TEMPORALES UNIVARIANTES
0.5
250000
-0.5
-1
0 5 10 15 20 25
lag
200000
0.5
150000
-0.5
100000
-1
0 5 10 15 20 25
lag
50000
0
2008 2009 2010 2011 2012 2013 2014 2015
MES