Análisis básico de series temporales
Ing. Civil Industrial
Regresión y Pronóstico de Datos
MSc: Alejandro Andrés Panes Pérez
Universidad Santo Tomás
[email protected] 27 de noviembre de 2023
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 1 / 22
Introducción y conceptos básicos de series
temporales o de tiempo
Una serie de tiempo es un conjunto de mediciones que describen la
evolución de un fenómeno o variable a lo largo del tiempo (Pepio, 2001).
De manera formal, es una secuencia cronológica ordenada de valores de
medición sobre el estado de una variable cuantitativa de un fenómeno o
proceso. Dichas mediciones están ordenadas respecto al tiempo y son
generalmente dependientes entre sí. esta dependencia entre las
observaciones jugaran un papel importante en el análisis de la serie.
Así entonces, una serie de tiempo puede representar desde los precios de
un articulo, las tasas de desempleo, la temperatura máxima diaria, la
velocidad del viento, etc. Las observaciones de una serie de tiempo
pueden ser denotadas como:
Y1 , Y2 , Y3 , Y4 , ..., Yt−1 , Yt
, donde Yt es el valor tomado por el proceso en el instante t.
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 2 / 22
• Los valores de una serie de tiempo se clasifican en continuos y
discretos.
• una serie medida en periodo de tiempos continuos se presenta
cuando los valores de estado de la variable se obtienen de forma
permanente o fluida en el tiempo.
• Una serie medida en periodos de tiempo discreto, los valores se
obtienen para los intervalos de tiempo usualmente homogéneos y
representa una magnitud acumulada del estado de la variable
durante cada uno de esos intervalos.
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 3 / 22
Análisis visual de una serie temporal
La investigación científica asume como una de sus primeras tareas,
identificar las cosas (características o factores) que participan en un
fenómeno. Los gráficos son la forma más efectiva de identificar efectos de
eventos que inciden en los datos. De ser posible, estos eventos deben ser
ajustados o incluidos en el modelo. Un gráfico permite observar:
• Frecuencia de los datos
• La tendencia
• Los valores extremos
• La dispersión
• Cambios estructurales
• La estacionalidad
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 4 / 22
Longitud de las series: ¿Cuántos datos utilizar?
• Depende del objetivo del estudio
• Para análisis de ciclos se requieren series muy largas (más de 10 años)
• Para modelos univariantes se sugiere no menos de 5 años
• Para modelos de regresión no menos de 15 datos
• Para calcular la correlación entre dos variables no menos de 30 datos
• El aporte a las series de tiempo de La crítica de Lucas, R.E., Jr.(1976),
sugiere el número de datos de una serie de tiempo que se deben
utilizar, reduciéndolo a aquel periodo de datos que lucen
homogéneos.
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 5 / 22
Variables derivadas
• Una serie transformada puede tener propiedades estadísticas
diferentes a la serie original.
• Graficar los datos: en niveles, logaritmos, tasas de crecimiento, reales,
nominales.
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 6 / 22
La autocorrelación
• La correlación en series de tiempo se conoce como autocorrelación o
correlación serial.
• La correlación indica dos aspectos:
• El valor indica la magnitud de la asociación (−1; −1)
• El signo indica la dirección de la relación.
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 7 / 22
La estacionariedad
• El proceso está en equilibrio estadístico alrededor de un valor medio.
• Distribución de probabilidad común e invariante en el tiempo.
• La media es única (local y global) y representativa de todo el período
analizado.
• La varianza es constante y finita.
• La función de autocorrelación decae rápidamente en el tiempo.
• Un shock en un momento dado tiene efecto en el corto plazo.
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 8 / 22
Volatilidad
• La volatilidad se refiere al grado de incertidumbre en un periodo de
tiempo de una determinada variable.
• Usualmente se utiliza una medida de la dispersión de una variable: la
desviación estándar o la variancia.
• Puede ser un número absoluto (desviación estándar) o una razón
(como porcentaje de la media, llamado coeficiente de variación).
• Comúnmente la volatilidad está asociada al riesgo. Entre más alta la
volatilidad hay más riesgo.
• La volatilidad no es un indicador de la dirección del cambio (debido a
que los cambios están elevados al cuadrado).
• La volatilidad puede variar en el tiempo: periodos más o menos
volátiles.
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 9 / 22
Cargar en R
Antes de todo es necesario cargar la siguiente librería:
install.packages("dplyr")
library(dplyr)
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 10 / 22
Definición de una serie temporal
En esta primera parte vamos a trabajar con el fichero gas6677.dat que
contiene datos mensuales del consumo de gasolina en España entre
enero de 1966 y agosto de 1977. Una vez situado el fichero en el directorio
de trabajo lo leemos y creamos un vector llamado gas con el comando.
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 11 / 22
Vemos que el gráfico resultante no es el más apropiado para describir una
serie temporal. Si queremos que R trate a un objeto como serie temporal,
tenemos que determinar apropiadamente sus características con el
comando ts. Para definir la serie correctamente escribimos:
El argumento frequency se utiliza para indicar la periodicidad de la serie
(en este caso mensual), mientras que el argumento start indica la fecha de
la primera observación (enero de 1966)
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 12 / 22
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 13 / 22
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 14 / 22
Vemos ahora cómo el resultado depende de las características que hemos
definido para la serie. Si queremos comparar la distribución del consumo
de gasolina para cada mes, un gráfico útil es:
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 15 / 22
El comando cycle determina la unidad de tiempo a la que pertenece cada
observación de la serie:
cycle(gas.ts)
Por lo tanto, en el gráfico anterior se ha producido un diagrama de cajas
para cada mes del año.
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 16 / 22
Descomposición de una serie
Es frecuente analizar las series temporales desde el punto de vista de sus
componentes estructurales: Serie observada = Tendencia + Efecto estacional +
Residuos. En este modelo, la serie observada es el resultado de sumar una
tendencia que representa el comportamiento a largo plazo de la serie, un efecto
estacional que describe sus fluctuaciones periódicas y un componente residual
que describe las variaciones a corto plazo, normalmente impredecibles. Con R es
muy sencillo obtener una descomposición estructural de este tipo. Se usa el
comando decompose:
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 17 / 22
Esta descomposición se basa en métodos elementales: la tendencia se calcula con
una media móvil, el efecto estacional se calcula promediando los valores de cada
unidad de tiempo para todos los periodos (por ejemplo, todos los meses de enero
si la serie es mensual) y luego centrando el resultado. Finalmente, los residuos se
obtienen restando a la serie observada las dos componentes anteriores. La
descomposicion solo es totalmente adecuada si se dispone de un número
completo de periodos (por ejemplo, un múltiplo de 12 si la serie es mensual).
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 18 / 22
Transformaciones básicas de una serie
En el gráfico de gas.ts se observa que la serie no es estacionaria. La serie
presenta una tendencia aparentemente lineal y una estacionalidad muy marcada
(el consumo aumenta los meses de verano). Además, la amplitud de las
fluctuaciones aumenta con el tiempo por lo que la variabilidad tampoco es
constante. Sin embargo, muchos modelos importantes de series temporales
corresponden a series estacionarias (es decir, sin tendencia ni estacionalidad y
con variabilidad constante). Antes de ajustar un modelo estacionario tenemos que
transformar la serie original.
Estabilización de la varianza: Para estabilizar la variabilidad se suelen tomar
logaritmos. Esta transformación funcionará bien cuando la variabilidad sea
aproximadamente proporcional al nivel de la serie. Representamos la serie
transformada mediante
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 19 / 22
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 20 / 22
Eliminación de tendencia: Una forma sencilla de eliminar una tendencia
aproximadamente lineal es diferenciar la serie, es decir, considerar la
serie de diferencias entre una observación y la anterior en lugar de la
serie original. Si xt es una serie contenida en x, para calcular
∆xt = xt − xt−1 con R se escribe:
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 21 / 22
Eliminación de estacionalidad: Para eliminar la estacionalidad de una
serie mensual se pueden tomar diferencias estacionales de orden 12. Si xt
es la serie que queremos desestacionalizar, se trata de calcular
∆12xt = xt − xt−12 :
MSc: Alejandro Andrés Panes Pérez (UST) CPI 27 de noviembre de 2023 22 / 22