0% encontró este documento útil (0 votos)
11 vistas10 páginas

2 Tendencia

El documento aborda la modelización de tendencias determinísticas en series temporales, centrándose en funciones lineales, cuadráticas y exponenciales. Se discuten métodos de estimación y pronóstico, enfatizando la importancia de seleccionar el modelo que mejor pronostique, en lugar de aquel que simplemente ajuste mejor los datos. Además, se mencionan criterios para evitar el sobreajuste al elegir modelos econométricos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
11 vistas10 páginas

2 Tendencia

El documento aborda la modelización de tendencias determinísticas en series temporales, centrándose en funciones lineales, cuadráticas y exponenciales. Se discuten métodos de estimación y pronóstico, enfatizando la importancia de seleccionar el modelo que mejor pronostique, en lugar de aquel que simplemente ajuste mejor los datos. Además, se mencionan criterios para evitar el sobreajuste al elegir modelos econométricos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Notas de clase Ernesto Cordero/Alexis Capdevielle

2. Tendencia Determinística

2.1 Especificaciones econométricas para modelar tendencia

Tendencia es la evolución gradual y de largo plazo que presentan ciertas series.


Es producida por: evolución gradual de preferencias, tecnología, instituciones y demografía.

En este momento, nos vamos a enfocar en tendencias determinísticas, es decir, en


tendencias que son perfectamente predecibles.

La tendencia se modela:
1. Funciones lineales
2. Funciones cuadráticas
3. Funciones exponenciales

1. Función lineal
𝑇! = 𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜! Donde: 𝑡𝑖𝑒𝑚𝑝𝑜 = 1,2,3, . . . , 𝑇

Ejemplo: Tasa de cobertura educativa a nivel bachillerato.

Tasa de cobertura educativa


𝑇! = 𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜! + 𝜀! comportamiento
𝑇2! = 𝛽3" + 𝛽3# 𝑡𝑖𝑒𝑚𝑝𝑜!
Residuales: 𝜀̂! = 𝑇! − 𝑇2! RESIDUALES:
diferencia entre
valor observado y
el valor predicho

Negro: comportamiento
Verde: lo que estimo
Azul: residuales

1
Notas de clase Ernesto Cordero/Alexis Capdevielle

2. Función Cuadrática
𝑇! = 𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜! + 𝛽% 𝑡𝑖𝑒𝑚𝑝𝑜! %
𝑇𝑒𝑛𝑑𝑒𝑛𝑐𝑖𝑎 = 𝑎 + 𝑏 𝑡𝑖𝑒𝑚𝑝𝑜 + 𝑐 𝑡𝑖𝑒𝑚𝑝𝑜! %

Tendencia

a>0
b>0
c>0

Tiempo

Tendencia

a>0
b<0 retornos marginales
decrecientes
c<0

Tiempo

a>0
b y c tienen signos opuestos en casi todos los
b>0 modelos que nos interesan
c<0

2
Notas de clase Ernesto Cordero/Alexis Capdevielle

Tendencia retornos marginales crecientes


a>0
b<0
c>0

Tiempo

Ejemplo: Venta de DVD´s

Venta de DVDs:
𝑇! = 𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜! + 𝛽% 𝑡𝑖𝑒𝑚𝑝𝑜! % + 𝜀!
𝑇2! = 𝛽3" + 𝛽3# 𝑡𝑖𝑒𝑚𝑝𝑜! + 𝛽3% 𝑡𝑖𝑒𝑚𝑝𝑜!%
Residuales: 𝜀̂! = 𝑇! − 𝑇2!

3. Función Exponencial
𝑇! = 𝛽" 𝐸𝑥𝑝&! !'()*+"
𝑙𝑛𝑇! = 𝑙𝑛(𝛽" 𝐸𝑥𝑝&! !'()*+" ) así se puede linealizar
𝑙𝑛𝑇! = 𝑙𝑛𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜!
𝑇𝑒𝑛𝑑𝑒𝑛𝑐𝑖𝑎 = 𝑎𝑒 ,!'()*+ a, e son par{ametros

3
Notas de clase Ernesto Cordero/Alexis Capdevielle

Tendencia

a>0
b>0

Tiempo

Tendencia

a>0
b<0

Tiempo

Tiempo

a<0
b>0

Tendencia

4
Notas de clase Ernesto Cordero/Alexis Capdevielle

a<0
b<0

Ejemplo: Volumen de transacciones de Amazon

Transacciones de Amazon:
𝑇! = 𝛽" 𝐸𝑥𝑝&! !'()*+" + 𝜀!
/
𝑇2! = 𝛽3" 𝑒 &! !'()*+"
Residuales: 𝜀̂! = 𝑇! − 𝑇2!

2.2 Estimación de especificaciones con tendencia: en esta T, sustituimos cualquiera de estas


-
busco vector theta que
minimice la suma de los 𝜃2 = 𝑎𝑟𝑔𝑚𝑖𝑛 C[ 𝑌! − 𝑇! (𝜃)]%
residuales al cuadrado. !.#

- En el caso lineal: 𝜃 = {𝛽" , 𝛽# } 𝑇! = 𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜! consiste en solo dos parámetros: B0 ordenada
al origen; B1 pendiente

- En el caso cuadrático: 𝜃 = {𝛽" , 𝛽# , 𝛽% } 𝑇! = 𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜! + 𝛽% 𝑡𝑖𝑒𝑚𝑝𝑜! %

- En el caso exponencial: 𝜃 = {𝛽" , 𝛽# } 𝑇! = 𝛽" 𝐸𝑥𝑝&! !'()*+"

5
Notas de clase Ernesto Cordero/Alexis Capdevielle

2.3 Pronóstico de tendencia:

Utilizaremos el modelo lineal para ejemplificar, pero aplica para el cuadrático y exponencial.
Para pronosticar en 𝑇 + ℎ: error estocástico, que supongo que se
distribuye como normal(0, sigma
cuadrado)
𝑌-01 = 𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜-01 +𝜀-01
valor esperado condicionado con omega T 𝐸(𝑌-01 |Ω - )= 𝐸(𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜-01 +𝜀-01 |Ω - )
Valor esperado de B0 = B0 omega t: toda la información que
Valor esperado de B1tiempot+h= B1 𝑌-01|- = 𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜-01 + 0 tenemos hasta el momento (T)
T: ultima observación
Valor esperado del error=0 𝑌
como no conozco B0 ni B1, lo conozco cn minimos cuadrados-01|-
= 𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜-01 T+h: futuro
ordinarios → 𝑌2-01|- = 𝛽3" + 𝛽3# 𝑡𝑖𝑒𝑚𝑝𝑜-01
Donde Ω - : información disponible en T.
Conozco 𝑡𝑖𝑒𝑚𝑝𝑜-01
Asumimos que 𝜀! ~𝑁(. )
𝜀! ~𝑁(0, 𝜎 % )

También se puede demostrar que 𝑌-01 ~𝑁( 𝑌-01|- , 𝜎 % ) porque nada es estocástico
Aproximando → 𝑁( 𝑌2-01|- , 𝜎Q % )

Intervalo de pronóstico al 95% de confianza:


𝐼𝑃 = 𝑌-01|- ± 1.96𝜎
𝐼𝑃 = W𝑌-01|- ± 1.96𝜎Q

𝜎Q → SE de la regresión de tendencia

2.4 Selección de modelos:

¿Cómo elegimos entre modelos? Elegimos el modelo que PRONOSTIQUE MEJOR, no el que tiene mejor ajuste.
¿Lineal o cuadrático o exponencial?
→ ¡¡¡En series de tiempo elegimos el que pronostique mejor!!!
→ Nos interesa encontrar el modelo con la varianza del error de predicción fuera de muestra
más pequeño. Este es el modelo que pronostica mejor
→ Nos dará el pronóstico con la varianza más pequeña.

¿Qué es esto?
Supongamos el modelo lineal, pero aplica para todos.

𝑌! = 𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜! + 𝜀!
𝑌-01 = 𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜-01 +𝜀-01
𝐸(𝑌-01 |Ω - )= 𝑌-01|- = 𝛽" + 𝛽# 𝑡𝑖𝑒𝑚𝑝𝑜-01
→ 𝑌2-01|- = 𝛽3" + 𝛽3# 𝑡𝑖𝑒𝑚𝑝𝑜-01

6
Notas de clase Ernesto Cordero/Alexis Capdevielle

Error de pronóstico: lo que sucede comparado con lo que predije h periodos atras
𝑌-01 − 𝑌2-01|- = (𝛽" − 𝛽3" ) + (𝛽# − 𝛽3# )(𝑡𝑖𝑒𝑚𝑝𝑜-01 ) + 𝜀-01 B0- B0 estimador, B1 - B1 estimador
dan cero porque supongo que es
𝑌-01 − 𝑌2-01|- ≈ 𝜀-01 muy buen estimador que se parece
tanto a las betas.
𝐸(𝜀-01 ) = 0
%
𝑣𝑎𝑟(𝜀-01 ) = 𝐸(𝜀-01 ) Dado que la espperanza es cero, la varianza
%
→ 𝐸(𝜀-01 )
→ El error de predicción cuadrático medio.

¿Y eso cómo es?


→ Una primera respuesta es estimarlo con el error cuadrático medio
∑-!.# 𝑒!% utilizo informacion dentro de la muestra, para suponer un
→ 𝑀𝑆𝐸 = compartamiento fuera de la muestra.
𝑇
𝑒! = 𝑌! − 𝑌2!
𝑌2! = 𝛽3" + 𝛽3# 𝑡𝑖𝑒𝑚𝑝𝑜! In sample
Overfitting: (dentro de la muestra)

Es posible que sobreestimemos un modelo → polinomio de grado muy alto


→ Modelamos el ruido blanco → el error estocástico → esto no quiere decir que seamos
capaces de pronosticarlo.

𝑌~𝑁(5, 𝜎 % )
Y

¡¡¡Lo puedo ajustar con un polinomio de grado 480!!!

𝑌 = 𝛽" + 𝛽# 𝑡 + 𝛽% 𝑡 % +. . . +𝛽34" 𝑡 34"

7
Notas de clase Ernesto Cordero/Alexis Capdevielle

Si ajusto un modelo así, seguro se van a parecer y MSE muy cercano a cero… Esto no quiere
decir que sea un buen modelo de pronóstico.

En econometría se enseña que un criterio para elegir modelo es la 𝑅% :


𝑀𝑆𝐸
𝑅% = 1 −
1
∑(𝑦! − 𝑦a)%
𝑇
𝑅% tiene el mismo problema que MSE
Si #𝑘 ↑→ 𝑀𝑆𝐸 ↓ 𝑅% ↑
→ Puede elegir un modelo con overfitting

El reto consiste en encontrar un indicador que refleje un buen ajuste, pero también evite el
overfitting que se presenta al utilizar muchos parámetros.

Criterio de selección:
𝑓(𝑘, 𝑇)𝑀𝑆𝐸
Si #𝑘 ↑→ 𝑓(𝑘, 𝑇) ↑
Si #𝑘 ↑→ 𝑀𝑆𝐸 ↓
→ Criterio de selección evita el overfitting

Una posible alternativa es el error cuadrático medio ajustando por grados de libertad:
𝑇
𝑆% = 𝑀𝑆𝐸
𝑇−𝑘
𝑇
𝑓(𝑘, 𝑇) =
𝑇−𝑘
-
Si #𝑘 ↑→ -56 ↑

Otra alternativa es el criterio de Akaike:


%6 ∑-!.# 𝑒!%
𝐴𝐼𝐶 = 𝑒 -
𝑇
%6
𝑓(𝑘, 𝑇) = 𝑒 -

#$
Si 𝑘 ↑→ 𝑒 % ↑

Otra alternativa es el criterio de Schwarz (Bayes):


∑-!.# 𝑒!%
6
𝐵𝐼𝐶 ó 𝑆𝐼𝐶 = 𝑇 -
𝑇
6
𝑓(𝑘, 𝑇) = 𝑇 -
$
Si 𝑘 ↑→ 𝑇 % ↑

8
Notas de clase Ernesto Cordero/Alexis Capdevielle

𝑇
𝑇 1
𝑆 %
→ 𝑓(𝑘, 𝑇) = = 𝑇 =
𝑇 − 𝑘 𝑇 − 𝑘 1 − 𝑘/𝑇
𝑇 𝑇
Si 𝑘/𝑇 = 0 → 𝑓(𝑘, 𝑇) = 1
Si 𝑘/𝑇 = 0.25 → 𝑓(𝑘, 𝑇) = 1/0.75 = 1.33

%6
𝐴𝐼𝐶 → 𝑓(𝑘, 𝑇) = 𝑒 -
Si 𝑘/𝑇 = 0 → 𝑓(𝑘, 𝑇) = 1
Si 𝑘/𝑇 = 0.25 → 𝑓(𝑘, 𝑇) = 𝑒 %(".%9) = 𝑒 ".9 = 1.65

6
𝐵𝐼𝐶 → 𝑓(𝑘, 𝑇) = 𝑇 -
Si 𝑘/𝑇 = 0 → 𝑓(𝑘, 𝑇) = 1
Si 𝑘/𝑇 = 0.25 → 𝑓(𝑘, 𝑇) = 𝑇 ".%9 = 100".%9 = 3.16 (suponemos T=100)

→ Penaliza más severamente SIC, es decir, si metemos muchas variables, el criterio de


Schwarz va a penalizar más severamente, evitando el overfitting.

SIC es consistente:
1. Cuando el modelo “verdadero” está entre los considerados, SIC lo va a seleccionar
con probabilidad aproximándose a 1 a medida que la muestra crece.
2. Cuando el modelo no está entre los considerados, la probabilidad de elegir a la mejor
aproximación se acerca a 1 a medida que la muestra crece.

AIC es asintóticamente eficiente:


Un criterio de información es asintóticamente eficiente si elige al modelo cuya varianza de
pronóstico se acerca a la varianza de pronóstico del modelo “verdadero”.

9
Notas de clase Ernesto Cordero/Alexis Capdevielle

BIC es consistente
AIC no es consistente, pero es asintóticamente eficiente.

→ Se aconseja utilizar BIC → es consistente y nos sugiere el modelo más parsimonioso →


KISS principle

En este contexto, estimamos las tres especificaciones: lineal, cuadrática y exponencial.


Elegimos la especificación con el menor BIC.

10

También podría gustarte