Examen Final
John Alexis Chica Garcés
Roosvelth Jhovany Sánchez Grajales
Grupo
133
Diego Fernando Téllez Falla
Docente
Maestría en Administración Financiera
Escuela de Economía y Finanzas
Econometría Financiera
Universidad EAFIT
2020-2
Examen Final
1. Use la Lectura del CFA “Multiple regression and machine learning” para contestar
las siguientes preguntas: (CFA Institute, 2020)
a. ¿Qué es aprendizaje de máquina?
El aprendizaje de máquina o machine learning [ML] es una rama de la Inteligencia Artificial
[IA] que consiste en sistema informático de programación que se lleva a cabo a través de
equipos de cómputo para extraer información de la universalidad de los datos. Existen casos
en los que su enfoque es ganar conocimiento y experiencia de una variable por medio de
observación y análisis de datos y poder así conocer la forma en cómo se comporta y cuál es
su desempeño.
Los modelos que resultan de la agrupación y relación de datos pueden llegar a predecir el
valor que puede tomar una variable y describir su impacto en relación a otra(s) variable(s).
Por ejemplo: El rendimiento de un activo financiero no sólo puede estar influenciado por los
rendimientos de su mercado de referencia, sino que también podría estar afectado por otras
variables macroeconómicas como el tipo de interés, Producto Interno Bruto, desempleo,
inflación y ciclo económico.
b. ¿Qué diferencia hay entre aprendizaje supervisado vs no supervisado?
El aprendizaje supervisado consiste en entrenar un algoritmo teniendo en cuenta etiquetas
de datos denominadas como variables objetivo Y, las cuales serán explicadas por
características específicas de variables explicativas X. El aprendizaje se puede dividir en dos;
Regresión y clasificación, esta división se da de acuerdo a la naturaleza de la variable
explicada Y, si la variable Y es continua (cuando nos arroja un número, por ejemplo, la
probabilidad de tener un accidente), si la variable Y es ordinal (cuando tenemos
características particulares) entonces será un problema de clasificación.
En el aprendizaje supervisado se tienen en cuenta modelos lineales y no lineales.
Para el aprendizaje supervisado tenemos una serie de observaciones de una variable
explicada Y y n variables explicativas X las cuales se utilizan para establecer una relación
entre sí.
El aprendizaje no supervisado es una inferencia que tiene la máquina donde no hay un
objetivo que coincida en el conjunto de características, este solo se enfoca en el estudio de
las variables explicativas X, en este caso no tenemos variables objetivo Y. Este aprendizaje
se encarga de la agrupación y la reducción de dimensiones.
Para los algoritmos no supervisados, la agrupación no está dada por una etiqueta de datos
previamente estipulada por el investigador, en estos algoritmos los grupos se determinan por
los propios datos.
En el aprendizaje no supervisado solo se tiene en cuenta variables explicativas X, las cuales
por sí mismas determinan la variable objetivo Y.
c. ¿Cuáles son los algoritmos más comunes para cada caso (aprendizaje (no)
supervisado? Explique brevemente.
[1]. Aprendizaje supervisado:
Regresión penalizada
Este algoritmo es una técnica computacional utilizada para solucionar problemas de
predicción, que permite realizar regresiones que seleccionan y regularizan variables para
mejorar la exactitud de los modelos estadísticos. En la regresión penalizada los coeficientes
se eligen para minimizar la suma de los residuos y se utiliza un término de penalización que
aumenta a medida que aumenta el número de variables, de esta manera solo se tienen en
cuenta en el modelo las variables más importantes para explicar Y, por lo tanto, se reduce
una gran cantidad de variables independientes a un conjunto de datos menos robusto.
A medida que se incluyan más variables al modelo la penalización será mayor, por lo tanto,
en este tipo de regresiones las variables incluidas deben realizar aportes al modelo lo
suficientemente altos para compensar la penalización por incluirlas.
Árboles de clasificación y regresión CART
Es una técnica básica para los problemas de clasificación o discriminación, se puede utilizar
para hacer predicciones de variables objetivo cualitativas o categóricas.
Este algoritmo utiliza árboles de decisión con clasificaciones de dos vías para las
observaciones, dando así con un esquema de bifurcaciones anidadas en forma de árbol y de
esta manera siguiendo por cada una de las categorías haciendo particiones cada vez más
pequeñas, logrando al final tener una predicción para la clase o categoría que se han ido
exigiendo en las diferentes bifurcaciones. En general, las regiones del árbol pueden terminar
siendo más robustas que otras.
Gráfica 1 Classification Tree (Simple Case) tomado de CFA Capítulo 8 Multiple Regression and Machine Learning
2018.
Bosques al azar
Un algoritmo de clasificación de bosques al azar o aleatorios consiste en un conjunto de
árboles de clasificación, los cuales se construyen a través de una extracción aleatoria de
observaciones y extracciones aleatorias de características para obtener predicciones más
precisas.
Para la creación de los árboles en el bosque aleatorio utilizamos todas las variables
independientes disponibles (x) como candidatas y seleccionamos la que mayor ajuste tenga
al subconjunto, por esta razón, cada árbol es ligeramente diferente. Para las nuevas
observaciones que se realizan se permitimos que los árboles clasificadores realicen la
clasificación por mayoría de votos, lo cual genera una versión de aprendizaje automático.
Redes Neuronales
Las redes neuronales son un modelo computacional que se utiliza para variadas tareas como
reconocimiento de caracteres, de imágenes, de voz, para predicciones bursátiles, etc, con los
algoritmos de redes neuronales se pueden modelar comportamientos inteligentes.
Las redes neuronales tienen tres capas conectadas por enlaces, una capa de entrada, una
capa oculta y un nodo en capa de salida. En la capa de entrada tendremos las variables y en
la capa oculta, el modelo realizará un cálculo interno de ponderación mediante la aplicación
de una fórmula llamada activación que es no lineal, la cual posteriormente generará un valor
de salida, la ponderación de cada una de las entradas está dada por el peso que se le asigna.
Estos pesos son los parámetros del modelo, el aprendizaje automático tendrá lugar en la
mejora de los pesos aplicados a cada una de las entradas.
Gráfica 2 A Neural Network with One Hidden Layer tomado de CFA Capítulo 8 Multiple Regression and Machine
Learning 2018.
[2]. Aprendizaje no supervisado:
Algoritmos de agrupación
Estos algoritmos realizan la agrupación de objetos de datos únicamente con la información
de los datos, sin tener una variable objetivo definida previamente, se agrupan principalmente
por distancia y similitud entre sí.
Los enfoques de este algoritmo se pueden situar en dos: Agrupación de arriba hacia abajo y
agrupación de abajo hacia arriba. En la agrupación de abajo hacia arriba se da a medida que
se realizan observaciones del grupo de datos y se realizan agrupaciones de observaciones
en grupos más grandes. En la agrupación de arriba hacia abajo es el comportamiento
contrario, tenemos las observaciones de un grupo de datos robusto y se realizan
observaciones de grupos cada vez más pequeños.
Los algoritmos de agrupación pueden descubrir estructuras de datos sin necesidad de
agregar variables objetivo.
Estos algoritmos se pueden utilizar para segmentación de clientes, clasificación de empresas,
gestión de portafolios financieros.
Reducción de la dimensión
Este tipo de aprendizaje no supervisado se encarga de reducir las grandes dimensiones de
datos mediante el método estadístico análisis de los componentes principales ACP por el cual
se puede transformar un conjunto de datos con variables muy correlacionadas en un conjunto
de datos de variables que no se encuentren correlacionadas, las cuales se denominan
componentes principales.
Mediante este método se establece cuántos componentes o variables se deben mantener,
este tipo de algoritmo es aplicable tanto a datos numéricos como a datos textuales y visuales.
d. Proponga un trabajo en el cual utilice alguno de los algoritmos más comunes
de aprendizaje de máquina para resolver un problema financiero. Sea lo más detallado
posible.
Problema financiero identificado: Precio de cotización internacional del petróleo.
¿De qué depende el precio de cotización internacional del petróleo?
“La caída en el precio internacional del petróleo tiene implicaciones importantes en el ciclo
económico en las economías exportadoras de petróleo” (BanRep, 2015).
El precio del petróleo es el producto más importante de la economía colombiana y nos da
información de lo que está pasando realmente. La demanda de petróleo indica el
comportamiento de la actividad económica mundial.
Los altos precios del petróleo pueden provocar recesiones en las economías, así como los
precios bajos pueden ayudarlas en su recuperación, una caída masiva en los precios del
petróleo contribuye a un recorte mundial de impuestos de grandes y pequeñas y empresas.
(BBC, 2020).
Variable dependiente o endógena:
Y= Precio de Cotización del Petróleo.
Variables independientes o exógenas:
X01= Valor del dólar.
X02= Oferta y demanda de crudo.
X03= Decisiones de la OPEP.
X04= Fuentes de energías alternativas o productos sustitutos.
X05= Relaciones geopolíticas entre los mayores productores. (EE UU, EA y Rusia).
X06= Nuevas reservas de petróleo.
X07= Proyectos de exploración.
X08= Especulación bursátil.
X09= Demanda futura de petróleo como activo.
X10= Condiciones meteorológicas
X11= Regulaciones del sector petrolero.
X12= Políticas ambientales
Usando Algoritmos Machine Learning [ML]
Aprendizaje Supervisado:
Modelo Lasso - Regresión penalizada.
Ecuación 01: Regresión Lasso
Ecuación 02: Regresión Lasso - Penalización
Fuente: (UdelaR, 2013)
Por medio de este modelo de regresión lineal penalizada se realiza una selección y
regularización de variables que permiten mejorar la exactitud e interpretabilidad del modelo
estadístico, seleccionando solamente un subconjunto de las variables del modelo final.
La regularización Lasso se utiliza cuando existen indicios de atributos de entrada irrelevantes,
se usa Lasso para que la solución sea menos densa, favoreciendo que alguno de los
coeficientes acaba valiendo 0, esto nos ayuda a identificar las variables relevantes en el
modelo y de esta manera realizar su mejor generalización (iartificial.net, s.f) .
2. Lectura: Tomando como referencia el documento disponible en el siguiente enlace:
https://repository.eafit.edu.co/handle/10784/7749
“Factores macroeconómicos que influyen en la volatilidad del índice accionario
COLCAP”
(León C, Susan & Trespalacios C, Alfredo, 2015)
a. ¿Cuál es la pregunta de investigación que motiva el trabajo?
El papel del sistema financiero ha tenido gran relevancia para la vida de las personas y de las
compañías desde sus orígenes a través de actividades como la inversión, el ahorro y los
créditos que facilitan la circulación de capitales y otros factores productivos para el
funcionamiento de la economía y de su crecimiento sostenible en el largo plazo.
El mercado financiero es un sistema en el que agentes económicos realizan transacciones
de títulos valores como bonos, acciones, derivados, divisas y otros productos a un precio
definido por fuerzas de oferta y demanda. A partir de estos precios de negociación, los
mercados construyen un índice bursátil para analizar la evolución de los mismos, cuantificar
la rentabilidad, el riesgo y el beta de los activos financieros, crear carteras que replican su
comportamiento, conocer las expectativas de los agentes del mercado y se convierte en el
benchmark o referente para medir la gestión de un portafolio de activos o simplemente ser la
base de vehículos de inversión como derivados financieros o Exchange Traded Funds -
ETFs.
Para el caso colombiano el índice de referencia es el COLCAP para llevar a cabo
transacciones comerciales en bolsa o en el mercado de mostrador u OTC. No obstante, los
inversionistas tienen en cuenta variables macroeconómicas tales como tipos de interés,
inflación, PIB, desempleo, tasa de cambio, entre otros, que les permita tomar decisiones en
torno a rendimientos esperados y diversificación del riesgo.
En este trabajo de grado, se analiza la pregunta sobre cuál es el impacto o la influencia
que tienen algunos factores macroeconómicos sobre la volatilidad del COLCAP. La
medición de este indicador accionario se realiza día a día lo que permite describir el
comportamiento de la economía ya que agrupa a las 20 empresas más líquidas del país que
cotizan en la Bolsa de Valores de Colombia.
Sus autores enfatizan en los factores macroeconómicos porque representan una parte del
riesgo sistémico de las inversiones y sustentan sus argumentos en artículos científicos y
modelos econométricos para afirmar que estas variables de mercado si influyen en la
volatilidad del índice accionario colombiano.
b. Describa claramente los datos y la metodología propuesta por los autores.
Los autores realizaron una revisión de artículos científicos y modelos econométricos que
exponían variables macroeconómicas utilizadas para la predicción de series financieras,
como lo son la inflación, el PIB, el precio del petróleo, el precio del carbón etc., de estos
artículos, se tomaron las variables más relevantes para el estudio.
A continuación, se detallan las variables estudiadas por los autores con una muestra de enero
de 2008 a marzo de 2014, con 75 observaciones para cada variable.
El índice de precios al consumidor (IPC), Producto Interno Bruto (PIB), los precios del
petróleo (WTI), la tasa representativa del mercado (TRM), el empleo, el desempleo, el carbón,
las exportaciones, las importaciones, el índice de precios de vivienda nueva (IPVN), la tasa
intervención, Inversión extranjera de Cartera Débito, inversión extranjera de cartera crédito,
el índice general de la bolsa de valores de Lima (IGBVL), el índice de precios y cotizaciones
de la bolsa Mexicana de valores(IPC), el índice bursátil de la bolsa São Paulo- Brasil
(BOVESPA), el índice de precio selectivo de acciones de la bolsa de comercio de Santiago-
Chile (IPSA), el índice Standard & Poor's 500 de Estados Unidos (S&P 500), el índice bursátil
del mercado Japonés (Nikkei), el índice bursátil de la bolsa de valores de Hong Kong (Hang
Seng)
Para el análisis de estas variables se tomaron como base, la varianza muestral de los datos,
la desviación estándar y el índice VIMA.
Para la construcción de los modelos se hallaron las correlaciones de las variables, primero
de los índices bursátiles y luego las variables descritas previamente. Con estos datos
calcularon las correlaciones cruzadas para así encontrar las correlaciones con relación al
rendimiento al cuadrado, las desviaciones estándar y las medidas de volatilidad VIMA del
Colcap, con esta información generaron todos los rendimientos de las variables al cuadrado
que les permitió realizar un análisis de su varianza y así ajustar el modelo.
Con todas las posibles combinaciones de los datos que generaron con las correlaciones
cruzadas se construyeron modelos de regresión lineal, en el cual estimaron sus parámetros
y analizaron su validez estadística.
Los autores realizaron la regresión lineal a través del método de mínimos cuadrados
ordinarios (MCO), teniendo en cuenta sólo las combinaciones de variables con mayores
correlaciones cruzadas, logrando un buen ajuste al modelo, pues las variables tenidas en
cuenta en general para los datos estudiados explican bien la volatilidad del índice COLCAP.
c. ¿Cuáles son las principales conclusiones del trabajo? Explique claramente.
[1]. Los autores demostraron que existe un conjunto de variables macroeconómicas tanto
locales como internacionales que influyen en el comportamiento y volatilidad del índice
accionario colombiano y cómo otros índices bursátiles de referencia y los precios de algunos
commodities como el carbón y el petróleo impactan en su evolución.
[2]. El modelo de rendimientos al cuadrado del COLCAP con respecto a la multiplicación de
los rendimientos de las variables y de los rendimientos de las variables al cuadrado es el que
mejor describe la volatilidad que le aportan los factores macroeconómicos al índice COLCAP,
es decir, que el modelo está fundamentado en una medida de dispersión de datos como la
varianza.
[3]. Se demostró los efectos positivos con relación al índice accionario colombiano en las
combinaciones S&P500 y Bovespa (60,33%), IPSA e IPC (46,80%), Hang Seng y Nikkei
(38,95%), IGBVL y precios del carbón (32,27%) IPC e IGBVL ( 26,78%), Bovespa y precios
del Petróleo (14,93%).
[4]. La volatilidad del COLCAP está explicada por factores económicos y financieros tanto del
mercado local como internacional y el modelo econométrico que mejor describe la postura de
los autores es el rendimiento al cuadrado del COLCAP con respecto a la multiplicación de los
rendimientos de las variables y de los rendimientos de las variables al cuadrado.
[5]. Las variables que mostraron una menor relación en los modelos utilizados por los autores
fueron el empleo, las importaciones y el PIB en la que se reafirma con lo estudiado por
Brugger y Ortiz (2012) en la que la bolsa de valores influye en el desarrollo económico, pero
éste no influye en su desempeño.
[6]. Combinaciones entre IPC y TRM, tasa de intervención y TRM, Nikkei al cuadrado, IPVN
al cuadrado, carbón y desempleo, la tasa de intervención al cuadrado e inversión de cartera
crédito al cuadrado se comportan de forma inversa a la medida de volatilidad intradía del
mercado accionario - VIMA del COLCAP mientras que combinaciones como exportaciones y
carbón, IGBVL al cuadrado e inversión de cartera débito al cuadrado siguen la misma
tendencia del VIMA del COLCAP.
d. ¿Qué limitaciones encuentra usted en este trabajo? Explique.
[1]. Colombia es un país dependiente en gran parte de la exportación de commodities, estos
tienen un peso alrededor del 80% de las exportaciones (Portafolio, 2019). La dependencia de
un país de la exportación de commodities trae consecuencias negativas para la economía,
pues se hace vulnerable a la volatilidad de los precios internacionales de los mismos, la
disminución de ingresos a causa de la exportación de commodities ocasiona recortes en el
presupuesto general de la nación y una disminución del gasto y la inversión pública (Dinero,
2019).
Los autores al estudiar los factores macroeconómicos que impactan el índice COLCAP no
están teniendo en cuenta los principales commodities como otras variables que pueden
impactar el índice y de las cuales depende la economía colombiana, como lo son; El oro, la
plata, el platino y esmeraldas, fundamentales en el desarrollo económico del país.
El oro ha sido históricamente un activo de refugio, por lo tanto, se convierte en un buen
indicador para medir la volatilidad en los mercados (Portafolio, 2020). Lo anterior se puede
tener como una limitante de la investigación, pues los precios de estos commodities pueden
explicar variaciones importantes en los índices de la bolsa de valores.
[2]. Uno de los supuestos de los modelos de regresión lineal es que no tiene problemas de
especificación, es decir que su forma funcional y las variables que lo componen representan
la formulación correcta.
Existen cuatro tipos de razones que nos pueden generar errores de especificación; La omisión
de una variable relevante, lo que genera unos estimadores sesgados, inclusión de una
variable irrelevante en los cuales se pueden incluir variables explicativas que no afectan
significativamente la variable dependiente, uso de una forma funcional inadecuada en el cual
tenemos un modelo incorrecto que no se asemeja al comportamiento de los datos (Londoño,
2006).
Los autores utilizan un modelo de regresión lineal mediante mínimos cuadrados ordinarios
(MCO), sin embargo no dieron a conocer la realización de test de contraste (Test de Ramsey)
para los modelos utilizados en la investigación que permite identificar un error de
especificación como la omisión de una variable relevante que podría explicar mucho mejor el
modelo, lo que podría generar un problema de subespecificación, o la inclusión de una
variable irrelevante lo que podría generar un problema de sobreespecificación. .
e. Basado en el documento, plantee dos preguntas de investigación que usted
considera pueden complementar este estudio. Describa para cada una de ellas los
datos y la metodología a utilizar.
Pregunta 01: ¿Qué influencia tienen los movimientos de los índices bursátiles del Mercado
de Brasil sobre la volatilidad del índice accionario colombiano COLCAP?
Razón: Los autores encontraron una alta correlación entre la volatilidad del índice accionario
colombiano COLCAP y el índice bursátil de Brasil BOVESPA.
Objetivo: Reafirmar la correlación existente entre la volatilidad del COLCAP y BOVESPA a
través de la inclusión de otros índices bursátiles del mercado accionario de Brasil.
Metodología: Modelo de GARCH.
Justificación: Este modelo estima volatilidades en series financieras y puede predecir
volatilidades en el corto y mediano plazo. Incluyen las observaciones actuales e históricas.
Variable dependiente [Y]: Volatilidad del COLCAP.
Variables Independientes [X]:
X1= Bovespa.
X2= IBrX50 [Brazil 50].
X3=Tag Along [ITAG].
X4= Brazil Broad-Based.
Pregunta 02: ¿Cómo afecta la variación de precios de los principales commodities la
volatilidad del índice accionario colombiano COLCAP?
Razón: Los autores encontraron una alta correlación entre la volatilidad del COLCAP y el
precio de commodities como el petróleo y el carbón.
Objetivo: Establecer la relación que puede tener la volatilidad del índice accionario
colombiano COLCAP con la variación de precios de commodities como el petróleo y el carbón
[minero-energético] pero también con la inclusión de otras categorías de materias primas
como gas natural, oro, plata y aluminio.
Metodología: Modelo de Mínimos Cuadrados Ordinarios [MCO].
Justificación: El método MCO permite encontrar estimadores lineales insesgados y
eficientes. Está vinculado con la regresión y la correlación que nos indican el nivel de relación
entre dos o más variables.
Variable dependiente [Y]: Volatilidad del COLCAP.
Variables Independientes [X]:
X1= Precio del Petróleo.
X2= Precio del Carbón.
X3= Precio del Gas Natural.
X4= Precio del Oro.
X5= Precio del Plata.
X6= Precio del Aluminio
X7= Precio del Cobre
Referencias
BanRep. (2015). Precio del petróleo y el ajuste de las tasas de interés en las economías
emergentes. Obtenido de https://www.banrep.gov.co/es/borrador-901
BBC. (2020). Caída del petróleo: por qué el del crudo es el precio más importante de la
economía. Obtenido de https://www.bbc.com/mundo/noticias-52390556
CFA Institute. (2020). Multiple Regression and Machine Learning . En R. A. Sanjiv R. Das,
CFA Program Curriculum 2019 Level II (págs. 328-431). John Wiley & Sons
Incorporated.
Dinero. (2019). Crisis climática y dependencia a la exportación de 'commodities'. Obtenido
de https://www.dinero.com/opinion/columnistas/articulo/crisis-climatica-y-
dependencia-a-la-exportacion-de-commodities-por-maria-alejandra-gonzalez-
perez/277884
iartificial.net. (s.f). Regularización Lasso L1, Ridge L2 y ElasticNet. Obtenido de
https://www.iartificial.net/regularizacion-lasso-l1-ridge-l2-y-elasticnet/
León C, S., & Trespalacios C, A. (2015). Factores macroeconómicos que influyen en la
volatilidad del índice accionario COLCAP. Repositorio Institucional Universidad
EAFIT, 1-33.
Londoño, R. A.-J. (2006). INTRODUCCIÓN A LA ECONOMETRÍA. Obtenido de
https://economia.uniandes.edu.co/files/profesores/ramon_rosales_alvarez/docs/econ
ometria1/documentos%20de%20clase/Introduccion_.pdf
Portafolio. (2019). Colombia depende cada vez más de ‘commodities’. Obtenido de
https://www.portafolio.co/economia/colombia-depende-cada-vez-mas-de-
commodities-533031
Portafolio. (2020). Las cinco alertas que hace el precio del oro sobre la crisis actual.
Obtenido de https://www.portafolio.co/economia/las-cinco-alertas-que-hace-el-
precio-del-oro-sobre-la-crisis-actual-542669
UdelaR. (2013). Estimaci´on y selecci´on de variables en grandes dimensiones. Obtenido de
http://www.iesta.edu.uy/wp-
content/uploads/2014/05/CursoPosgrado_Aprendizaje_Automatico_SCastro_2013.p
df