ESTUDIOS Y ANALISIS ESTADISTICO
Profesor: Dr. Jose Arnez Gutiérrez – P.P.hd.
Regresión, Autor regresión, Correlación y Autocorrelación:
Conceptos Fundamentales
Regresión
La regresión es una técnica estadística que modela la relación entre
variables:
Definición: Método para estimar cómo una variable dependiente
(Y) cambia cuando varían una o más variables independientes (X)
Fórmula básica: Y = β₀ + β₁X + ε (regresión lineal simple)
Objetivo: Encontrar los coeficientes (β) que mejor expliquen la
relación, minimizando los errores de predicción
Aplicación: Predecir ventas basadas en gastos de publicidad,
estimar precios de viviendas según características, etc.
Autorregresión
La autorregresión es un tipo especial de regresión aplicada a series
temporales:
Definición: Modelo donde una variable se predice en función de
sus propios valores pasados
Fórmula básica: Xₜ = c + φ₁Xₜ₋₁ + φ₂Xₜ₋₂ + ... + φₚXₜ₋ₚ + εₜ
Característica clave: La variable se "regresa sobre sí misma"
Ejemplo: En un modelo AR(1), el valor de hoy depende
linealmente del valor de ayer más un error aleatorio
Aplicación: Componente fundamental de los modelos ARIMA para
pronósticos
Correlación
La correlación cuantifica la asociación entre dos variables distintas:
Definición: Medida estadística que indica fuerza y dirección de la
relación lineal entre dos variables
Rango: Varía entre -1 (correlación negativa perfecta) y +1
(correlación positiva perfecta)
Interpretación:
o Cerca de 0: poca o ninguna relación lineal
o Cerca de ±1: fuerte relación lineal
Importante: Mide asociación, no causalidad
Aplicación: Determinar si el nivel educativo se relaciona con el
ingreso, si hay relación entre temperatura y ventas de helados,
etc.
Autocorrelación
ESTUDIOS Y ANALISIS ESTADISTICO
Profesor: Dr. Jose Arnez Gutiérrez – P.P.hd.
La autocorrelación mide la correlación de una serie temporal consigo
misma en diferentes momentos:
Definición: Correlación entre observaciones de la misma variable
en distintos puntos temporales
Fórmula conceptual: Correlación entre Xₜ y Xₜ₊ₖ (donde k es el
rezago temporal)
Función de Autocorrelación (ACF): Muestra la correlación para
diferentes rezagos
Función de Autocorrelación Parcial (PACF): Muestra la
correlación directa, controlando por rezagos intermedios
Aplicación: Identificar patrones estacionales, determinar el orden
de modelos ARIMA, verificar independencia de residuos
Relaciones entre estos conceptos:
La regresión busca ecuaciones predictivas entre diferentes
variables
La autorregresión aplica los principios de regresión a la misma
variable en diferentes momentos
La correlación mide la fuerza de asociación entre variables
diferentes
La autocorrelación mide la asociación de una variable consigo
misma a través del tiempo
Modelos ARIMA:
Los modelos ARIMA (AutoRegressive Integrated Moving Average) son
una clase de modelos estadísticos para analizar y pronosticar datos de
series temporales. El nombre ARIMA es un acrónimo que describe las
tres componentes principales de estos modelos:
AR: Componente AutoRegresivo
I: Componente Integrado (diferenciación)
MA: Componente de Media Móvil (Moving Average)
Estructura general ARIMA(p,d,q)
La notación ARIMA(p,d,q) indica:
p: Orden del componente autorregresivo (AR)
d: Grado de diferenciación necesario para hacer la serie
estacionaria
q: Orden del componente de media móvil (MA)
Para comprender cada variante de ARIMA, es útil expresar los modelos
matemáticamente:
ARIMA(1,1,1)
ESTUDIOS Y ANALISIS ESTADISTICO
Profesor: Dr. Jose Arnez Gutiérrez – P.P.hd.
Este modelo incluye un término autorregresivo, una diferenciación y un
término de media móvil.
Características
Adecuado para series con tendencia
Captura dependencias a corto plazo en los niveles y en los
cambios
Combina la influencia de observaciones pasadas y errores de
predicción pasados
Útil cuando la serie muestra correlación significativa en su
primera diferencia
Aplicaciones comunes
Series económicas como PIB, precios de acciones
Datos de ventas con tendencia y cierta estacionalidad
Temperaturas anuales promedio
ARIMA(1,0,1)
Este modelo, también conocido como ARMA(1,1), incorpora un término
autorregresivo y un término de media móvil sin diferenciación.
Características
Requiere que la serie sea estacionaria
Captura dependencias a corto plazo
Equilibra la influencia de observaciones y errores pasados
No aborda tendencias de largo plazo
Aplicaciones comunes
Rendimientos bursátiles
Datos meteorológicos de corto plazo
Errores de medición en procesos estacionarios
ARIMA(0,0,0)
El modelo más simple, que representa ruido blanco.
Características
Cada observación es independiente de las anteriores
No hay estructura de autocorrelación
La serie fluctúa aleatoriamente alrededor de una media constante
La varianza es constante
Aplicaciones comunes
Datos perfectamente aleatorios
Residuos de modelos bien ajustados
Base de comparación para modelos más complejos
ESTUDIOS Y ANALISIS ESTADISTICO
Profesor: Dr. Jose Arnez Gutiérrez – P.P.hd.
ARIMA(0,0,1)
Un modelo de media móvil puro de primer orden, MA(1).
Características
La observación actual depende del error actual y del error
inmediatamente anterior
No hay dependencia directa de los valores pasados de la serie
Captura efectos de corta duración o "shock"
Es siempre estacionario para cualquier valor de θ₁ entre -1 y 1
Aplicaciones comunes
Errores de pronóstico de corto plazo
Fluctuaciones aleatorias con pequeños efectos persistentes
Series con efecto "rebote" de un período
ARIMA(0,1,0)
Este modelo, conocido como "random walk" o paseo aleatorio, solo
incluye el componente de diferenciación.
Características
El mejor pronóstico para el valor futuro es el valor actual
La serie no es estacionaria
La varianza aumenta con el tiempo
No hay tendencia a regresar a un valor medio
Aplicaciones comunes
Precios de activos financieros
Tasas de cambio
Series que muestran persistencia perfecta
ARIMA(1,0,0) o AR(1)
Este es un modelo autorregresivo puro de primer orden, una variante
fundamental en el análisis de series temporales.
Propiedades importantes:
Requiere que la serie sea estacionaria desde el principio
Para ser estacionario, el parámetro φ₁ debe estar entre -1 y 1
La fuerza de la memoria depende del valor de φ₁:
Si φ₁ es cercano a 1: alta persistencia (los efectos duran
mucho tiempo)
Si φ₁ es cercano a 0: baja persistencia (la serie se aproxima
a ruido blanco)
Si φ₁ es negativo: la serie oscila alrededor de su media
Aplicaciones típicas:
ESTUDIOS Y ANALISIS ESTADISTICO
Profesor: Dr. Jose Arnez Gutiérrez – P.P.hd.
Tasas de interés e inflación (cuando son estacionarias)
Temperaturas diarias
Cualquier serie con inercia donde el pasado reciente influye
directamente en el presente
Este modelo es uno de los más utilizados por su simplicidad y su
capacidad para capturar la dependencia temporal básica en muchas
series estacionarias.
Selección del modelo ARIMA adecuado
La elección entre las diferentes variantes de ARIMA debe basarse en:
1. Análisis de estacionariedad: Determinar el valor adecuado de d
2. Funciones de autocorrelación (ACF): Ayudan a identificar el
orden q
3. Funciones de autocorrelación parcial (PACF): Ayudan a
identificar el orden p
4. Criterios de información: Como AIC (Akaike) y BIC (Bayesiano)
para comparar modelos
5. Análisis de residuos: Para verificar si el modelo captura
adecuadamente la estructura de la serie.
Comparación de variantes ARIMA
Modelo Estacionariedad Memoria Complejidad Casos de uso típicos
requerida
ARIMA(1,1,1) No Larga Media Series con tendencia y
shocks
ARIMA(1,0,1) Sí Corta Media Series estacionarias con
dependencia mixta
ARIMA(0,0,0) Sí Ninguna Mínima Datos puramente
aleatorios
ARIMA(1,0,0) SI Media Baja
ARIMA(0,0,1) Sí Muy corta Baja Efectos inmediatos de
shocks aleatorios
ARIMA(0,1,0) No Infinita Baja Series con persistencia
perfecta
EJEMPLO: BITOCIN 2020 A 2025
INFORME DE SPSS
Descripción del modelo
Tipo de modelo
ESTUDIOS Y ANALISIS ESTADISTICO
Profesor: Dr. Jose Arnez Gutiérrez – P.P.hd.
ID de modelo CRIPTOQ Modelo_1 ARIMA(0,1,0)
El resultado tiene un buen pronóstico al valor futuro sobre el valor
actual, además de no ser estacionaria y su varianza aumenta con el
tiempo, es decir no hay tendencia a regresar a valor medio lo que
demuestra que irá en aumento
Estadísticos del modelo
Estadísticos de ajuste
del modelo Ljung-Box Q(18)
R cuadrado Número de
Número de estacionari Estadístic valores
Modelo predictores a R cuadrado os DF Sig. atípicos
CRIPTOQ- 0 ,196 ,997 11,819 18 ,856 15
Modelo_1
El estadístico Q de Ljung-Box (LBQ) de 0.0856 prueba la hipótesis nula
de que las autocorrelaciones de hasta un desfase k son iguales a cero ,
es decir, los valores de los datos son aleatorios e independientes hasta
un cierto número de desfases.
El estadístico Q de Ljung-Box (LBQ) prueba la hipótesis nula de que las
autocorrelaciones de hasta un desfase k son iguales a cero. La prueba
ESTUDIOS Y ANALISIS ESTADISTICO
Profesor: Dr. Jose Arnez Gutiérrez – P.P.hd.
de Ljung-Box se utiliza para determinar si las autocorrelaciones de una
serie de tiempo son diferentes de cero.
La prueba de Ljung-Box se puede definir de la siguiente manera.
H0: Los datos se distribuyen de forma independiente (es decir, las
correlaciones en la población de la que se toma la muestra son 0, de
modo que cualquier correlación observada en los datos es el resultado
de la aleatoriedad del proceso de muestreo).
Ha: Los datos no se distribuyen de forma independiente.
CORRELACION DE DOS O MAS VARIABLES: TRES HERRAMIENTAS
SPSS: ANALIZAR|CORRELACION|BIVARIADA
Ejemplos de Variables Financieras Correlacionadas
En finanzas, numerosas variables presentan correlaciones significativas
que son fundamentales para la toma de decisiones de inversión y
gestión de riesgos. Aquí presento algunos ejemplos importantes:
1. Correlaciones en Mercados Bursátiles
Acciones del mismo sector:
ESTUDIOS Y ANALISIS ESTADISTICO
Profesor: Dr. Jose Arnez Gutiérrez – P.P.hd.
Ejemplo: Empresas petroleras como Exxon Mobil y Chevron
muestran correlaciones altas (0.75-0.90)
o
o Razón: Comparten exposición a los mismos factores (precio
del petróleo, regulaciones sectoriales)
Índices de diferentes países:
o Ejemplo: S&P 500 (EE.UU.) y DAX (Alemania) tienen
correlación moderada-alta (0.60-0.80)
o Aplicación: La diversificación internacional es menos
efectiva cuando la correlación global aumenta.
2. Correlaciones con Indicadores Macroeconómicos
Tipos de interés y precios de bonos:
o Correlación negativa casi perfecta (cercana a -1.0)
o Cuando suben los tipos de interés, bajan los precios de
bonos existentes
Inflación y rendimiento de activos:
o Correlación negativa con bonos (-0.30 a -0.50)
o Correlación variable con acciones, dependiendo del nivel
inflacionario
3. Correlaciones en Divisas y Materias Primas
Oro y dólar estadounidense:
o Correlación típicamente negativa (-0.40 a -0.60)
o Cuando el dólar se debilita, el oro suele fortalecerse
Divisas de países exportadores y materias primas:
o Ejemplo: Dólar australiano y precios del mineral de hierro
(0.60-0.75)
o Ejemplo: Dólar canadiense y precios del petróleo (0.50-
0.70)
4. Correlaciones para Gestión de Riesgos
Volatilidad y rendimientos de mercado:
o Ejemplo: Índice VIX ("índice del miedo") y S&P 500 tienen
correlación negativa (-0.70 a -0.80)
o Cuando caen bruscamente las acciones, la volatilidad suele
dispararse
Bonos gubernamentales y acciones:
o Correlación históricamente negativa en periodos de
incertidumbre (-0.20 a -0.40)
o Base fundamental para la construcción de carteras
balanceadas
5. Correlaciones en Crédito y Financiación
Diferenciales de crédito corporativo y crecimiento económico:
ESTUDIOS Y ANALISIS ESTADISTICO
Profesor: Dr. Jose Arnez Gutiérrez – P.P.hd.
Correlación negativa (-0.50 a -0.70)
Los spreads se amplían cuando empeoran las perspectivas
o
económicas
o
Tipos hipotecarios y actividad del sector inmobiliario:
o Correlación negativa significativa (-0.50 a -0.70)
o Impacta directamente en constructoras y empresas
relacionadas
Aplicación Práctica que están Correlaciones
Diversificación de carteras: Combinar activos con baja o negativa
correlación
Estrategias de cobertura: Proteger posiciones usando activos
correlacionados negativamente
Trading de pares: Explotar desviaciones temporales en activos
altamente correlacionados
Análisis de contagio financiero: Observar cómo aumentan las
correlaciones en periodos de crisis