3.2.
Modelos paramétricos 45
σ =5
VaR@X,qD σ =3
10 σ =2
σ =1
-5
0.0 0.2 0.4 0.6 0.8 1.0
14
TVaR@X,qD
12
10 σ =5
σ =3
σ =2
8
σ =1
0.0 0.2 0.4 0.6 0.8 1.0
Figura 3.4: Valor en riesgo VaR (gráfico superior) y valor en riesgo en la cola TVaR
(gráfico inferior) de la distribución normal con µ = 5 según diversos valores de la
desviación tı́pica σ.
© FUNDACIÓN MAPFRE
Prohibida la reproducción total o parcial de esta obra sin el permiso escrito del autor o de FUNDACIÓN MAPFRE
46 Modelización del Riesgo en Familias Paramétricas
10
VaR@X,qD
8
6
σ =5
σ =2
4
σ =1
σ = 0.5
2
0
0.0 0.2 0.4 0.6 0.8 1.0
30
TVaR@X,qD
25
20
σ =2
15
σ = 1.5
10
σ =1
5 σ = 0.5
0
0.0 0.2 0.4 0.6 0.8 1.0
Figura 3.5: Valor en riesgo VaR (gráfico superior) y valor en riesgo en la cola TVaR
(gráfico inferior) de la distribución lognormal con µ = 0 según diversos valores del
parámetro σ.
© FUNDACIÓN MAPFRE
Prohibida la reproducción total o parcial de esta obra sin el permiso escrito del autor o de FUNDACIÓN MAPFRE
3.2. Modelos paramétricos 47
Demostración: Por medio de la definición de TVaR y usando (3.29) tenemos:
Z 1
σ
TVaR[X; q] = µ + {[− log(1 − q)]1/α }dq
1−q q
Z ∞
σ
= µ+ t1/α exp(−t)dt,
1 − q − log(1−q)
expresión que conduce a (3.30).
La figura 3.6 muestra el VaR y TVaR de una distribución de Weibull según diversos
valores del parámetro α.
3.2.6. Distribución inversa Gaussiana
La distribución inversa Gaussiana se ha convertido en una de las distribuciones
más utilizadas en estadı́stica actuarial y análisis de riesgos. Esta distribución posee
unas propiedades muy similares a las de la distribución normal. La definimos en
términos de la función de densidad como:
r ½ ¾
λ λ(x − µ)2
f (x; λ, µ) = exp − , x > 0, (3.31)
2πx3 2µ2 x
donde λ, µ > 0. El coeficiente de asimétrica es positivo y presenta una moda. La
función de distribución viene dada por:
Ãr µ ¶! Ã r µ ¶!
λ x 2λ/µ λ x
F (x; λ, µ) = Φ −1 +e Φ − +1 , x > 0.
x µ x µ
de donde:
VaR[X; q] = F −1 (q; λ, µ).
El TVaR se obtiene usando la fórmula 2.26.
3.2.7. Comparación de las colas
El análisis de las colas de una distribución constituye para el actuario uno
de los aspectos más importantes en la elección de una distribución de pérdidas.
Veamos una comparación entre las colas de varias distribuciones.
En el caso de la distribución de Pareto, cuando x → ∞, la función de distribu-
ción converge a cero más lentamente que una distribución exponencial (sección
3.2.2), y se dice que la distribución de Pareto presenta una cola más pesada que
la distribución exponencial. En la figura 3.7 aparece representada la cola de una
distribución de Pareto:
³ σ ´α
0
F (x) = 1 − , x > σ0 ,
x
© FUNDACIÓN MAPFRE
Prohibida la reproducción total o parcial de esta obra sin el permiso escrito del autor o de FUNDACIÓN MAPFRE
48 Modelización del Riesgo en Familias Paramétricas
3.0
VaR@X,qD α = 0.5
2.5
α=1
2.0
α=2
1.5
α=5
1.0
0.5
0.0
0.0 0.2 0.4 0.6 0.8 1.0
6 TVaR@X,qD α = 0.5
4 α=1
α=2
2
α=5
1
0.0 0.2 0.4 0.6 0.8 1.0
Figura 3.6: Valor en riesgo VaR (gráfico superior) y valor en riesgo en la cola TVaR
(gráfico inferior) de la distribución de Weibull con µ = 0 y σ = 1 según diversos
valores del parámetro de forma α.
© FUNDACIÓN MAPFRE
Prohibida la reproducción total o parcial de esta obra sin el permiso escrito del autor o de FUNDACIÓN MAPFRE
3.2. Modelos paramétricos 49
donde σ0 =0.4 y α =1.2. Para realizar la comparación consideramos distribuciones
de tipo exponencial y normal truncadas en σ0 , con funciones de distribución,
FX (x) − FX (σ0 )
FX|X>σ0 (x) = , x > σ0 > 0
1 − FX (σ0 )
y 0 si x < σ0 . A continuación elegimos los valores de los parámetros de modo que
las correspondientes funciones de densidad tengan el mismo punto de partida. Por
tanto, el parámetro θ de la exponencial verifica: θ1 = σα0 , mientras que la desviación
tı́pica σ de la distribución normal debe verificar:
φ(σ0 /σ) α
= ,
σ[1 − Φ(σ0 /σ)] σ0
que da lugar a σ = 0,46936. Las gráficas de las funciones de supervivencia de las
tres distribuciones (Pareto, exponencial y normal) aparecen representadas en la
figura 3.7. Notar, de que a pesar de que las tasas de decrecimiento de las tres dis-
tribuciones comienzan siendo iguales, la normal tiende a 0 más rápidamente que
las distribuciones de Pareto y exponencial. El significado práctico que proporciona
este gráfico es claro. Pérdidas grandes son mucho más probables en distribuciones
de tipo Pareto que en distribuciones normales. La distribución exponencial se en-
cuentra en medio de las distribuciones normal y de Pareto. Una tipologı́a reducida
de colas de distribuciones de pérdidas (de menos pesadas a más pesadas) aparece
en la tabla 3.2 (Embrechts et al., 1997). Más detalles acerca de las colas de dis-
tribuciones usadas en finanzas y seguros aparece en Heyde y Kou (2004) y Fung y
Seneta (2007).
Tabla 3.2: Tipologı́a de colas de distribuciones de pérdidas (de menos peso a más
peso). Entre paréntesis algunos ejemplos de distribuciones con ese tipo de cola.
Tipo de cola Comportamiento
de la distribución
2
Normales (Normal) Pr(X > x) ∼ e−x
Exponenciales (Exponencial y Gamma) Pr(X > x) ∼ e−x
2
Lognormales (Lognormal, Benktander-I) Pr(X > x) ∼ e− log x
γ
Weibull (Weibull-pesadas, Benktander-II) Pr(X > x) ∼ e−x , 0 < γ < 1
Potenciales (Pareto, LogGamma, estables∗ ) Pr(X > x) ∼ x−α
∗
Distribuciones estables con exponente α ∈ (0, 2). El signo ∼ significa en este
contexto equivalencia en el infinito.
© FUNDACIÓN MAPFRE
Prohibida la reproducción total o parcial de esta obra sin el permiso escrito del autor o de FUNDACIÓN MAPFRE
50 Modelización del Riesgo en Familias Paramétricas
1.0
SHxL=PrHX>xL
0.8
0.6
0.4
Pareto
0.2
Exponencial
Normal
0.0
0.5 1.0 1.5 2.0
Figura 3.7: Funciones de supervivencia de las distribuciones de Pareto, exponencial
y normal.
3.3. Caso de estudio: datos normalizados sobre
daños de huracanes
Como aplicación de las secciones precedentes, vamos a realizar un ejercicio de
tarificación usando diferentes primas basadas en diversos modelos paramétricos,
algunos de los cuáles se han descrito previamente. Los datos que utilizaremos son
datos reales sobre daños en huracanes.
En una importante contribución, Pielke y Landsea (1998) presentan datos nor-
malizados sobre daños de huracanes en Estados Unidos durante el perı́odo de 1925
a 1995. Los datos sobre daños, junto con el nombre del huracán, el año y la cat-
egorı́a aparecen en la tabla 3.3. El concepto de dato normalizado permite una
correcta comparación entre los datos de daños. Los datos están en dólares con-
stantes del año 1995 y han sido normalizados según el crecimiento de la propiedad
personal y los cambios en la población. Detalles sobre el proceso de normalización
pueden encontraste en el citado artı́culo de Pielke y Landsea (1998).
El histograma de los datos aparece en la figura 3.8. Dicho histograma es similar
a muchas de las distribuciones a las que se enfrentan los actuarios, presentando
los siguientes hechos estilizados:
© FUNDACIÓN MAPFRE
Prohibida la reproducción total o parcial de esta obra sin el permiso escrito del autor o de FUNDACIÓN MAPFRE
3.3. Caso de estudio: datos normalizados sobre daños de huracanes 51
Posee un valor modal,
Presenta una fuerte asimetrı́a positiva y una curtosis alta,
Unos pocos valores son mucho mayores que el resto (es decir, presentan una
cola larga).
3.3.1. Modelos Ajustados
Se han ajustado un total de ocho modelos paramétricos, habituales cuando
se trabaja con datos de pérdidas. Los modelos con: gamma, Pareto II, lognormal,
inversa Gaussiana, poli-exponencial, distribución de Gumbel de mı́nimos, distribu-
ción de Gumbel de máximos y distribución de Weibull. Las funciones de densidad
de estos modelos aparecen en la tabla 3.4.
Los modelos han sido ajustados maximizando la función de verosimilitud de
los datos observados:
Yn
log L(θ; x) = log f (xi ; θ),
i=1
donde x = (x1 , . . . , xn ) son los daños observados y θ = (θ1 , . . . , θp )T el vector de
parámetros. Como estimadores iniciales de los parámetros se han elegido los esti-
madores de momentos. Los errores estándar de los parámetros han sido obtenidos
mediante la inversa de la matriz de información observada. Si la matriz de infor-
mación observada es,
∂ 2 log L(θ; x)
I(θi , θj ) = − , i, j = 1, 2, . . . , p,
∂θi ∂θj
donde los valores de los parámetros se sustituyen por los estimadores de máxima
verosimilitud, entonces los errores estándar se obtienen como,
p
ste(θ̂i ) = I −1 (θi , θi ), i = 1, 2, . . . , p.
Puesto que la estimación de los modelos se ha realizado mediante máxima
verosimilitud, como criterios de selección de modelos se ha trabajado con criterios
basados en la verosimilitud. En concreto, el valor de la verosimilitud y el del
estadı́stico AIC de Akaike. Mediante el valor de la verosimilitud se elige aquel
modelo con mayor verosimilitud. Con objeto de corregir el estadı́stico anterior se
trabaja con el estadı́stico AIC, que penaliza según el número de parámetros del
modelo.
Las estimaciones correspondientes a los ocho modelos ajustados aparecen en
la tabla 3.5. Se han incluido los estimadores de máxima verosimilitud y las esti-
maciones de los errores estándar de los parámetros. La tabla 3.6 recoge el ranking
de los modelos según el criterio de máxima verosimilitud (Rango 1) y según el
© FUNDACIÓN MAPFRE
Prohibida la reproducción total o parcial de esta obra sin el permiso escrito del autor o de FUNDACIÓN MAPFRE
52 Modelización del Riesgo en Familias Paramétricas
estadı́stico AIC (Rango 2). Según los dos criterios los mejores modelos correspon-
den a (en este orden): distribución inversa Gaussiana, lognormal y gamma. Los
puestos intermedio varı́an ligeramente (distribuciones poli-exponencial, Weibull y
Pareto II), mientras que los últimos puestos corresponden a las distribuciones de
extremos de Gumbel (mı́nimos y máximos). Los gráficos de las tres funciones de
densidad correspondientes junto con el gráfico conjunto del histograma de los datos
y de los modelos ajustados aparecen el las figuras 3.9, 3.10 y 3.11. Los estimadores
de los parámetros de estos tres modelos son todos significativos, si realizamos el
correspondiente contrate de hipótesis. Para el cálculo de las primas usaremos estos
tres modelos.
3.3.2. Regresión inversa-Gaussiana
La idea de esta sección es construir un nuevo modelo con variables explicativas
o covariables en la distribución ajustada del daño. Como es claro, existen otras
variables que explican el daño y que pueden mejorar el modelo ajustado. En este
caso disponemos de dos variables explicativas, como son el año en que se produjeron
los años y la categorı́a del huracán. Se pueden considerar otras variables siempre
que los datos estén disponibles. En esta caso usaremos la distribución inversa
Gaussiana definida en la sección 3.2.6, puesto que es el modelo que mejor se ajusta
a los datos, según los criterios antes comentados.
Para especificar el modelo de regresión con la distribución inversa Gaussiana,
vamos a considerar un vector z de m covariables conocidas. Existen dos proced-
imientos de introducir las covariables:
A través de la media: µ(z) = exp(θ> z).
A través del parámetro de escala: λ(z) = exp(θ> z),
donde θ = (θ1 , . . . , θm )> es el vector de coeficientes de la regresión. Se han ensayado
las dos opciones, y se han obtenido mejores resultados con la regresión a través de
la media. Por tanto, tenemos el modelo,
X|z ∼ IG(exp(θ> z), λ), (3.32)
donde la función de verosimilitud viene dada por,
n
Y
log L(λ, θ; x|z) = log f (xi ; exp(θ> zi ), λ), (3.33)
i=1
donde f (x; µ, λ) es la función de densidad de la inversa Gaussiana definida en
(3.31) y z = (1, z1 , z2 )> son los regresores, donde z1 corresponde al año y z2 a
la categorı́a del huracán.
El modelo finalmente ajustado aparece en la tabla 3.7. De las dos covariables
consideradas, únicamente el año del huracán ha resultado significativa, por lo que
© FUNDACIÓN MAPFRE
Prohibida la reproducción total o parcial de esta obra sin el permiso escrito del autor o de FUNDACIÓN MAPFRE
3.3. Caso de estudio: datos normalizados sobre daños de huracanes 53
la otra covariable no ha sido incluida. Nuevamente los valores de los parámetros
son significativos. Mediante los dos criterios de selección de modelos, el modelo de
regresión inversa Gaussiana mejora a todos los modelos anteriormente considera-
dos. Esta modelo puede usarse por tanto con carácter predictivo.
3.3.3. Cálculo de primas VaR y TVaR
Como apartado final de esta sección se han obtenido las primas VaR y TVaR
para los tres modelos finalmente seleccionados: inversa Gaussian, lognormal y gam-
ma, para niveles de la probabilidad de q =0.9, 0.95, 0.99 y 0.999. Los resultados
obtenidos se encuentran en la tabla 3.8. Las primas obtenidas a partir de los mod-
elos inversa gaussiana y lognormal son similares, si bien en la parte superior de la
cola la distribución lognormal da lugar a primas de mayor magnitud. Las primas
obtenidas por medio de la distribución gamma son de menor magnitud.
0.0020
0.0015
0.0010
0.0005
0.0000
0 20 000 40 000 60 000 80 000
Figura 3.8: Histograma de los datos normalizados de daños debidos a huracanes.
© FUNDACIÓN MAPFRE
Prohibida la reproducción total o parcial de esta obra sin el permiso escrito del autor o de FUNDACIÓN MAPFRE
54 Modelización del Riesgo en Familias Paramétricas
Tabla 3.3: Datos normalizados de daños debidos a huracanes en USA entre 1925-95.
Fuente: Pielke y Landsea (1998).
Rango Huracán Año Categorı́a Daños en billones
de dólares US
1 SE FL-AL 1926 4 72.303
2 Andrew (SE FL-LA) 1992 4 33.094
3 N TX (Galvenston) 1900 4 26.619
4 N TX (Galvenston) 1915 4 22.602
5 SW FL 1944 3 16.864
6 New England 1938 3 16.629
7 SE FL-Lake Okeechobee 1928 4 13.795
8 Betsy (SE FL-LA) 1965 3 12.434
9 Donna (FL-E United States) 1960 4 12.048
10 Camille (MS-LA-VA) 1969 5 10.965
11 Agnes (NW FL, NE United States) 1972 1 10.705
12 Diane (NE United States) 1955 1 10.232
13 Hugo (SC) 1989 4 9.380
14 Carol (NE United States) 1954 3 9.066
15 SE FL-LA-AL 1947 4 8.308
16 Carla (NE United States) 1961 4 7.069
17 Hazel (SC-NC) 1954 4 7.039
18 NE United States 1944 3 6.536
19 SE FL 1945 3 6.313
20 Frederic (AL-MS) 1979 3 6.293
21 SE FL 1949 3 5.838
22 S Texas 1919 4 5.368
23 Alicia (N TX) 1983 3 4.056
24 Celia (S TX) 1970 3 3.338
25 Dora (NE FL) 1964 2 3.108
26 Opal (NW FL-AL) 1995 3 3.000
27 Cleo (SE FL) 1964 2 2.435
28 Juan (LA) 1985 1 2.399
29 Audrey (LA-N TX) 1957 4 2.396
30 King (SE FL) 1950 3 2.266
© FUNDACIÓN MAPFRE
Prohibida la reproducción total o parcial de esta obra sin el permiso escrito del autor o de FUNDACIÓN MAPFRE