Distribuciones en Seguros No Vida
Distribuciones en Seguros No Vida
Code
© RICARDO A. QUERALT
2023
ÍNDICE
1. Temario
2. Bibliografía
3. Introducción
PROGRAMA ASIGNATURA
II. Distribuciones de probabilidad para los seguros no vida
BÁSICA
Estadística para actuarios (1996), Manuel López Cachero; Juan López de la Manzanara. Ed.
Fundación Mapfre.
Non-Life Insurance: Mathematics & Statistics (2020). Mario V. Wüthrich. Lecture Notes. ETH
Zurich.
Introducción a la estadística con aplicaciones a los seguros (2001). I.B. Hossack; J.H.Pollard; B.
Zehnwirth. Ed. Fundación Mapfre.
Estadística actuarial (2006), José María Sarabia Alegría; Emilio Gómez Déniz; Francisco J.
Vázquez Polo. Ed. Person.
INTRODUCCIÓN
En el contexto de la Estadística Actuarial entenderemos por siniestro a cada realización de un
experimento aleatorio, ésto es un fenómeno que provoca un riesgo.
El vendedor del seguro ha de estudiar bien este fenómeno aleatorio, en términos que poder
estimar el precio del contrato, en particular, la prima que supone este riesgo.
Así, en el estudio de estos fenómenos aleatorios, serán importantes dos variables aleatorias, a
saber: el número de siniestros y la cuantía por reclamación.
El comportamiento de la primera nos dará idea de la frecuencia con la que se producen dichos
siniestros.
Esta primera sesión, lo vamos a dedicar a presentar las distribuciones más habituales a la hora
de modelizar el comportamiento de la v.a. número de siniestros.
También hay que decir, que ninguna de ellas es de nueva creación, todas son distribuciones de
probabilidad muy conocidas y estudiadas, pero que han tenido su aplicación y desarrollo
particular por parte de los actuarios, de forma relativamente reciente.
Los contratos de seguros no de vida tienen en común que especidca un periodo de cobertura
(normalmente el año).
Todos los eventos asegurados que ocurren dentro de este periodo djo de tiempo y que causan un
daños económico/dnanciero son indemnizados.
Estos pagos aleatorios causados por los eventos asegurados (siniestros/reclamaciones) son las
indemnizaciones (severidad).
Para determinar la prima del seguro, las compañías agregan riesgos similares:
Y1 , ⋯ , Yn, n∈ℕ
Estas Yi reclamaciones no son conocidas al inicio del periodo asegurado, y por lo tanto se deben
estudiar dentro de la teoría de la probabilidad.
En este caso se puede aplicar la ley débil de los grandes números (LLN), que dice que para todo
ε> 0
∣1 n ∣
[∣ n i= 1 ]
∣
lim ℙ ∣ Yi − μ∣∣ ≥ ε = 0
n→∞ ∑ ∣
Para las variables iid Y1 , Y2 , ⋯ con varianza dnita σ 2 , la LLN junto a la desigualdad de
Chebychev (ratio de convergencia) y el Teorema Central del Límite (distribución asintótica),
tenemos que:
∑ni= 1 Yi − nμ
⇒ (0, 1) cuando n→ ∞
√n
‾σ
Esto indica que la reclamación total de la cartera llegar a ser predecible en el límite.
Los contratos de seguros incluyen diversos componentes de riesgo. Los dos más importantes son:
El puramente aleatorio
EL riesgo de modelo
Estas incertidumbres obligan a que haya un margen de riesgo además de la prima pura dednida
como μ = E[Yi ]
+ margen de benedcio
+ impuestos
DISTRIBUCIÓN DE POISSON
Decimos que la v.a. X sigue una distribución de Poisson de parámetro λ , X ∈P(λ) , cuando su
soporte o conjunto de valores es el conjunto de los enteros positivos, y su función de cuantía
viene dada por:
e−λ λk
P(X = k) = , k ∈ ℤ+
k!
k!
La distribución de Poisson, puede ser introducida también como caso particular de la distribución
binomial b(p, n) , donde el número de repeticiones independientes del experimento aleatorio n es
muy alto, y la probabilidad de ocurrencia del suceso estudiado p es constante y muy pequeña.
En este caso, el número de ocurrencias del suceso a lo largo de las n repeticiones sigue una
distribución de Poisson de parámetro λ = np .
x
e−λ ∑k= 0 λk
1. F(x) = 0, x < 0 F(x) = en particular F(0) = P(x ≤ 0) = e−λ
k!
iu
2. Su función característica, es ψX(u ) = eλλ(e −1)
.
E(X) = V(X) = λ
Hide
Hide
Hide
0 0.9607894392 0.9607894
1 0.0384315776 0.9992210
2 0.0007686316 0.9999896
3 rows
Hide
NA
Por otro lado, para obtener probabilidades de siniestros que surjan durante un periodo de 18
meses:
Hide
Hide
Hide
0 0.941764534 0.9417645
1 0.056505872 0.9982704
2 0.001695176 0.9999656
3 rows
Ejemplo 3.3. (Bahnemann) Durante un único período de póliza de un año, una determinada
cartera de 1.000 pólizas de seguro idénticas generó 150 reclamaciones. Estos datos se han
resumido en la tabla por el número de reclamaciones por póliza y año. Deseamos encontrar
una distribución de Poisson para la variable de recuento de reclamaciones N para una póliza
individual seleccionada de la cartera.
Reclamaciones Polizas
<int> <dbl>
0 868
1 118
2 11
3 2
4 1
5 0
6 rows
Hide
[1] 1000
Hide
[1] 150
Hide
media<- total_reclamaciones/total_polizas
media
[1] 0.15
Hide
[1] 0.1735
options(scipen=999)
prob_poisson <- dpois(tabla$Reclamaciones,media)
prob_poisson
Hide
Hide
0 0.868 0.8607079764251
1 0.118 0.1291061964638
2 0.011 0.0096829647348
3 0.002 0.0004841482367
4 0.001 0.0000181555589
5 0.000 0.0000005446668
6 rows
La inspección visual de los valores tabulados muestra que las probabilidades de Poisson están
cercanas a los valores de la muestra. Sin embargo, se puede probar la bondad del ajuste de una
manera más formal, como con la prueba chi-cuadrado de Pearson.
El contraste de ajuste de la chi cuadrado (χ 2 ) es una técnica estadística utilizada para determinar si
existe una diferencia signidcativa entre las frecuencias observadas en los datos y las frecuencias
esperadas bajo una hipótesis nula especídca. Aquí está la fórmula general y cómo se utiliza:
2
2 ( i − i
=
∑
(O i − Ei )2
χ2 =
∑ Ei
Donde: - O i = Frecuencias observadas en la muestra. - Ei = Frecuencias esperadas bajo la hipótesis
nula. - La suma (∑ ) se realiza sobre todas las categorías o grupos. - Los grados de libertad serán:
df = clases − parametros − 1
Hide
0 868 860.70798
1 118 129.10620
2 14 10.18583
3 rows
Hide
2 14 10.18583 1.42825071
3 rows
Hide
Hide
#tablas
parametros=1
df=nrow(tabla_chi)-parametros-1
df
[1] 1
Hide
alpha=0.05
valor_tablas <- qchisq(1-alpha,df)
valor_tablas
[1] 3.841459
Hide
Chi2<valor_tablas
[1] TRUE
MIXTURA DE POISSON
A veces sucede que un proceso de siniestros de seguro no sigue estrictamente una distribución
de Poisson porque el parámetro λ que se supone debe ser constante de hecho está sujeto a
algún tipo de muctuación aleatoria.
Para modelar la incertidumbre del parámetro en el caso de Poisson, comience asumiendo que la
población de pólizas tiene un número dnito de estados de parámetro λi , donde 1 ≤ i ≤ m .
∞ m m ∞ m
E[N] = n P[N = n|λ = i] ⋅ i = i n = i ⋅ i = E[λ].
∞ m m ∞
e−αi αni m
E[N] = n P[N = n|λ = αi ] ⋅ pi = p n = α ⋅ p = E[λ].
∑ ∑ ∑ i∑ n ! ∑ i i
n= 0 i= 1 i= 1 n= 0 i= 1
m
Var[N] = E[λ] + α2i pi − (E[λ])2 = E[λ] + Var[λ]
∑
i= 1
Es evidente que cuando N tiene una distribución de Poisson mixta, Var[N] = E[N] si, y solo si,
Var[λ] = 0 (en cuyo caso la variable λ es constante). Por lo tanto, una mezcla de distintas
distribuciones de Poisson — para las cuales Var[λ] > 0 — no puede ser en sí misma una distribución de
Poisson.
Ejemplo 3.4 (Bahnemann). Una cartera de 100 pólizas de seguro para las cuales los
recuentos de siniestros siguen una distribución de Poisson produce un promedio general de
0.51 siniestros por póliza al año. Sin embargo, esta cartera consta de cuatro subgrupos de
pólizas, representando cuatro estados de parámetros, con recuentos esperados de siniestros
que varían de 0.10 a 1.40, como se muestra en la tabla. También se ajusta la densidad de las
pólizas en cada subgrupo. En consecuencia, la distribución de N para una póliza seleccionada
al azar de esta cartera tiene una distribución de Poisson mixta con probabilidades ¿?.
S1 0.10 20
S2 0.35 40
S3 0.70 30
S4 1.40 10
Hide
Densidad Polizas
<dbl> <dbl>
0.10 20
0.35 40
0.70 30
1.40 10
4 rows
Hide
[1] 0.51
Hide
varianza <-media+sum(((mixtura$Densidad-media)^2)*mixtura$Polizas)/sum(mixtura$Poli
zas)
varianza
[1] 0.6439
Hide
Hide
Hide
Mixtura Poisson
<dbl> <dbl>
0.63647800703 0.600495578812
0.25555956967 0.306252745194
0.07883521791 0.078094450025
0.02183853381 0.013276056504
0.00561457150 0.001692697204
0.00132621970 0.000172655115
0.00028294617 0.000014675685
0.00005404696 0.000001069228
8 rows
Hide
NA
En situaciones como esta, ha resultado útil suponer que la población tiene una distribución de Poisson
mixta y, en ausencia de cualquier otra información, asumir una distribución particular para el parámetro
variable λ . Las distribuciones Gamma son casi siempre utilizadas para este propósito debido a la forma
analítica útil de la distribución mixta resultante.
Comenzamos asumiendo que el parámetro de mezcla λ tiene una distribución gamma con parámetros
positivos α y β = ν/α y la función de densidad resultante
Esta fórmula dedne la función de densidad de una distribución gamma, donde α es el parámetro de
forma, ν es el parámetro de escala, y Γ(α) es la función gamma evaluada en α .
E[N] = ν
2
Var[N] = ν +
ν2
Var[N] = ν +
α
Por lo tanto α :
ν2
α=
Var[N] − ν
2. Si lo que queremos es estudiar la v.a. número de fracasos hasta obtener el primer éxito,
veríamos que se trata de una v.a. con distribución geométrica de parámetro p.
Uno de los primeros usos de la distribución binomial negativa como una distribución de Poisson mixta
fue en la modelización del concepto de “propensión al accidente”. Se suponía que el número de
accidentes incurridos por los miembros individuales de un grupo poblacional seguía una distribución de
Poisson, pero con diferentes parámetros —los miembros más “propensos a los accidentes” tenían
mayores parámetros de Poisson y, por tanto, esperaban valores más elevados de siniestralidad. En el
ámbito de los seguros de daños materiales, los actuarios comenzaron a aplicar la distribución binomial
negativa para modelar la siniestralidad en las décadas de 1950 y 1960. Desde entonces, la distribución
ha gozado de un amplio rango de aplicabilidad.
Ejemplo 3.6. Los datos de cantidad de siniestros de una muestra de 5.000 pólizas de seguro
de responsabilidad de automóviles se muestran en la tabla. Aquí la media es 0.1238 y la
varianza es 0.130074 son desiguales. Esta desigualdad sugiere que las pólizas podrían haber
sido extraídas no de una población homogénea de pólizas distribuidas Poisson, sino de una
mezcla de pólizas con diferentes distribuciones de Poisson.
# Reclamaciones # Pólizas
0 4.429
1 528
2 39
3 3
4 1
≥5 0
Total 5.000
Hide
Reclamaciones Polizas
<int> <dbl>
0 4429
1 528
2 39
3 3
4 1
5 0
6 rows
Hide
Hide
[1] 0.1238
Hide
[1] 0.1300736
Hide
[1] 2.443021
Hide
2 39 0.0078 0.00867040291
3 3 0.0006 0.00061932903
4 1 0.0002 0.00004064681
5 0 0.0000 0.00000252622
6 rows
Hide
NA
¿Serán los datos una BN?
Hide
6 rows
Hide
[1] 3.643412
Hide
#tablas
parametros=2
df=nrow(siniestros)-parametros-1
df
[1] 3
Hide
alpha=0.05
valor_tablas <- qchisq(1-alpha,df)
valor_tablas
[1] 7.814728
Hide
# HO: Poisson -> Chi2<Tablas -> No podemos rechazamos
# H1: No Poisson -> Chi2>Tablas -> Rechazamos
Chi2<valor_tablas
[1] TRUE
Recuerde que una distribución binomial negativa puede interpretarse como una mezcla de
distribuciones de Poisson con un parámetro de mezcla distribuido gamma variable λ . En este caso, una
función de densidad gamma implícita para el parámetro de mezcla variable λ se puede obtener
introduciendo α y ν en la fórmula:
Hide
ggplot(aprox,aes(x=x,y=densidad))+geom_line()+
ggtitle("Función de Densidad Gamma Implicita de Lambda")
CONTAGIO DE RECLAMACIONES
Una de las suposiciones del proceso de recuento de siniestros de Poisson, la de independencia de los
siniestros sucesivos, no siempre se cumple. Esto ocurre siempre que la ocurrencia de un siniestro
cambia la probabilidad de siniestros subsecuentes. Por ejemplo, una reclamación de responsabilidad
por producto exitosa contra un fabricante a menudo aumenta la probabilidad de que se presenten
reclamaciones similares en el futuro — un ejemplo clásico de contagio de reclamaciones. Un enfoque
estándar para modelar dicho proceso de contagio se basa en un modelo de urna propuesto por el
matemático húngaro George Pólya (1887–1985). Los modelos de Pólya desde entonces han sido
utilizados para modelar una variedad de procesos de contaminación, incluyendo la propagación de
enfermedades contagiosas.
En el modelo de Pólya, una urna inicialmente contiene bolas blancas w y bolas negras b ). Un ensayo
consiste en sacar una bola al azar, notar su color y luego reemplazarla junto con c bolas adicionales del
mismo color. Por lo tanto, obtener una bola blanca en el primer ensayo aumenta la probabilidad de
seleccionar una bola blanca en el siguiente ensayo.
Ejemplo 3.7. Se realizan ensayos de Pólya con una urna que inicialmente contiene w = 10
bolas blancas y b = 5 bolas negras. Correspondiente a c = 2 , el grado de contagio es
γ = 2/10 . La probabilidad inicial es por tanto p = E[W 1 ] = 10/15 . Las probabilidades varias
para sacar bolas blancas en los tres primeros ensayos se dan por
10
Pr[blanca en 1er ensayo] = = 0.6667,
15
12
Pr[blanca en 2º ensayo | blanca en 1er ensayo] = = 0.7059,
17
10
Pr[blanca en 2º ensayo | negra en 1er ensayo] = = 0.5882,
17
12 10 10 5
Pr[blanca en 2º ensayo] = ⋅ + ⋅ = 0.6667,
17 15 17 15
14
Pr[blanca en 3er ensayo | blancas en 1º y 2º ensayos] = = 0.7368,
19
10
Pr[blanca en 3er ensayo | negra en 1º y 2º ensayos] = = 0.5263.
19
RECLAMACIONES DE LA CARTERA
Hasta ahora nuestro enfoque ha sido modelar el proceso de reclamaciones para una única póliza. Sin
embargo, también es importante encontrar modelos de probabilidad que describan el comportamiento
agregado de conjuntos de pólizas similares. En una variedad de situaciones es posible inferir la
distribución del recuento de reclamaciones del portafolio a partir de las distribuciones de los
componentes individuales.
Por ejemplo, si el proceso de reclamaciones para cada póliza en un portafolio es de Poisson, ¿qué se
puede decir sobre la distribución de N , el número total de reclamaciones de portafolio que ocurren
durante un período de la póliza? La respuesta reside en la propiedad reproductiva de las variables
aleatorias de Poisson, es decir, la suma de variables aleatorias de Poisson mutuamente independientes
también sigue una distribución de Poisson. Este hecho se deriva de un argumento basado en la función
generadora de momentos.
Sea N = N1 + N2 + … + Nm la suma de m variables aleatorias de Poisson independientes. Si
E[Ni ] = λi , donde 1 ≤ i ≤ m , entonces por la propiedad de unicidad de la función generadora implica
m
que N debe ser Poisson-distribuida con media ∑ i= 1 λi .
En el caso especial de que cada póliza en un portafolio de m pólizas tenga la misma distribución de
Poisson con valor esperado λ , es evidente que la variable de recuento de reclamaciones del portafolio N
tiene una distribución de Poisson con parámetro mλ.
Del mismo modo, se puede demostrar mediante la función generadora de momentos que la suma
N = N1 + N2 + … + Nm , de variables binomiales negativas idénticamente distribuidas, con
parámetros (ν, ω, tiene una distribución binomial negativa con parámetros (mν, mω) .
Por otro lado, la suma N no necesariamente tiene una distribución binomial negativa cuando las {Ni }
tienen diferentes parámetros α y β . Por lo tanto, la suma de variables aleatorias independientes de
Poisson distribuidas con una estructura de contagio, no siempre es en sí misma una distribución
binomial negativa. Sin embargo, a menudo es deseable poder ajustar tal estructura de contagio a un
modelo. Se puede hacer esto dedniendo el parámetro de contagio γ para una variable aleatoria
arbitraria de recuento de reclamaciones N de una manera que sea consistente con el caso binomial
negativo, es decir,
Var[N] − E[N]
γ= ,
(E[N])2
La fórmula implica que el parámetro de contagio para una variable aleatoria de Poisson es γ = 0 , como
uno esperaría razonablemente.
Ejemplo 3.8. Considera un grupo de 100 pólizas idénticas, cada una con un proceso de
reclamaciones de Poisson y un recuento anual esperado de reclamaciones de 0.035 por póliza.
¿Cuál es la probabilidad de que estas pólizas en conjunto generen cinco o más reclamaciones
durante un solo año?
( 24 )
−3.50 (3.50)2 (3.50)3 (3.50)4
Pr[N ≥ 5] = 1 − e 1 + 3.50 + + + = 0.2746.
2 6
Hide
1-ppois(4,3.5)
[1] 0.274555
3.180 − 3.000
γ= = 0.020.
(3.000)2
Ejercicio
Una compañía de seguros decide ofrecer una bonidcación a los buenos conductores de automóviles
que no han tenido siniestros:
Si la prima base se dedne como la cantidad esperada de siniestros, ¿cómo debe ajustarse para que
este descuento de no siniestros pueda ser dnanciado?
Para simplidcar, consideramos un conductor de automóvil que ha estado asegurado al menos seis
años.
Responda la pregunta en la siguiente situación: