0% encontró este documento útil (0 votos)
52 vistas23 páginas

Distribuciones en Seguros No Vida

Este documento presenta las distribuciones de probabilidad más comúnmente usadas para modelar la frecuencia de siniestros en seguros no vida. Introduce la distribución de Poisson, describiendo sus propiedades y cómo se puede usar para calcular probabilidades de diferentes números de siniestros basados en una tasa lambda. También muestra ejemplos numéricos de cómo aplicar la distribución de Poisson para calcular estas probabilidades para períodos de 1 y 1.5 años.

Cargado por

betsy93.09
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
52 vistas23 páginas

Distribuciones en Seguros No Vida

Este documento presenta las distribuciones de probabilidad más comúnmente usadas para modelar la frecuencia de siniestros en seguros no vida. Introduce la distribución de Poisson, describiendo sus propiedades y cómo se puede usar para calcular probabilidades de diferentes números de siniestros basados en una tasa lambda. También muestra ejemplos numéricos de cómo aplicar la distribución de Poisson para calcular estas probabilidades para períodos de 1 y 1.5 años.

Cargado por

betsy93.09
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

EANV_01

Code

© RICARDO A. QUERALT
2023

DISTRIBUCIONES DE PROBABILIDAD PARA LOS SEGUROS NO


VIDA

ESTADÍSTICA ACTUARIAL I: SESIÓN 01


Prof. Dr. Ricardo A. Queralt
MÁSTER EN CIENCIAS ACTUARIALES Y FINANCIERA

ÍNDICE
1. Temario

2. Bibliografía

3. Introducción

4. Seguro no Vida en España

5. Distribuciones para la frecuencia de siniestros

PROGRAMA ASIGNATURA
II. Distribuciones de probabilidad para los seguros no vida

6. Modelización del número de siniestros

7. Modelización del coste de los siniestros

8. Distribución de pérdida agregada


BIBLIOGRAFÍA
FUNDAMENTAL
DISTRIBUTIONS FOR ACTUARIES (2015), David Bahnemann. CAS MONOGRAPH SERIES
NUMBER 2. Casualty Actuarial Society

BÁSICA
Estadística para actuarios (1996), Manuel López Cachero; Juan López de la Manzanara. Ed.
Fundación Mapfre.

Non-Life Insurance: Mathematics & Statistics (2020). Mario V. Wüthrich. Lecture Notes. ETH
Zurich.

Introducción a la estadística con aplicaciones a los seguros (2001). I.B. Hossack; J.H.Pollard; B.
Zehnwirth. Ed. Fundación Mapfre.

Estadística actuarial (2006), José María Sarabia Alegría; Emilio Gómez Déniz; Francisco J.
Vázquez Polo. Ed. Person.

INTRODUCCIÓN
En el contexto de la Estadística Actuarial entenderemos por siniestro a cada realización de un
experimento aleatorio, ésto es un fenómeno que provoca un riesgo.

El individuo afectado, pretenderá cubrirse de las consecuencias económicas de la ocurrencia del


siniestro.

El método que da esta cobertura, se conoce habitualmente como seguro.

El vendedor del seguro ha de estudiar bien este fenómeno aleatorio, en términos que poder
estimar el precio del contrato, en particular, la prima que supone este riesgo.

Así, en el estudio de estos fenómenos aleatorios, serán importantes dos variables aleatorias, a
saber: el número de siniestros y la cuantía por reclamación.

El comportamiento de la primera nos dará idea de la frecuencia con la que se producen dichos
siniestros.

La segunda, nos ayuda a valorar en términos económicos la ocurrencia de los mismos.

Esta primera sesión, lo vamos a dedicar a presentar las distribuciones más habituales a la hora
de modelizar el comportamiento de la v.a. número de siniestros.

Como veremos se trata de distribuciones discretas, que dependiendo de la situación se ajustan


mejor o peor al fenómeno estudiado.

También hay que decir, que ninguna de ellas es de nueva creación, todas son distribuciones de
probabilidad muy conocidas y estudiadas, pero que han tenido su aplicación y desarrollo
particular por parte de los actuarios, de forma relativamente reciente.

Los contratos de seguros no de vida tienen en común que especidca un periodo de cobertura
(normalmente el año).

Todos los eventos asegurados que ocurren dentro de este periodo djo de tiempo y que causan un
daños económico/dnanciero son indemnizados.

Estos pagos aleatorios causados por los eventos asegurados (siniestros/reclamaciones) son las
indemnizaciones (severidad).

La prima del seguro es pagada al principio del contrato (upfront).

Para determinar la prima del seguro, las compañías agregan riesgos similares:

Y1 , ⋯ , Yn, n∈ℕ

Estas Yi reclamaciones no son conocidas al inicio del periodo asegurado, y por lo tanto se deben
estudiar dentro de la teoría de la probabilidad.

Tenemos un espacio probabilístico (Ω, f , ℙ) y Y1 , ⋯ , Yn , que están no correlacionadas e


igualmente distribuidas en el espacio probabilístico con una media dnita μ = E[Yi ].

En este caso se puede aplicar la ley débil de los grandes números (LLN), que dice que para todo
ε> 0
∣1 n ∣
[∣ n i= 1 ]

lim ℙ ∣ Yi − μ∣∣ ≥ ε = 0
n→∞ ∑ ∣

Para las variables iid Y1 , Y2 , ⋯ con varianza dnita σ 2 , la LLN junto a la desigualdad de
Chebychev (ratio de convergencia) y el Teorema Central del Límite (distribución asintótica),
tenemos que:

∑ni= 1 Yi − nμ
⇒  (0, 1) cuando n→ ∞
√n
‾σ

En el límite se obtiene una distribución normal(gaussiana) estándar.

Esto indica que la reclamación total de la cartera llegar a ser predecible en el límite.

Los contratos de seguros incluyen diversos componentes de riesgo. Los dos más importantes son:
El puramente aleatorio

EL riesgo de modelo

Estas incertidumbres obligan a que haya un margen de riesgo además de la prima pura dednida
como μ = E[Yi ]

Los elementos que componen la prima comercial son:


+ prima pura μ = E[Yi ]
+ margen de riesgos para protegerse de los riesgos mencionados

+ margen de benedcio

- ganancias dnancieras de las inversiones

+ comisiones de ventas a los agentes

+ otros gastos administrativos

+ impuestos

La prima comercial es la que se cobra a los asegurados.

La estadística de seguros no de vida estudia los dos primeros conceptos.

SEGUROS NO VIDA EN ESPAÑA

DISTRIBUCIÓN DE POISSON
Decimos que la v.a. X sigue una distribución de Poisson de parámetro λ , X ∈P(λ) , cuando su
soporte o conjunto de valores es el conjunto de los enteros positivos, y su función de cuantía
viene dada por:

e−λ λk
P(X = k) = , k ∈ ℤ+
k!
k!
La distribución de Poisson, puede ser introducida también como caso particular de la distribución
binomial b(p, n) , donde el número de repeticiones independientes del experimento aleatorio n es
muy alto, y la probabilidad de ocurrencia del suceso estudiado p es constante y muy pequeña.

En este caso, el número de ocurrencias del suceso a lo largo de las n repeticiones sigue una
distribución de Poisson de parámetro λ = np .

Como propiedades que debemos recordar, tenemos las siguientes:

x
e−λ ∑k= 0 λk
1. F(x) = 0, x < 0 F(x) = en particular F(0) = P(x ≤ 0) = e−λ
k!
iu
2. Su función característica, es ψX(u ) = eλλ(e −1)
.

3. La media y la varianza son iguales a λ

E(X) = V(X) = λ

Ejemplo 3.2. (Bahnemann) El proceso de siniestros para una determinada póliza de


responsabilidad es Poisson ocurren a una tasa constante de 0,04 por año. Si el plazo de la
póliza es de un año, entonces las probabilidades de cero, uno y dos reclamaciones contra la
póliza son, respectivamente:

Hide

lambda <- 0.04 # lambda de la poisson


x <- 0:2 # 0, 1, 2 reclamaciones
dpois(x,lambda) # probabilidad

[1] 0.9607894392 0.0384315776 0.0007686316

Hide

ppois(x,lambda) # probabilidad acumulada

[1] 0.9607894 0.9992210 0.9999896

Hide

tabla <- data.frame(Siniestros=x,


Probabilidad=dpois(x,lambda),
Acumulada=ppois(x,lambda))
tabla

Siniestros Probabilidad Acumulada


<int> <dbl> <dbl>

0 0.9607894392 0.9607894
1 0.0384315776 0.9992210

2 0.0007686316 0.9999896

3 rows

Hide

NA

Por otro lado, para obtener probabilidades de siniestros que surjan durante un periodo de 18
meses:

Hide

lambda <- 0.04*(18/12) # lambda de la poisson


x <- 0:2 # 0, 1, 2 reclamaciones
dpois(x,lambda) # probabilidad

[1] 0.941764534 0.056505872 0.001695176

Hide

ppois(x,lambda) # probabilidad acumulada

[1] 0.9417645 0.9982704 0.9999656

Hide

tabla <- data.frame(Siniestros=x,


Probabilidad=dpois(x,lambda),
Acumulada=ppois(x,lambda))
tabla

Siniestros Probabilidad Acumulada


<int> <dbl> <dbl>

0 0.941764534 0.9417645

1 0.056505872 0.9982704

2 0.001695176 0.9999656

3 rows

Ejemplo 3.3. (Bahnemann) Durante un único período de póliza de un año, una determinada
cartera de 1.000 pólizas de seguro idénticas generó 150 reclamaciones. Estos datos se han
resumido en la tabla por el número de reclamaciones por póliza y año. Deseamos encontrar
una distribución de Poisson para la variable de recuento de reclamaciones N para una póliza
individual seleccionada de la cartera.

Reclamaciones Polizas
<int> <dbl>

0 868

1 118

2 11

3 2

4 1

5 0

6 rows

Hide

total_polizas <- sum(tabla$Polizas)


total_polizas

[1] 1000

Hide

total_reclamaciones <- sum(tabla$Polizas*tabla$Reclamaciones)


total_reclamaciones

[1] 150

Hide

media<- total_reclamaciones/total_polizas
media

[1] 0.15

Hide

varianza <- sum(((tabla$Reclamaciones-media)^2)*tabla$Polizas)/total_polizas


varianza

[1] 0.1735

Comparamos con la poisson teórica:


Hide

options(scipen=999)
prob_poisson <- dpois(tabla$Reclamaciones,media)
prob_poisson

[1] 0.8607079764251 0.1291061964638 0.0096829647348 0.0004841482367


[5] 0.0000181555589 0.0000005446668

Hide

frecuencia <-tabla$Polizas/ total_polizas


frecuencia

[1] 0.868 0.118 0.011 0.002 0.001 0.000

Hide

tabla_poisson <- data.frame(Reclamaciones=tabla$Reclamaciones,


Frecuencia=frecuencia,
Probabilidad=prob_poisson)
tabla_poisson

Reclamaciones Frecuencia Probabilidad


<int> <dbl> <dbl>

0 0.868 0.8607079764251

1 0.118 0.1291061964638

2 0.011 0.0096829647348

3 0.002 0.0004841482367

4 0.001 0.0000181555589

5 0.000 0.0000005446668

6 rows

La inspección visual de los valores tabulados muestra que las probabilidades de Poisson están
cercanas a los valores de la muestra. Sin embargo, se puede probar la bondad del ajuste de una
manera más formal, como con la prueba chi-cuadrado de Pearson.

El contraste de ajuste de la chi cuadrado (χ 2 ) es una técnica estadística utilizada para determinar si
existe una diferencia signidcativa entre las frecuencias observadas en los datos y las frecuencias
esperadas bajo una hipótesis nula especídca. Aquí está la fórmula general y cómo se utiliza:

Fórmula de la Chi Cuadrado (χ 2 ):

2
2 ( i − i
=

(O i − Ei )2
χ2 =
∑ Ei
Donde: - O i = Frecuencias observadas en la muestra. - Ei = Frecuencias esperadas bajo la hipótesis
nula. - La suma (∑ ) se realiza sobre todas las categorías o grupos. - Los grados de libertad serán:
df = clases − parametros − 1

Vamos a comprobrar para los valores 0,1,2+:

Hide

tabla_chi <- data.frame(Reclamaciones=0:2,


Observadas=c(868,118,14),
Esperadas=c(dpois(0:1,media),(1-ppois(1,media)))*total_poli
zas)
tabla_chi

Reclamaciones Observadas Esperadas


<int> <dbl> <dbl>

0 868 860.70798

1 118 129.10620

2 14 10.18583

3 rows

Hide

tabla_chi$Chi2 <- ((tabla_chi$Observadas-tabla_chi$Esperadas)^2)/tabla_chi$Esperada


s
tabla_chi

Reclamaciones Observadas Esperadas Chi2


<int> <dbl> <dbl> <dbl>

0 868 860.70798 0.06177892

1 118 129.10620 0.95539644

2 14 10.18583 1.42825071

3 rows

Hide

Chi2 <- sum(tabla_chi$Chi2)


Chi2
[1] 2.445426

Hide

#tablas
parametros=1
df=nrow(tabla_chi)-parametros-1
df

[1] 1

Hide

alpha=0.05
valor_tablas <- qchisq(1-alpha,df)
valor_tablas

[1] 3.841459

Hide

# HO: Poisson -> Chi2<Tablas -> No podemos rechazamos


# H1: No Poisson -> Chi2>Tablas -> Rechazamos

Chi2<valor_tablas

[1] TRUE

MIXTURA DE POISSON
A veces sucede que un proceso de siniestros de seguro no sigue estrictamente una distribución
de Poisson porque el parámetro λ que se supone debe ser constante de hecho está sujeto a
algún tipo de muctuación aleatoria.

La solución se obtiene mediante la mezcla de distribuciones, en la cual el parámetro λ en sí


mismo es modelado como una variable aleatoria. La variable resultante N teniendo tal
distribución mezclada se llama un modelo de incertidumbre de parámetro.

Para modelar la incertidumbre del parámetro en el caso de Poisson, comience asumiendo que la
población de pólizas tiene un número dnito de estados de parámetro λi , donde 1 ≤ i ≤ m .

En cada estado Si , el proceso de reclamo es Poisson con tasa de reclamo αi y probabilidad de


estar en el estado Si es pi , donde p1 + p2 + . . . + pm = 1 .

Sea λ una variable aleatoria discreta con el conjunto de valores αi y la distribución de


probabilidad discreta asociada, para la cual E[λ] = ∑ αi pi . En este contexto, la variable λ se
llama el parámetro de mezcla.

∞ m m ∞ m
E[N] = n P[N = n|λ = i] ⋅ i = i n = i ⋅ i = E[λ].
∞ m m ∞
e−αi αni m
E[N] = n P[N = n|λ = αi ] ⋅ pi = p n = α ⋅ p = E[λ].
∑ ∑ ∑ i∑ n ! ∑ i i
n= 0 i= 1 i= 1 n= 0 i= 1

Como resultado, se puede expresar la varianza de N en términos de la media y la varianza de λ :

m
Var[N] = E[λ] + α2i pi − (E[λ])2 = E[λ] + Var[λ]

i= 1

Es evidente que cuando N tiene una distribución de Poisson mixta, Var[N] = E[N] si, y solo si,
Var[λ] = 0 (en cuyo caso la variable λ es constante). Por lo tanto, una mezcla de distintas
distribuciones de Poisson — para las cuales Var[λ] > 0 — no puede ser en sí misma una distribución de
Poisson.

Ejemplo 3.4 (Bahnemann). Una cartera de 100 pólizas de seguro para las cuales los
recuentos de siniestros siguen una distribución de Poisson produce un promedio general de
0.51 siniestros por póliza al año. Sin embargo, esta cartera consta de cuatro subgrupos de
pólizas, representando cuatro estados de parámetros, con recuentos esperados de siniestros
que varían de 0.10 a 1.40, como se muestra en la tabla. También se ajusta la densidad de las
pólizas en cada subgrupo. En consecuencia, la distribución de N para una póliza seleccionada
al azar de esta cartera tiene una distribución de Poisson mixta con probabilidades ¿?.

Estado Densidad α # Pólizas

S1 0.10 20

S2 0.35 40

S3 0.70 30

S4 1.40 10

Total 0.51 100

Hide

mixtura <- data.frame(Densidad=c(0.1,0.35,0.7,1.4),


Polizas=c(20,40,30,10))
mixtura

Densidad Polizas
<dbl> <dbl>

0.10 20

0.35 40

0.70 30
1.40 10

4 rows

Hide

media <- sum(mixtura$Densidad*mixtura$Polizas)/sum(mixtura$Polizas)


media

[1] 0.51

Hide

varianza <-media+sum(((mixtura$Densidad-media)^2)*mixtura$Polizas)/sum(mixtura$Poli
zas)
varianza

[1] 0.6439

Comprobemos la diferencia de la poisson y su mixtura:

Hide

siniestros <- 0:7


prob_mixtura <- dpois(siniestros,0.1)*20/100+
dpois(siniestros,0.35)*40/100+
dpois(siniestros,0.7)*30/100+
dpois(siniestros,1.4)*10/100
prob_mixtura

[1] 0.63647800703 0.25555956967 0.07883521791 0.02183853381


[5] 0.00561457150 0.00132621970 0.00028294617 0.00005404696

Hide

prob_poisson <- dpois(siniestros,media)


prob_poisson

[1] 0.600495578812 0.306252745194 0.078094450025 0.013276056504


[5] 0.001692697204 0.000172655115 0.000014675685 0.000001069228

Hide

tabla_mixtura <- data.frame(Mixtura=prob_mixtura,Poisson=prob_poisson)


tabla_mixtura

Mixtura Poisson
<dbl> <dbl>
0.63647800703 0.600495578812

0.25555956967 0.306252745194

0.07883521791 0.078094450025

0.02183853381 0.013276056504

0.00561457150 0.001692697204

0.00132621970 0.000172655115

0.00028294617 0.000014675685

0.00005404696 0.000001069228

8 rows

Hide

NA

DISTRIBUCIÓN BINOMIAL NEGATIVA


A menudo ocurre que los datos de cantidad de siniestros ofrecen una distribución muestral con una
media y varianza marcadamente diferentes, y que se sabe muy poco sobre la distribución poblacional
real. Sin embargo, el actuario puede enfrentarse al problema de ajustar una distribución paramétrica a
dichos datos para modelar las probabilidades de cantidad de siniestros de una póliza seleccionada al
azar de la población subyacente.

En situaciones como esta, ha resultado útil suponer que la población tiene una distribución de Poisson
mixta y, en ausencia de cualquier otra información, asumir una distribución particular para el parámetro
variable λ . Las distribuciones Gamma son casi siempre utilizadas para este propósito debido a la forma
analítica útil de la distribución mixta resultante.

Comenzamos asumiendo que el parámetro de mezcla λ tiene una distribución gamma con parámetros
positivos α y β = ν/α y la función de densidad resultante

(α/ν)α α−1 −(α/ν)u


f λ (u ) = u e , 0< u < ∞
Γ(α)

Esta fórmula dedne la función de densidad de una distribución gamma, donde α es el parámetro de
forma, ν es el parámetro de escala, y Γ(α) es la función gamma evaluada en α .

La media, varianza y asimetría de N vienen dadas:

E[N] = ν

2
Var[N] = ν +
ν2
Var[N] = ν +
α

Por lo tanto α :

ν2
α=
Var[N] − ν

El resultado es que se obtiene una distribución binomial negativa.

Binomial negativa: Repeticiones sucesivas e independientes de un experimento aleatorio que da


lugar a dos posible resultados,en general, A : éxito y Ac : fracaso.

Así, en cada repetición, tendríamos dednida una variable binaria

Xn = 1 , si se produce un éxito, con p = P(Xn = 1) , y


Xn = 0 , si se produce un fracaso, con q = 1 − p = P(Xn = 0) .
De manera que en las sucesivas repeticiones independientes, tendríamos dednida una sucesión
de v.a. independientes Xnn∈N .

1. Número de éxitos conseguidos después de n repeticiones del experimento. Esta variable, Y ,


corresponde a la suma de las n primeras variables de la sucesión anterior, Y = X1 + ⋅ + Xn. Su
distribución nos es conocida; se trata de una binomial de parámetros n, p. Recordar que en casos
particulares, n grande y p muy pequeño, podemos pensar que la distribución de Y es de Poisson
de parámetro λ = np .

2. Si lo que queremos es estudiar la v.a. número de fracasos hasta obtener el primer éxito,
veríamos que se trata de una v.a. con distribución geométrica de parámetro p.

3. Si somos más ambiciosos, y lo que queremos es estudiar el número de fracasos antes de


obtener m éxitos, tendremos, en principio que esta situación generaliza la anterior, y por lo tanto
la distribución geométrica será el caso particular de ésta cuando m = 1 . Así, la variable objeto de
estudio en este caso, Ym , dednida como número de fracasos hasta obtener m éxitos sigue una
distribución conocida como binomial negativa de parámetros m y p .

Uno de los primeros usos de la distribución binomial negativa como una distribución de Poisson mixta
fue en la modelización del concepto de “propensión al accidente”. Se suponía que el número de
accidentes incurridos por los miembros individuales de un grupo poblacional seguía una distribución de
Poisson, pero con diferentes parámetros —los miembros más “propensos a los accidentes” tenían
mayores parámetros de Poisson y, por tanto, esperaban valores más elevados de siniestralidad. En el
ámbito de los seguros de daños materiales, los actuarios comenzaron a aplicar la distribución binomial
negativa para modelar la siniestralidad en las décadas de 1950 y 1960. Desde entonces, la distribución
ha gozado de un amplio rango de aplicabilidad.

Ejemplo 3.6. Los datos de cantidad de siniestros de una muestra de 5.000 pólizas de seguro
de responsabilidad de automóviles se muestran en la tabla. Aquí la media es 0.1238 y la
varianza es 0.130074 son desiguales. Esta desigualdad sugiere que las pólizas podrían haber
sido extraídas no de una población homogénea de pólizas distribuidas Poisson, sino de una
mezcla de pólizas con diferentes distribuciones de Poisson.

# Reclamaciones # Pólizas

0 4.429

1 528

2 39

3 3

4 1

≥5 0

Total 5.000

Para obtener la distribución de la cantidad de siniestros de una única póliza seleccionada al


azar de esta población, asumiremos una distribución binomial negativa d y buscaremos
estimaciones apropiadas de los parámetros ( ̂ ( ), ̂ ( )).

Hide

siniestros <- data.frame(Reclamaciones=0:5,


Polizas=c(4429,528,39,3,1,0))
siniestros

Reclamaciones Polizas
<int> <dbl>

0 4429

1 528

2 39

3 3

4 1

5 0

6 rows

Hide

total_siniestros <- sum(siniestros$Polizas)


total_siniestros
[1] 5000

Hide

mediaBN <- sum(siniestros$Reclamaciones*siniestros$Polizas)/total_siniestros


mediaBN

[1] 0.1238

Hide

varianzaBN <- sum(((siniestros$Reclamaciones-mediaBN)^2)*siniestros$Polizas)/total_


siniestros
varianzaBN

[1] 0.1300736

Hide

alphaBN <- (mediaBN^2)/(varianzaBN-mediaBN)


alphaBN

[1] 2.443021

Hide

siniestros$Frecuencia <- siniestros$Polizas/total_siniestros


siniestros$BN <- dnbinom(0:5,size=alphaBN,mu=mediaBN)
siniestros

Reclamaciones Polizas Frecuencia BN


<int> <dbl> <dbl> <dbl>

0 4429 0.8858 0.88624191852

1 528 0.1056 0.10442501604

2 39 0.0078 0.00867040291

3 3 0.0006 0.00061932903

4 1 0.0002 0.00004064681

5 0 0.0000 0.00000252622

6 rows

Hide

NA
¿Serán los datos una BN?

Hide

siniestros$Esperados <- (siniestros$BN*total_siniestros)


siniestros$Chi2 <- ((siniestros$Polizas-siniestros$Esperados)^2)/siniestros$Esperad
os
siniestros

Reclamaciones Polizas Frecuencia BN Esperados Chi2


<int> <dbl> <dbl> <dbl> <dbl> <dbl>

0 4429 0.8858 0.88624191852 4431.2095926 0.001101798

1 528 0.1056 0.10442501604 522.1250802 0.066104242

2 39 0.0078 0.00867040291 43.3520146 0.436889286

3 3 0.0006 0.00061932903 3.0966452 0.003016260

4 1 0.0002 0.00004064681 0.2032341 3.123669016

5 0 0.0000 0.00000252622 0.0126311 0.012631098

6 rows

Hide

Chi2 <- sum(siniestros$Chi2)


Chi2

[1] 3.643412

Hide

#tablas
parametros=2
df=nrow(siniestros)-parametros-1
df

[1] 3

Hide

alpha=0.05
valor_tablas <- qchisq(1-alpha,df)
valor_tablas

[1] 7.814728

Hide
# HO: Poisson -> Chi2<Tablas -> No podemos rechazamos
# H1: No Poisson -> Chi2>Tablas -> Rechazamos

Chi2<valor_tablas

[1] TRUE

Recuerde que una distribución binomial negativa puede interpretarse como una mezcla de
distribuciones de Poisson con un parámetro de mezcla distribuido gamma variable λ . En este caso, una
función de densidad gamma implícita para el parámetro de mezcla variable λ se puede obtener
introduciendo α y ν en la fórmula:

(α/ν)α α−1 −(α/ν)u


f λ (u ) = u e , 0< u < ∞
Γ(α)

f λ (u ) = (1141.264)u ⋅ u 44285⋅−1 ⋅ e−193722⋅u , 0 < u < ∞.

E[λ] = 0.1238 = ν y Var[λ] = 0.006274.

Hide

# densidad gamma implicita


x <- seq(0,.5,.001)
aprox <- data.frame(x=x,densidad=dgamma(x,shape=alphaBN,scale=mediaBN/alphaBN))

ggplot(aprox,aes(x=x,y=densidad))+geom_line()+
ggtitle("Función de Densidad Gamma Implicita de Lambda")
CONTAGIO DE RECLAMACIONES
Una de las suposiciones del proceso de recuento de siniestros de Poisson, la de independencia de los
siniestros sucesivos, no siempre se cumple. Esto ocurre siempre que la ocurrencia de un siniestro
cambia la probabilidad de siniestros subsecuentes. Por ejemplo, una reclamación de responsabilidad
por producto exitosa contra un fabricante a menudo aumenta la probabilidad de que se presenten
reclamaciones similares en el futuro — un ejemplo clásico de contagio de reclamaciones. Un enfoque
estándar para modelar dicho proceso de contagio se basa en un modelo de urna propuesto por el
matemático húngaro George Pólya (1887–1985). Los modelos de Pólya desde entonces han sido
utilizados para modelar una variedad de procesos de contaminación, incluyendo la propagación de
enfermedades contagiosas.

En el modelo de Pólya, una urna inicialmente contiene bolas blancas w y bolas negras b ). Un ensayo
consiste en sacar una bola al azar, notar su color y luego reemplazarla junto con c bolas adicionales del
mismo color. Por lo tanto, obtener una bola blanca en el primer ensayo aumenta la probabilidad de
seleccionar una bola blanca en el siguiente ensayo.

La probabilidad Pr[W m = n] se conoce como una distribución de Pólya con probabilidades


P(w, b, c; m) , y se dedne como:

∏i=n−10 (w + ic) Cmn


Pr[W m = n] = P(w, b, c; m) = ⋅ , n= 0, 1, … , m.
∏i=n−10 (b + ic) ∏i=m−1
0 (w + b + ic)
Una distribución con probabilidades P(w, b, c; m) se conoce como una distribución de Pólya. La relación
γ = c/w se llama habitualmente el grado de contagio. Cuando no hay contagio —es decir, cuando
c = γ = 0 — la distribución de Pólya es idéntica a la distribución binomial más simple para la cual la
probabilidad de sacar una bola blanca permanece constante a lo largo de los ensayos sucesivos.

Ejemplo 3.7. Se realizan ensayos de Pólya con una urna que inicialmente contiene w = 10
bolas blancas y b = 5 bolas negras. Correspondiente a c = 2 , el grado de contagio es
γ = 2/10 . La probabilidad inicial es por tanto p = E[W 1 ] = 10/15 . Las probabilidades varias
para sacar bolas blancas en los tres primeros ensayos se dan por

10
Pr[blanca en 1er ensayo] = = 0.6667,
15

12
Pr[blanca en 2º ensayo | blanca en 1er ensayo] = = 0.7059,
17

10
Pr[blanca en 2º ensayo | negra en 1er ensayo] = = 0.5882,
17

12 10 10 5
Pr[blanca en 2º ensayo] = ⋅ + ⋅ = 0.6667,
17 15 17 15

14
Pr[blanca en 3er ensayo | blancas en 1º y 2º ensayos] = = 0.7368,
19

10
Pr[blanca en 3er ensayo | negra en 1º y 2º ensayos] = = 0.5263.
19

RECLAMACIONES DE LA CARTERA
Hasta ahora nuestro enfoque ha sido modelar el proceso de reclamaciones para una única póliza. Sin
embargo, también es importante encontrar modelos de probabilidad que describan el comportamiento
agregado de conjuntos de pólizas similares. En una variedad de situaciones es posible inferir la
distribución del recuento de reclamaciones del portafolio a partir de las distribuciones de los
componentes individuales.

Por ejemplo, si el proceso de reclamaciones para cada póliza en un portafolio es de Poisson, ¿qué se
puede decir sobre la distribución de N , el número total de reclamaciones de portafolio que ocurren
durante un período de la póliza? La respuesta reside en la propiedad reproductiva de las variables
aleatorias de Poisson, es decir, la suma de variables aleatorias de Poisson mutuamente independientes
también sigue una distribución de Poisson. Este hecho se deriva de un argumento basado en la función
generadora de momentos.
Sea N = N1 + N2 + … + Nm la suma de m variables aleatorias de Poisson independientes. Si
E[Ni ] = λi , donde 1 ≤ i ≤ m , entonces por la propiedad de unicidad de la función generadora implica
m
que N debe ser Poisson-distribuida con media ∑ i= 1 λi .

En el caso especial de que cada póliza en un portafolio de m pólizas tenga la misma distribución de
Poisson con valor esperado λ , es evidente que la variable de recuento de reclamaciones del portafolio N
tiene una distribución de Poisson con parámetro mλ.

Del mismo modo, se puede demostrar mediante la función generadora de momentos que la suma
N = N1 + N2 + … + Nm , de variables binomiales negativas idénticamente distribuidas, con
parámetros (ν, ω, tiene una distribución binomial negativa con parámetros (mν, mω) .

Por otro lado, la suma N no necesariamente tiene una distribución binomial negativa cuando las {Ni }
tienen diferentes parámetros α y β . Por lo tanto, la suma de variables aleatorias independientes de
Poisson distribuidas con una estructura de contagio, no siempre es en sí misma una distribución
binomial negativa. Sin embargo, a menudo es deseable poder ajustar tal estructura de contagio a un
modelo. Se puede hacer esto dedniendo el parámetro de contagio γ para una variable aleatoria
arbitraria de recuento de reclamaciones N de una manera que sea consistente con el caso binomial
negativo, es decir,

Var[N] − E[N]
γ= ,
(E[N])2

obtenido reorganizando la fórmula binomial negativa

Var[N] = E[N] + γ(E[N])2 .

La fórmula implica que el parámetro de contagio para una variable aleatoria de Poisson es γ = 0 , como
uno esperaría razonablemente.

Ejemplo 3.8. Considera un grupo de 100 pólizas idénticas, cada una con un proceso de
reclamaciones de Poisson y un recuento anual esperado de reclamaciones de 0.035 por póliza.
¿Cuál es la probabilidad de que estas pólizas en conjunto generen cinco o más reclamaciones
durante un solo año?

La variable de recuento de reclamaciones de portafolio N es la suma de variables aleatorias


de Poisson distribuidas idénticamente. Bajo la suposición razonable de que los procesos de
reclamaciones asociados con estas pólizas son independientes, la propiedad reproductiva del
proceso de Poisson implica que N también tiene una distribución de Poisson, con parámetro
λ = (100)(0.035) = 3.50 . Por lo tanto,

( 24 )
−3.50 (3.50)2 (3.50)3 (3.50)4
Pr[N ≥ 5] = 1 − e 1 + 3.50 + + + = 0.2746.
2 6
Hide

1-ppois(4,3.5)

[1] 0.274555

Ejemplo 3.9. Un portafolio contiene 20 pólizas independientes, distribuidas idénticamente


sujetas a contagio de reclamaciones. Cada póliza tiene un recuento esperado de
reclamaciones de v = 0.150 por año y un parámetro de contagio γ = 0.400 . Así, la
distribución del recuento de reclamaciones del portafolio N es binomial negativa, con

E[N] = (20)(0.150) = 3.000,

Var[N] = (20)(0.150) + (0.400)(20)(0.150)2 = 3.180.

La fórmula implica un parámetro de contagio de portafolio de

3.180 − 3.000
γ= = 0.020.
(3.000)2

EJERCICIOS PARA CASA


Bahnemann: 3.4; 3.9; 3.11; 3.15; 3.28; 3.30; 3.31; 3.34;

Ejercicio
Una compañía de seguros decide ofrecer una bonidcación a los buenos conductores de automóviles
que no han tenido siniestros:

un descuento del 10% después de tres años sin siniestros, y

un 20% de descuento después de seis años sin siniestros.

Si la prima base se dedne como la cantidad esperada de siniestros, ¿cómo debe ajustarse para que
este descuento de no siniestros pueda ser dnanciado?

Para simplidcar, consideramos un conductor de automóvil que ha estado asegurado al menos seis
años.
Responda la pregunta en la siguiente situación:

El número de siniestros de cada año por conductor son independientes, idénticamente


distribuidas como una Poisson con parámetro de frecuencia λ = 0.2

También podría gustarte