parametros de la cola ortega
TRANSCRIPT
Parametros de Distribución
de SiniestrosMetodo de estimar la cola
VI Seminario Regional Actuarial Latinoamericano
Santiago, Chile
21 Junio, 2016
Alejandro Ortega, FCAS, CFA
2
El Problema
• Estimar la Distribuccion de Siniestros para el
ano 2016
• Lo podemos usar para medir Capital
• Determinar un plan de Reaseguro
• Cuenta Individuales
• Podria ser una cartera de Auto, Transportes,
Incendio, o toda la compania
3
Los Datos
• Fecha de hacer Analisis – 13 Nov 2015
• Prima 2010 – 2014
• Siniestros 2010-2014
• Datos actualiados al 30 Sep 2015
• Porque no 2015?
4
Resumen de Datos
AnoNumero
Siniestros Monto Pagado
2010 330 3,057,507
2011 312 3,177,057
2012 256 2,849,844
2013 272 3,571,991
2014 367 4,680,122
5
Resumen de Datos
Supuestos
• El tamano de la cartera no ha cambiado
• Si cambia, se necesita calcular Frecuencia de
Siniestros
• Inflacion es cero – 0%
• Si no es, se necesita ajustar los datos historicos
• Lo comun es usar la inflacion general del mercado
• Si existe suficiente data, se puede usar algo mas
preciso
8
Resumen de Datos
AnoNumero
SiniestrosMonto Pagado Promedio
2010 330 3,057,507 9,265
2011 312 3,177,057 10,183
2012 256 2,849,844 11,132
2013 272 3,571,991 13,132
2014 367 4,680,122 12,752
• Parece tendencia subiendo
• Suscriptor, Siniestros
9
Resumen de Datos
Numero de Siniestros (Trimestral)
Media 77 Mediana 77 Min 49 Max 114 Desv Std 15
• Parece que no hay tendencia
• Suponemos que expuestos no han cambiado en tiempo
0
20
40
60
80
100
120
140
2010Q1 2011Q1 2012Q1 2013Q1 2014Q1
Siniestros
Siniestros
10
Resumen de Datos
Numero de Siniestros (Trimestral)
Media 77 Mediana 77 Min 49 Max 114 Desv Std 15
• “Rolling Average” ayuda encontrar tendencias
• Disminuye el impacto de estacionalidad
0
20
40
60
80
100
120
2010Q1 2011Q1 2012Q1 2013Q1 2014Q1
Number of Claims
Claims Mean Rolling 8
11
Pasos
• Estimar Distribuccion Para Numero de
Siniestros
• En General se usa Frecuencia, y se aplica a la
prima pronosticada del proximo ano
• Estimar Distribuccion por el costo de cada
siniestro
• Primero la Pansa
• Despues la Cola
Parametros Frecuencia
13
Parametros Elegidos
37
0.68
Datos Actuales
Media 76.9
DesviacionStandard
15.4
Parametros Frecuencia
14
Parametros Elegidos
37
0.68
Datos Estimados
Media 77.3
DesviacionStandard
15.5
Datos Actuales
Media 76.9
DesviacionStandard
15.4
0
20
40
60
80
100
120
140
2010Q1 2011Q1 2012Q1 2013Q1 2014Q1
Siniestros Neg Bin.
15
Distribuciones Frecuencia Simulacion 1
16
0
20
40
60
80
100
120
140
2010Q1 2011Q1 2012Q1 2013Q1 2014Q1
Siniestros Neg Bin.
Distribuciones Frecuencia Simulacion 2
17
0
20
40
60
80
100
120
140
2010Q1 2011Q1 2012Q1 2013Q1 2014Q1
Siniestros Neg Bin.
Distribuciones Frecuencia Simulacion 3
18
0
20
40
60
80
100
120
140
2010Q1 2011Q1 2012Q1 2013Q1 2014Q1
Siniestros Neg Bin.
Distribuciones Frecuencia Simulacion 4
19
Pasos
• Estimar Distribuccion Para Numero de
Siniestros
• En General se usa Frecuencia, y se aplica a la prima
pronosticada del proximo ano
• Estimar Distribuccion por el costo de cada
siniestro
• Primero la Pansa
• Despues la Cola
21
Severidad – Parametros Pansa
• Estimacion de Parametros
• Estimacion de Maxima Verosimilitud
• Preparar grafico de la distribucion de
los datos actual contra la estimacion
• Mirar la curva es como confirma que
el modelo es preciso
22
Pasos
• Estimar Distribuccion Para Numero de
Siniestros
• En General se usa Frecuencia, y se aplica a la prima
pronosticada del proximo ano
• Estimar Distribuccion por el costo de cada
siniestro
• Primero la Pansa
• Despues la Cola
Excess Mean
La media de siniestros arriba de un monto
𝐸 𝑋 𝑋 > 𝑢 − 𝑢
• Por cualquier 𝑢
Cuando sube tienes cola larga
23
Cola Larga
Embrechts:
Cada Distribucion con cola larga
En el Limite se parece a Pareto
29
El tamano de la cola se controla con el
parametro 𝜉 (Xi)
0.5 < 𝜉 Varianza no existe
1 < 𝜉 Media no existe
Cola Larga
Embrechts:
Cada Distribucion con cola larga
En el Limite se parece a Pareto
30
1 < 𝜉 < 2 Seguros
2 < 𝜉 < 5 Financia
Datos - Severidad
32
Siniestro Trimestre MontoMonto con
Inflacion1 2010Q1 14,101 14,101 2 2010Q1 1,824 1,824 3 2010Q1 688 688 … … ... …
1534 2014Q4 25 25 1535 2014Q4 32,574 32,574 1536 2014Q4 15,380 15,380 1537 2014Q4 1,016 1,016
Datos - Severidad
Siniestros mas grande
33
Siniestro Trimestre Monto
1305 2014Q2 126,434
415 2011Q1 135,387
1392 2014Q3 149,925
1055 2013Q3 153,900
1423 2014Q3 166,335
225 2010Q3 181,881
1381 2014Q3 254,864
1310 2014Q2 510,060
Survival Function – Log Log Scale
35
0.05%0.10%0.20%0.39%0.78%1.56%3.13%6.25%
12.50%25.00%50.00%
100.00%
1 8 128 2,048 32,768 524,288
S(x) empirico - logarithmo 𝑆 𝑥 = 1 − 𝐹(𝑥)
Survival Function – Log Log Scale
36
𝑆 𝑥 = 1 − 𝐹(𝑥)
La Distribucion Pareto es un linea recta en un graphico log log
0.05%
0.10%
0.20%
0.39%
0.78%
1.56%
3.13%
6.25%
12.50% 10,000 40,000 160,000
S(x) emprico - logarithmo
Survival Function – Log Log Scale
37
𝑆 𝑥 = 1 − 𝐹(𝑥)
La Distribucion Pareto es un linea recta en un graphico log log
0.05%
0.10%
0.20%
0.39%
0.78%
1.56%
3.13%
6.25%
40,000 320,000
S(x) emprico - logarithmo
Survival Function – Log Log Scale
38
𝑆 𝑥 = 1 − 𝐹(𝑥)
La Distribucion Pareto es un linea recta en un graphico log log
0.05%
0.10%
0.20%
0.39%
0.78%
1.56%
3.13%
6.25%
40,000 320,000
S(x) emprico - logarithmo
Survival Function – Log Log Scale
39
No se elige con meta que el ultimo punto esta en la linea
0.05%
0.10%
0.20%
0.39%
0.78%
1.56%
3.13%
6.25%
40,000 320,000
S(x) emprico - logarithmo
Survival Function – Log Log Scale
40
No se elige con meta que el ultimo punto esta en la linea
0.05%
0.10%
0.20%
0.39%
0.78%
1.56%
3.13%
6.25%
40,000 320,000
S(x) emprico - logarithmo
Elegir Parametros - Severidad
𝑢 = 50,000
𝐹 𝑢 = 95.26%
𝑆 𝑢 = 4.74%
Se puede tratar diferentes 𝑢’s para ver si
da resultado similar (o diferente)
41
Elige 𝑢, determina 𝐹(𝑢)
42
Siniestro Trimestre Monto𝐹(𝑥)
empirico
1348 2014Q3 49,302 95.12%
592 2011Q4 49,479 95.19%
105 2010Q2 49,885 95.25%
50,000 95.26%
686 2012Q1 50,862 95.32%
682 2012Q1 51,085 95.38%
639 2011Q4 51,160 95.45%
𝐹 𝑥 =𝑟𝑎𝑛𝑘𝑖𝑛𝑔
𝒏 + 𝟏 𝑛 =Numero de Siniestros
Primer Prueba de Parametros
Elige 𝜉 primero, despues 𝛽
El 𝜉 elegido es muy alto43
𝑢 = 50,000
𝑆 𝑢 = 4.74%
0.01%
0.02%
0.05%
0.10%
0.20%
0.39%
0.78%
1.56%
3.13%
6.25% 40,000 320,000
S(x) emprico - logarithmo
S(x) empirico
S(x) Pareto
0.01%0.02%0.04%0.08%0.16%0.31%0.63%1.25%2.50%5.00%
40,000 320,000
1.00
= 1,500
Empirical Log Log Scale
Prueba de Parametros del Pareto
Mejor. Parece que el pendiente no
baja suficiente44
𝑢 = 50,000
𝑆 𝑢 = 4.74%
0.01%
0.02%
0.05%
0.10%
0.20%
0.39%
0.78%
1.56%
3.13%
6.25% 40,000 320,000
S(x) emprico - logarithmo
S(x) empirico
S(x) Pareto
0.01%0.02%0.04%0.08%0.16%0.31%0.63%1.25%2.50%5.00%
40,000 320,000
0.50
= 6,000
Empirical Log Log Scale
Prueba de Parametros del Pareto
Ahora parece que baja muy rapido
𝜉 ∈ [0.2,0.5]45
𝑢 = 50,000
𝑆 𝑢 = 4.74%
0.01%
0.02%
0.05%
0.10%
0.20%
0.39%
0.78%
1.56%
3.13%
6.25% 40,000 320,000
S(x) emprico - logarithmo
S(x) empirico
S(x) Pareto
0.01%0.02%0.04%0.08%0.16%0.31%0.63%1.25%2.50%5.00%
40,000 320,000
0.20
= 15,000
Empirical Log Log Scale
Prueba de Parametros del Pareto
Mucho Mejor
Buscamos un poco abajo y arriba46
𝑢 = 50,000
𝑆 𝑢 = 4.74%
0.01%
0.02%
0.05%
0.10%
0.20%
0.39%
0.78%
1.56%
3.13%
6.25% 40,000 320,000
S(x) emprico - logarithmo
S(x) empirico
S(x) Pareto
0.01%0.02%0.04%0.08%0.16%0.31%0.63%1.25%2.50%5.00%
40,000 320,000
0.35
= 9,000
Empirical Log Log Scale
Prueba de Parametros del Pareto
Tambien es buena
47
𝑢 = 50,000
𝑆 𝑢 = 4.74%
0.01%
0.02%
0.05%
0.10%
0.20%
0.39%
0.78%
1.56%
3.13%
6.25% 40,000 320,000
S(x) emprico - logarithmo
S(x) empirico
S(x) Pareto
0.01%0.02%0.04%0.08%0.16%0.31%0.63%1.25%2.50%5.00%
40,000 320,000
0.30
= 10,500
Empirical Log Log Scale
Prueba de Parametros del Pareto
Esta bien entre 40k y 120k; pero no
en los ultimos 7 puntos48
𝑢 = 50,000
𝑆 𝑢 = 4.74%
0.01%
0.02%
0.05%
0.10%
0.20%
0.39%
0.78%
1.56%
3.13%
6.25% 40,000 320,000
S(x) emprico - logarithmo
S(x) empirico
S(x) Pareto
0.01%0.02%0.04%0.08%0.16%0.31%0.63%1.25%2.50%5.00%
40,000 320,000
0.40
= 8,200
Empirical Log Log Scale
Prueba de Parametros del Pareto
Mucho Mejor
Buscamos un poco abajo y arriba49
𝑢 = 50,000
𝑆 𝑢 = 4.74%
0.01%0.02%0.05%0.10%0.20%0.39%0.78%1.56%3.13%6.25%
40,000 320,000
S(x) emprico - logarithmo
0.35
= 9,000
0.01%
0.02%
0.05%
0.10%
0.20%
0.39%
0.78%
1.56%
3.13%
6.25% 40,000 320,000
S(x) emprico - logarithmo
S(x) empirico
S(x) Pareto
Siniestro Mas Grande -
Esperado
𝝃 𝜷 Mas Grande Siniestro99.93%ile
0.30 10,500 277,000
0.35 9,000 304,000
0.40 8,200 358,000
50
Resumen Severidad
Tenemos Distribucion para la pansa
• Hasta el 95.26%
La Cola se usa el Pareto con estos parametros:
• 𝑢 = 50,000
• 𝐹 𝑢 = 95.26%
• 𝜉 = 0.35
• 𝛽 = 9,000
51
52
Pasos
• Estimar Distribuccion Para Numero de
Siniestros
• En General se usa Frecuencia, y se aplica a la
prima pronosticada del proximo ano
• Estimar Distribuccion por el costo de cada
siniestro
• Primero la Pansa
• Despues la Cola
Supuestos
La Cartera es similar
• Hogar, Apartamentos
Hay buena forma de estimar expuestos
• Autos, Casas, Ventas
Ajustes de Inflacion se hacen
• El del mercado general, o mas detallado
Riesgo de Modelo
• Expuestos, inflacion
53