modélisation de valeurs extrêmes université de liège : octobre 2002 daniel justens...
Post on 04-Apr-2015
111 Views
Preview:
TRANSCRIPT
Modélisation de valeurs extrêmes
Université de Liège : octobre 2002Daniel Justens
HEFF/Cooremans Bruxelles
Positionnement
• Utilisation des modèles mathématiques en finance, en gestion et en actuariat.
• Ecarts entre les prévisions théoriques et le réel observé : non-adéquation du modèle ?
• Cas particulier des valeurs extrêmes
Exemple 1 : rendements boursiers
• Présentation du cas de l’indice DAX entre 1996 et 2000 : 902 observations journalières.
• Moyenne observée : 0,00097151• Ecart-type observé : 0,01458286
• Modélisation des rendements par une distribution normale ?
Rendements journaliers DAX entre 1996 et 2000
Fonctions de répartition observée (1) et normale (2)
0
0,2
0,4
0,6
0,8
1
-0,1 -0,05 0 0,05 0,1
Série1
Série2
Aspect des queues de courbe
Valeurs extrêmes à gauche avec en série 1 les observations et en série 2 la distribution normale
0
0,05
0,1
0,15
0,2
0,25
-0,1 -0,08 -0,06 -0,04 -0,02 0
Série1
Série2
Intervalle interquartile
0
0,2
0,4
0,6
0,8
1
-0,01 -0,005 0 0,005 0,01 0,015
Série1
Série2
Valeurs centrales
Valeurs à droite
Rendements maxima
0,88
0,92
0,96
1
0 0,01 0,02 0,03 0,04 0,05 0,06 0,07
Série1
Série2
Distributions de Pareto-Lévy
Vilfredo Pareto (1848 - 1923)
• Sociologue, qui se consacre dès 1890 à une modélisation « pure » de l’économie qui selon lui doit s’étudier comme la physique.
Paul Lévy (1886 - 1971)
• Mathématicien, qui étudie les distributions stables vers 1930.
Retour aux sources
Distributions de Pareto de base :
pour x 1 et avec a > 0
On en tire :
axxF
11)(
1)(
ax
axf
Moments de la distribution
• On vérifie que :
lorsque n < a
et que :
lorsque n a
• On en tire (a>2) :
na
aXE n
][
][ nXE
)]2()1[(][
2
aa
aXVAR
Adaptation de la distribution
• But : obtenir une fonction de répartition tendant vers 1 en + comme 1- x -a et vers 0 en - comme |x| - b (a et b > 0).
• Idée : travailler avec les fonctions réciproques. En effet, il est facile de représenter la fonction g de R0
+ dans R :
g(x) = x -1/a - x 1/b
Représentation de y = x-1 -x1/2
2 4 6 8
-2
2
4
6
8
Inversion des axes
0
1
2
3
4
5
6
7
8
9
10
-5 0 5 10
Construction de la répartition
• On a défini une fonction g(x) de manière implicite :
x = g(x) -1/a - g(x) 1/b
• Cette fonction g(x) a en - le comportement de |x|b et en + le comportement de x -a.
• Etudions la fonction : )(1
1
xg
Suite...
• Cette dernière tend vers 0 en - comme |x|-b
et vers 1 en + comme 1- x -a
Conclusion :
Forme implicite de la fonction de répartition
)(1
)(1
)(1
1
xg
xg
xg
Cas particulier : a=b
• Dans ce cas, on arrive aisément à une forme explicite. En effet, l’équation devient :
x = g(x) -1/a - g(x) 1/a
Posons g(x) 1/a = Y. L ’équation devient
x =1/Y - Y ou encore : (x + Y)Y = 1
Y2 + x Y -1 = 0
Suite ...
Y2 + x Y -1 = 0dont la solution est évidente :
On en tire :
2
42
xxY
a
xxxF
24
1
1)(
2
Ajustements
• Recherche ouverte : étude théorique de ces distributions avec une paramétrisation
• Méthodes d’ajustements autres que moindre carrés de façon à privilégier les queues de courbe
Ajustements du DAX : a = 270
0
0,2
0,4
0,6
0,8
1
-0,1 -0,05 0 0,05 0,1
distruni
distrinor
distripar
Ajustements : à gauche avec a = 220
0
0,02
0,04
0,06
0,08
0,1
0,12
-0,1 -0,08 -0,06 -0,04 -0,02 0
distruni
distrinor
distripar
Ajustements : à droite avec a = 270
0,84
0,86
0,88
0,9
0,92
0,94
0,96
0,98
1
1,02
0 0,01 0,02 0,03 0,04 0,05 0,06 0,07
Série1
Série2
Série3normale
Pareto
Exemple 2 : tarification automobile
• “A priori” clustering and bonus-malus system
• The “number of claims” distributions
• The problem of the classical models
The mixed Poisson distributionsLet X be the number of claims occurring in a unit period.Let be the risk parameter (expecting number of claims) with probability distribution U().We assume that for a given risk parameter , the random variables pk() giving the number of claims follow a Poisson distribution.
Moments of mixed Poisson distributions
• Mean :
E[X] = E[
• Variance
VAR[X] = E + VAR
The model of Lemaire (1977)
• The underlying distribution follows a Gamma distribution :
• In this case, we have :
Mixed Poisson family
Underlying distribution transition Probabilities
Negative exponential Geometrical
Erlang P-Erlang
Inverse Gaussian P-inverse gaussian
Fitting the data (1)
• The Belgian case :
son,thegeometricandtheP-Erlangdistributions,andtoÂ2;0:95=5:991fortheothers.Numb.claimsBelgianobs.PoissonNeg.Bin.Geom.P-ErlangP-Inv.Gauss.00.9065570.9038600.9066260.9081990.9060970.90657310.0863760.0913630.0862130.0833740.0871830.08635620.0065810.0046180.0066530.0076540.0062910.00652930.0004020.0001560.0004740.0007030.0004040.00049640.0000840.0000390.0000320.0000650.0000240.000040Â2336.0510.1742.3718.057.30
Underlying distributions
Distributions tails
Fitting the data (2)
• The Italian case :P-Erlang distributions, and to  =9:49 for theothers.
Accid italian obs. Poisson Neg. Bin. Geom. P-Erlang P-Inv.Gauss.0 0.863100 0.844503 0.863140 0.855427 0.850233 0.8618351 0.111161 0.142727 0.111305 0.123672 0.132499 0.1142962 0.020405 0.012061 0.020366 0.017880 0.015486 0.0185513 0.004030 0.000679 0.004093 0.002585 0.001609 0.0038904 0.000929 0.000029 0.000859 0.000374 0.000157 0.0009595 0.000246 0.000001 0.000185 0.000054 0.000015 0.0002616 0.000129 0.000000 0.000031 0.000008 0.000001 0.000075Â2 728 343 339.08 5886.5 28 532 323.47
Rational underlying distributions
• Let us work with :
• We also have :
Quadratic case
• We put :
so that we get :
• Which gives :
Cubic case
• We now put :
• And compute :
The Belgian case
Accid belgian observ. Neg. bin. quadratic cubic0 0.906557 0.906626 0.913576 0.9057471 0.086376 0.086213 0.077322 0.0874412 0.006581 0.006653 0.007275 0.0062173 0.000402 0.000474 0.001167 0.0005054 0.000084 0.000032 0.000328 0.000065
Graphically
.
Quadratic
Negative binomial cubic
observations
Distributions tails
The Italian case
Accid ital. obs. Neg. bin. quadratic cubic0 0.863100 0.863140 0.856316 0.8434441 0.111161 0.111305 0.121074 0.1380532 0.020405 0.020366 0.017101 0.0160973 0.004030 0.004093 0.003413 0.0019574 0.000929 0.000859 0.001029 0.0003195 0.000246 0.000185 0.000424 0.0000786 0.000129 0.000031 0.000214 0.000052
Comparison of the models
Cubic
Quadratic
Negative binomial
Conclusions
• Difference between theoretical and practical point of view : problem of the infinite variance
• Many other distributions possible
• Mixed geometrical distributions
• Open research
top related