1. caractérisations de la loi de la durée t - crest...econométrie des modèles de durée soit t...
TRANSCRIPT
-
Econométrie des modèles dedurée
Soit T une variable aléatoire continue positive, représentant la duréepassée dans un certain état (par exemple: chômage, vie en couple,durée de survie)
1. Caractérisations de la loi dela durée T
Fonction de répartition :
F�t� � Pr�T � t�, t � 0.
1
-
Propriétés :� F�t� � �0,1�, t � 0� F est continueàdroite, i.e. F�t�� � F�t�, t � 0� F est monotonenon-décroissante, i.e. t1 � t2 � F�t1� � F�t2�� F�0�� � 0 et limt�� F�t� � 1
Fonction de survie :
S�t� � Pr�T � t� � 1 � F�t�
Propriétés :� S�t� � �0,1�, t � 0� S est continueàgauche, i.e. S�t�� � S�t�, t � 0� S est monotonedécroissante, i.e. t1 � t2 � S�t1� � S�t2�� S�0�� � 1 et limt�� S�t� � 0
2
-
Fonction de densité :
f�t� � lim��0
Pr�t � T � t � ���
soit
F�t� � �0
tf�u� du
ou encore
S�t� � �t
�
f�u� du � 1 � �0
tf�u� du
Fonction de hasard :
h�t� � lim��0
Pr�t � T � t � � � T � t��
3
-
soit
h�t� � f�t�S�t�
� �d lnS�t�
dt
Propriétés :� h : R� � R�
� �0
th�u� du � �, t � 0, mais�
0
�
h�u� du � �
� h n’est pas nécessairement monotone
Fonction de hasard cumulée :
H�t� � �0
th�u� du
4
-
Relations entre ces différentes fonctions :
H�t� � � ln S�t� � �0
th�u� du
S�t� � exp � H�t� � exp- �0
th�u� du
f�t� � h�t� S�t� � h�t� exp��H�t�� � h�t� exp - �0
th�u� du
F�t� � 1 � S�t� � 1 � exp��H�t�� � 1 � exp - �0
th�u� du
5
-
2. Exemples de loisparamétriques usuelles
2.1 Loi exponentielleT suit une loi exponentielle de paramètre � � 0 si :� fonction dehasard :
h�t� � �, t � 0
� fonction dehasard cumulée :
H�t� � �t
� fonction desurvie :
S�t� � exp���t�
6
-
� fonction dedensité :
f�t� � � exp���t�
Remarques :� E�T� � ��1 et V�T� � ��2
� � lnS�t� � �t � la courbe �t,� ln�S�t�� est approximativement une
droite
2.2 Loi de WeibullT suit une loi de Weibull de paramètres � � 0 et � � 0 si :� fonction dehasard :
h�t� � �� t��1, t � 0
� fonction dehasard cumulée :
H�t� � � t�
7
-
� fonction desurvie :
S�t� � exp��� t��
� fonction dedensité :
f�t� � �� t��1 exp��� t��
Remarques :� exp��� � Weibull��,1�� dh�t�/dt � ���� � 1� t��2 � la fonction dehasard de la loi deWeibull
est monotonecroissanteou monotonedécroissanteselon que � � 1 ou� � 1
� ln�� lnS�t�� � ln� � � lnt � la courbe lnt, ln � ln�S�t� est
approximativement unedroite
8
-
2.3 Loi log-normaleT suit une loi log-normale de paramètres � et � � 0 si :� fonction dedensité :
f�t� � 1�t �
lnt � ��
� fonction desurvie :
S�t� � 1 � �lnt � �
�
� fonction dehasard :
h�t� � 1�t
�lnt � �
�
1 � �lnt � �
�
9
-
où � et � sont respectivement la fonction dedensitéet la fonction derépartition de la loi normaleN�0,1�
Remarques:� limt�0 h�t� � 0 et limt�� h�t� � 0� la fonction dehasard est non monotoneet unimodale (croissantepuis
décroissante)
2.4 Loi log-logistiqueT suit une loi log-logistique de paramètres � � 0 et � � 0 si:� fonction dedensité :
f�t� � �� ��t���1�1 � ��t�� ��2
� fonction desurvie :
S�t� � 11 � ��t��
10
-
� fonction dehasard :
h�t� ��� ��t���1
1 � ��t��
Remarques :� La fonction dehasard est monotonedécroissantesi � � 1 (avec
limt�0 h�t� � ��� Elleest monotonecroissantesi � � 1 (avec limt�0 h�t� � ��� Elleest non monotoneet unimodale (croissantepuis décroissante) si
� � 1 (avec limt�0 h�t� � 0 et limt�� h�t� � 0�. Elleatteint sonmaximum pour t � �� � 1�1/�/�.
11
-
3. Modèles de duréeconditionnels
Soient :� Zt un vecteur decovariables exogènes dont lavaleur peut évoluer dans
le temps� � un vecteur deparamètres associéà Zt, en général demême
dimension que Zt.
Problème : spécification (paramétrique) de la loi conditionnelle de Tsachant �Zt � t�0
�
12
-
3.1 Modèles à hasards proportionnelsForme générale :
h�t � Zt,�� � h0�t � �� exp�� �Zt�
avec
� � ��, ��
Fonction de hasard de base:
h0�t � �� � h�t � Zt � 0, ��
Spécifications équivalentes :� fonction dehasard cumulée:
H�t � �Zu�u�0� , �� � �
0
th0�u � �� exp�� �Zu�du
13
-
� fonction de survie:
S�t � �Zu �u�0� , �� � exp � �
0
th0�u � �� exp�� �Zu�du
� fonction dedensité:
f�t � �Zu�u�0� , �� � h0�t � �� exp�� �Zt�
� exp � �0
th0�u � �� exp�� �Zu�du
Remarques :
a) Si Zt � Z (covariables constantes) :� fonction dehasard cumulée:
H�t � Z, �� � exp�� �Z� �0
th0�u � ��du � exp�� �Z�H0�t � ��
14
-
� fonction desurvie:
S�t � Z, �� � exp � �exp�� �Z�H0�t � ���
� �exp � �H0�t � ����exp���
Z�
� S0�t � ��exp��
�
Z�
� fonction dedensité:
f�t � Z, �� � h0�t � �� exp�� �Z� S0�t � ��exp��
�
Z�
b) Forme paramétrique de h0�t � �� :� loi de Weibull :
h0�t � �� � � t��1
15
-
� hasard constant “par intervalles” (piecewise constant) :
h0�t � �� � � l � 1�t � � l, l�1��,
avec l � 0,. . . ,L, 0 � 0 et L�1 � �
où 1� � est la fonction indicatriceprenant lavaleur 1 si l’expressionentrecrochets est vraie, 0 sinon.
� Si h0�t� est traitécommeun paramètredenuisance (i.e. non spécifié),lemodèleàhasards proportionnels est alors semi-paramétrique(modèledeCox). Son estimation peut êtreobtenuepar maximisationd’une fonction devraisemblancepartiellepour la loi des rangs (cf.Cox, 1975)
16
-
3.2 Modèles avec hasards accélérésForme générale (pour Zt � Z�:
h�t � Z,�� � exp�� �Z� h0�texp�� �Z� � ��
avec
� � ��,��
Représentation log-linéaire :� Changement devariables:
T0 � Texp�� �Z�, soit lnT � lnT0 � � �Z
Posons
�0 � E�ln�T0�� et � � lnT0 � E�ln�T0��
Donc
lnT � �0 � � �Z � �
17
-
� Si lnT0 � N��,��, alors � � N�0,��. On obtient un modèlederégression log-normal.
3.3 Modèles à hasards proportionnelsavec hétérogénéité non observableHypothèse. La fonction de hasard dépend d’une composantealéatoire spécifique à l’individu (non observable) de loi paramétréeL�� :
h�t � �,Zt,�� � h0�t � ��exp�� �Zt� �
avec
� � L��et
� � ��,�,�
18
-
Hypothèses usuelles sur L�� :1. � � Gamma�,�, � 0 (Lancaster, 1979)
E��� � 1 et V��� � �2 � 1/
Densité de �:
g��� � ���1 exp����
��1 ��
���
Survie de T conditionnelle à Zt et � :
S�t � �Zu �u�0� , �� � �
0
�
S�t � �, �Zu �u�0� , �� g��� d�
soit
S�t � �Zu �u�0� , �� � 1 � 1
H�t � �Zu �u�0
� , ����
19
-
Densité de T conditionnelle à Zt et � :f�t � �Zu �u�0
� , �� � h0�t � �� exp�� �Zt�
� 1 � 1
H�t � �Zu �u�0� , ��
���1
Remarque: si h0�t � �� est monotone en t, l’oubli de � biaisevers le bas l’estimation de la fonction de hasard de base.
2. � prend l’une des valeurs ��1, �2. . . , �J � avec probabilité�p1,p2. . . ,pJ �, J étant fixé et pJ � 1 ��
j�1
J�1pj (Heckman et
Singer, 1984)Survie de T conditionnelle à Zt et � :
S�t � �Zu �u�0� , �� � �
j�1
JS�t � � j, �Zu �u�0
� , �� pj
20
-
soit
S�t � �Zu �u�0� , �� � �
j�1
Jexp �� j �
0
th0�u � �� exp�� �Zu�du pj
Densité de T conditionnelle à Zt et � :
f�t � �Zu �u�0� , �� � �
j�1
Jh0�t � �� exp�� �Zt� � j
� exp �� j �0
th0�u � �� exp�� �Zu� du pj
21
-
4. Modèles de durée avecrisques concurrents
Exemple: plusieurs issues possibles au chômage (CDI, CDD, stage,inactivité).
4.1 Cas sans covariablesFormalisme :� àchaque issue k �k � 1,. . . ,K�, est associéeunedurée latente Tk
�
� pour chaque individu i de l’échantillon, on observe le minimum deces K durées:
Ti � min�T1i� , . . . ,TKi
� �
et le typed’ issue ki, soit ki � argk��1,..K� min�T1i� , . . . ,TKi
� �
22
-
� fonction desurvie jointedes durées latentes :
S�t1, . . . , tK� � Pr�T1i�
� t1, . . . ,TKi�
� tK�
� fonctions desurvie, dedensitéet dehasard marginales:
Sk�tk� � S�0,. . . ,0, tk,0, . . .0�
fk�tk� � � ddtkSk�tk�
hk�tk� � fk�tk� /Sk�tk�
23
-
� fonctions desurvieconditionnelles:
S�k�t1, . . . , tk�1, tk�1, . . . , tK � Tk � tk� �S�t1, . . . , tK�
Sk�tk�
S�k�t1, . . . , tk�1, tk�1, . . . , tK � Tk � tk� � �
��tk
S�t1, . . . , tK�
fk�tk�
� contribution de l’ individu i à la fonction devraisemblance:
l�ti,ki � � fki �ti� � S�ki �ti, . . . , ti, ti, . . . , ti � Tki � ti�
� � ��tk
S�ti, . . . , ti�
24
-
4.2 Risques concurrents indépendantsHypothèse:
S�t1, . . . , tK� � �k�1
KSk�tk�
Conséquence:
l�ti,ki � � fki �ti� � �k�ki Sk�ti� � hki �ti� � �k�1K
Sk�ti�
25
-
4.3 Théorème de non-identifiabilitéThéorème:
Soient:
S � S�t1, . . . , tK� : S fonction de survie jointe continûment différentiable
SI � S � S � S�t1, . . . , tK� � �k�1
KSk�tk� ,
lS�t,k� la vraisemblance d’un modèle dans S,
lSI �t,k� la vraisemblance d’un modèle dans SI,
alors:
�S � S, �!SI � SI, tel que lSI �t,k� � lS�t,k�.
Preuve: voir Florens, Fougère et Mouchart (1996)
26
-
4.4 Cas avec covariables et hétérogénéit énon observableFonction de hasard marginale:
hk�tk � �k,Zt, �k� � h0k�t � �k� exp��k� Zt� �k, k � 1, . . .K
Hypothèse maintenue:�k � � k, Tk
� Tk � ��Zu �u�0� ,�k,�k
� �
Notations:� � � ��1,�2, . . .�K �� fonction dedensitéde �: g�� � �� � g��1,�2, . . .�K � ��
27
-
Fonction de vraisemblance conditionnelle à l’hétérogénéité nonobservée:
l�t,k � �Zu �u�0� , �� � hk�t � �k,Zt, �k �
� �k
�
�1
KSk
� �t � �Zu �u�0� , �k
� , �k� �
Fonction de vraisemblance non conditionnelle:
l�t,k � �Zu �u�0� � � �
�1�0
�
. .��K�0
�
hk�t � �k,Zt, �k �
� �k
�
�1
KSk
� �t � �Zu �u�0� , �k
� , �k
� �
� g��1, �2, . . . �K � ��d�1. .d�K
Méthode d’estimation: maximum de vraisemblance simulé si K � 3(cf. Gouriéroux et Monfort, 1996)
28
-
Cas bivarié: ��1, �2� � �expw1, expw2� et �w1,w2� N�0, ��
Hypothèse simplificatrice dans le cas multivarié: �k � exp��kw� avecw N�0,1� (cf. Flinn et Heckman, 1982)
5. Censure à droiteObservation:
Y � min�T,C� et D � 1�T � C�
Hypothèse:T C � ��Zu �u�0
� , �, ��
Remarque: le modèle avec censure à droite est un modèle à deuxrisques concurrents indépendants.Fonction de vraisemblance:
l�y,d� � �fT�y�SC�y��d � �fC�y�ST�y��1�d
29
-
doncmax
�l�y,d� max
��fT�y��
d� �ST�y��
1�d
Généralisation au cas multivarié �T1�, . . . ,TK� ,C�: immédiate sousl’hypothèse
�k, Tk�
C
30
-
6. Rappels sur la méthode dumaximum de vraisemblance
6.1 Fonction de vraisemblance� Soit unev.a. X àvaleurs dans R, dont on possèdeun échantillon
indépendant de taille n, noté �x1, . . . ,xn � � Rn, et de loi P� indicéeparun paramètre réel ou multidimensionnel � � � � Rp
� Définition: On appelle vraisemblance en � de l’échantillonx � �x1, . . . ,xn �, et on note l�x;��, l’ application qui à� faitcorrespondre:1. l�x;�� � fX�x1, . . . ,xn � si X1, . . . ,Xn sont n v.a. réelles de
fonction de densité jointe fX
2. l�x;�� � PX�X1 � x1, . . . ,Xn � xn � si X1, . . . ,Xn sont n v.a.discrètes de probabilité jointe PX
31
-
� Remarque: Si les v.a. �X1, . . . ,Xn � sont iid, demême loi dedensité f,alors
l�x;�� � �i�1
n
f�xi �
� Exemples :1. Pour une v.a. normale Xi
iid
N�m, �2�, i � 1, . . . ,n, la
vraisemblance de l’échantillon x � �x1, . . . ,xn � est :
l�x;m, �2� � 1�
n 2�nexp �
��xi � m�2
2�2
2. Pour une v.a. de Poisson Xiiid
Poisson���, i � 1, . . . ,n, la
vraisemblance de l’échantillon est:
l�x;�� � e�n� �� xi
� xi!
32
-
6.2 Estimateur du maximum devraisemblance (EMV)� Définition. Soit x � �x1, . . . ,xn � une réalisation de l’échantillon
�X1, . . . ,Xn �. Un estimateur du maximum devraisemblancede� estunesolution du problèmedemaximisation
���
max l�x;��
� Condition suffisanted’existence:Si l’ ensembledes paramètres � est compact et si lavraisemblancel�x;�� est continueen �, il existeun estimateur du maximum devraisemblance
� Condition d’unicité:Lorsqu’en outre la fonction de log-vraisemblanceL�x,�� � ln l�x;��est une fonction globalement concaveen �, l’ estimateur du maximumdevraisemblance (EMV) est unique.
33
-
� Propr iété:Si � � ��1, . . . ,�p�
�� � � Rp, si la log-vraisemblance ln l�x;�� est
dérivableen � et si l’EMV�� appartient à l’ intérieur de �,
�� satisfait
�Ln x;��
���
� ln l x;��
��� 0
Ces équations sont appelées les équations devraisemblance
6.3 Propriétés asymptotiques de l’EMV� Conditions de régular ité:
H1. les v.a. Xi , i � 1,. . . ,n, sont iid, de même loi de densitéf�x,��,� � � � Rp
H2. l’espace � des paramètres est compactH3. la vraie valeur inconnue �0 est identifiable, i.e. il n’existe
pas d’autre valeur �1 telle que
f�x,�0� � f�x,�1�,�x
34
-
H4. la log-vraisemblance
Ln�x;�� ��i�1
n
ln f�xi;��
est continue en �H5. E�0 ln f�Xi;�� existeH6. la log-vraisemblance est telle que
1n Ln�x;��
ps� E�0 ln f�Xi;��, �� � �
� Propr iété:Sous les hypothèses H1-H6, il existeunesuited’estimateurs dumaximum devraisemblanceconvergeant presquesûrement vers lavraievaleur �0
35
-
� Conditions supplémentaires:H7. �0 appartient à l’intérieur de �H8. la log-vraisemblance Ln�x;�� est deux fois continûment
dérivable dans un voisinage ouvert de �0H9. la matrice d’information de Fisher en �0
I1��0� � E�0 ��2 lnf�Xi;��
���� �
existe et est inversible� Propr iété:
Sous les hypothèses H1-H9, il existeunesuite�� n demaxima locaux
de la log-vraisemblanceconvergeant presquesûrement vers�0, telleque
n�� n � �0
loi� N 0,I 1��0��1
36
-
� Remarque: Lamatriced’ information deFisher I1��0� dépend duparamètre inconnu �0, mais ellepeut facilement êtreestiméedemanièreconvergente, si elleest continueen �, par les estimateurssuivants
I 1�� n
ou
�1n
�2 lnl x;�� n
���� �
ou
1n �
i�1
n� ln f xi,
�� n
��
� ln f xi,�� n
�� �
37
-
� Rappel:
�1n
�2 ln l�x;�0 ����� �
ps� E�0 �
�2 lnf�Xi;������ �
� I 1��0�
et
I 1��0� � E�0 ��2 lnf�Xi;��
���� �
� E�0� lnf�Xi;��
��
� lnf�Xi;���� �
38
-
6.4 Tests fondés sur la vraisemblance� Formegénéraledu test:
H0 : g��� � 0 �
g1��� � 0
�
gr��� � 0
Les fonctions g1, . . . ,gr sont àvaleurs dans R, dérivables, et telles que
lamatrice�g ����
��dedimension �p,r� soit de rang r,�� � �
� Ln�x;�� log-vraisemblancedu modèleet�� n EMV de �
� Si g�� n est “proche” de0, on aura tendanceàaccepter H0 (test de
Wald)
39
-
Test de Wald. Sous les conditions de régularité H1-H9, le testdéfini par la région critique
W � ��nW � �1��2 �r��
avec
�nW
� n
dim��1,r�
g ��� n
�
dim��r,p�
�g�
� n
�� �
dim��p,p�
I�
� n�1
dim��p,r�
�g ��
� n
��
�1
�
dim��r,1�
g�
� n
est de niveau asymptotique � et est convergent. Ce test estappelé test de Wald
40
-
� Soit�� n
0l’EMV de � contraint par
g��� � 0
� Lagrangien associéau problèmed’optimisation sous contrainte:
dim��1,1�
Ln��� �
dim��1,r�
g ����dim��r,1�
�
� Conditions du 1er ordre:
dim��p,1�
�Ln x;�� n
0
���
dim��p,r�
�g ��� n
0
��dim��r,1�
��n � 0
en notant��n la valeur prisepar levecteur � des multiplicateurs de
Lagrange
41
-
Test du score. Sous les conditions de régularité H1-H9, le testdéfini par la région critique
W � ��nS � �1��2 �r��
avec
�nS
�1n
dim��1,p�
�Ln x;�� n
0
�� �
dim��p,p�
I�� n
0 �1
dim��p,1�
�Ln x;�� n
0
�� �
�1n
�1,r�
��n
�
dim��r,p�
�g�� n
0
�� �
dim��p,p�
I�� n
0 �1
dim��p,r�
�g ��� n
0
���r,1�
��n
est de niveau asymptotique �. Ce test est appelé test du score(ou test du multiplicateur de Lagrange)
42
-
En outre, sous H0,p lim��nW � �nS �
�n���� 0
Test du ratio des vraisemblances. Sous les conditions derégularité H1-H9, le test défini par la région critique
W � ��nR � �1��2 �r��
avec
�nR� 2 Ln x;
�� n � Ln x;
�� n
0
est de niveau asymptotique � et est convergent. Ce test estappelé test du rapport des vraisemblances. En outre, sous H0,
p lim��nR � �nS � � p lim��nR � �nW � � 0
43