1. caractérisations de la loi de la durée t - crest...econométrie des modèles de durée soit t...

Econométrie des modèles dedurée

Soit T une variable aléatoire continue positive, représentant la duréepassée dans un certain état (par exemple: chômage, vie en couple,durée de survie)

1. Caractérisations de la loi dela durée T

Fonction de répartition :

F�t� � Pr�T � t�, t � 0.

1

Propriétés :� F�t� � �0,1�, t � 0� F est continueàdroite, i.e. F�t�� F�t�, t � 0� F est monotonenon-décroissante, i.e. t1 � t2 � F�t1� � F�t2�� F�0�� 0 et limt�� F�t� � 1

Fonction de survie :

S�t� � Pr�T � t� � 1 � F�t�

Propriétés :� S�t� � �0,1�, t � 0� S est continueàgauche, i.e. S�t�� S�t�, t � 0� S est monotonedécroissante, i.e. t1 � t2 � S�t1� � S�t2�� S�0�� 1 et limt�� S�t� � 0

2

Fonction de densité :

f�t� � lim��0

Pr�t � T � t � ��

soit

F�t� � �0

tf�u� du

ou encore

S�t� � �t

�

f�u� du � 1 � �0

tf�u� du

Fonction de hasard :

h�t� � lim��0

Pr�t � T � t � � � T � t��

3

soit

h�t� � f�t�S�t�

� �d lnS�t�

dt

Propriétés :� h : R� � R�

� �0

th�u� du � �, t � 0, mais�

0

�

h�u� du � �

� h n’est pas nécessairement monotone

Fonction de hasard cumulée :

H�t� � �0

th�u� du

4

Relations entre ces différentes fonctions :

H�t� � � ln S�t� � �0

th�u� du

S�t� � exp � H�t� � exp- �0

th�u� du

f�t� � h�t� S�t� � h�t� exp��H�t�� h�t� exp - �0

th�u� du

F�t� � 1 � S�t� � 1 � exp��H�t�� 1 � exp - �0

th�u� du

5

2. Exemples de loisparamétriques usuelles

2.1 Loi exponentielleT suit une loi exponentielle de paramètre � � 0 si :� fonction dehasard :

h�t� � �, t � 0

� fonction dehasard cumulée :

H�t� � �t

� fonction desurvie :

S�t� � exp��t�

6

� fonction dedensité :

f�t� � � exp��t�

Remarques :� E�T� � ��1 et V�T� � ��2

� � lnS�t� � �t � la courbe �t,� ln�S�t�� est approximativement une

droite

2.2 Loi de WeibullT suit une loi de Weibull de paramètres � � 0 et � � 0 si :� fonction dehasard :

h�t� � �� t��1, t � 0

� fonction dehasard cumulée :

H�t� � � t�

7


S�t� � exp�� t��

� fonction dedensité :

f�t� � �� t��1 exp�� t��

Remarques :� exp�� Weibull��,1�� dh�t�/dt � �� 1� t��2 � la fonction dehasard de la loi deWeibull

est monotonecroissanteou monotonedécroissanteselon que � � 1 ou� � 1

� ln�� lnS�t�� ln� � � lnt � la courbe lnt, ln � ln�S�t� est

approximativement unedroite

8

2.3 Loi log-normaleT suit une loi log-normale de paramètres � et � � 0 si :� fonction dedensité :

f�t� � 1�t �

lnt � ��


S�t� � 1 � �lnt � �

�

� fonction dehasard :

h�t� � 1�t

�lnt � �

�

1 � �lnt � �

�

9

où � et � sont respectivement la fonction dedensitéet la fonction derépartition de la loi normaleN�0,1�

Remarques:� limt�0 h�t� � 0 et limt�� h�t� � 0� la fonction dehasard est non monotoneet unimodale (croissantepuis

décroissante)

2.4 Loi log-logistiqueT suit une loi log-logistique de paramètres � � 0 et � � 0 si:� fonction dedensité :

f�t� � �� t��1�1 � ��t�� 2


S�t� � 11 � ��t��

10

� fonction dehasard :

h�t� �� t��1

1 � ��t��

Remarques :� La fonction dehasard est monotonedécroissantesi � � 1 (avec

limt�0 h�t� � �� Elleest monotonecroissantesi � � 1 (avec limt�0 h�t� � �� Elleest non monotoneet unimodale (croissantepuis décroissante) si

� � 1 (avec limt�0 h�t� � 0 et limt�� h�t� � 0�. Elleatteint sonmaximum pour t � �� 1�1/�/�.

11

3. Modèles de duréeconditionnels

Soient :� Zt un vecteur decovariables exogènes dont lavaleur peut évoluer dans

le temps� � un vecteur deparamètres associéà Zt, en général demême

dimension que Zt.

Problème : spécification (paramétrique) de la loi conditionnelle de Tsachant �Zt � t�0

�

12

3.1 Modèles à hasards proportionnelsForme générale :

h�t � Zt,�� h0�t � �� exp�� Zt�

avec

� � ��, ��

Fonction de hasard de base:

h0�t � �� h�t � Zt � 0, ��

Spécifications équivalentes :� fonction dehasard cumulée:

H�t � �Zu�u�0� , ��

0

th0�u � �� exp�� Zu�du

13

� fonction de survie:

S�t � �Zu �u�0� , �� exp � �

0


� fonction dedensité:

f�t � �Zu�u�0� , �� h0�t � �� exp�� Zt�

� exp � �0


Remarques :

a) Si Zt � Z (covariables constantes) :� fonction dehasard cumulée:

H�t � Z, �� exp�� Z� �0

th0�u � ��du � exp�� Z�H0�t � ��

14

� fonction desurvie:

S�t � Z, �� exp � �exp�� Z�H0�t � ��

� �exp � �H0�t � ��exp��

Z�

� S0�t � ��exp��

�

Z�

� fonction dedensité:

f�t � Z, �� h0�t � �� exp�� Z� S0�t � ��exp��

�

Z�

b) Forme paramétrique de h0�t � �� :� loi de Weibull :

h0�t � �� t��1

15

� hasard constant “par intervalles” (piecewise constant) :

h0�t � �� l � 1�t � � l, l�1��,

avec l � 0,. . . ,L, 0 � 0 et L�1 � �

où 1� � est la fonction indicatriceprenant lavaleur 1 si l’expressionentrecrochets est vraie, 0 sinon.

� Si h0�t� est traitécommeun paramètredenuisance (i.e. non spécifié),lemodèleàhasards proportionnels est alors semi-paramétrique(modèledeCox). Son estimation peut êtreobtenuepar maximisationd’une fonction devraisemblancepartiellepour la loi des rangs (cf.Cox, 1975)

16

3.2 Modèles avec hasards accélérésForme générale (pour Zt � Z�:

h�t � Z,�� exp�� Z� h0�texp�� Z� � ��

avec

� � ��,��

Représentation log-linéaire :� Changement devariables:

T0 � Texp�� Z�, soit lnT � lnT0 � � �Z

Posons

�0 � E�ln�T0�� et � � lnT0 � E�ln�T0��

Donc

lnT � �0 � � �Z � �

17

� Si lnT0 � N��,��, alors � � N�0,��. On obtient un modèlederégression log-normal.

3.3 Modèles à hasards proportionnelsavec hétérogénéité non observableHypothèse. La fonction de hasard dépend d’une composantealéatoire spécifique à l’individu (non observable) de loi paramétréeL�� :

h�t � �,Zt,�� h0�t � ��exp�� Zt� �

avec

� � L��et

� � ��,�,�

18

Hypothèses usuelles sur L�� :1. � � Gamma�,�, � 0 (Lancaster, 1979)

E�� 1 et V�� 2 � 1/

Densité de �:

g�� 1 exp��

��1 ��

��

Survie de T conditionnelle à Zt et � :

S�t � �Zu �u�0� , ��

0

�

S�t � �, �Zu �u�0� , �� g�� d�

soit

S�t � �Zu �u�0� , �� 1 � 1

H�t � �Zu �u�0

� , ��

19

Densité de T conditionnelle à Zt et � :f�t � �Zu �u�0

� , �� h0�t � �� exp�� Zt�

� 1 � 1

H�t � �Zu �u�0� , ��

��1

Remarque: si h0�t � �� est monotone en t, l’oubli de � biaisevers le bas l’estimation de la fonction de hasard de base.

2. � prend l’une des valeurs ��1, �2. . . , �J � avec probabilité�p1,p2. . . ,pJ �, J étant fixé et pJ � 1 ��

j�1

J�1pj (Heckman et

Singer, 1984)Survie de T conditionnelle à Zt et � :

S�t � �Zu �u�0� , ��

j�1

JS�t � � j, �Zu �u�0

� , �� pj

20

soit

S�t � �Zu �u�0� , ��

j�1

Jexp �� j �

0

th0�u � �� exp�� Zu�du pj

Densité de T conditionnelle à Zt et � :

f�t � �Zu �u�0� , ��

j�1

Jh0�t � �� exp�� Zt� � j

� exp �� j �0

th0�u � �� exp�� Zu� du pj

21

4. Modèles de durée avecrisques concurrents

Exemple: plusieurs issues possibles au chômage (CDI, CDD, stage,inactivité).

4.1 Cas sans covariablesFormalisme :� àchaque issue k �k � 1,. . . ,K�, est associéeunedurée latente Tk

�

� pour chaque individu i de l’échantillon, on observe le minimum deces K durées:

Ti � min�T1i� , . . . ,TKi

� �

et le typed’ issue ki, soit ki � argk��1,..K� min�T1i� , . . . ,TKi

� �

22

� fonction desurvie jointedes durées latentes :

S�t1, . . . , tK� � Pr�T1i�

� t1, . . . ,TKi�

� tK�

� fonctions desurvie, dedensitéet dehasard marginales:

Sk�tk� � S�0,. . . ,0, tk,0, . . .0�

fk�tk� � � ddtkSk�tk�

hk�tk� � fk�tk� /Sk�tk�

23

� fonctions desurvieconditionnelles:

S�k�t1, . . . , tk�1, tk�1, . . . , tK � Tk � tk� �S�t1, . . . , tK�

Sk�tk�

S�k�t1, . . . , tk�1, tk�1, . . . , tK � Tk � tk� � �

��tk

S�t1, . . . , tK�

fk�tk�

� contribution de l’ individu i à la fonction devraisemblance:

l�ti,ki � � fki �ti� � S�ki �ti, . . . , ti, ti, . . . , ti � Tki � ti�

� � ��tk

S�ti, . . . , ti�

24

4.2 Risques concurrents indépendantsHypothèse:

S�t1, . . . , tK� � �k�1

KSk�tk�

Conséquence:

l�ti,ki � � fki �ti� � �k�ki Sk�ti� � hki �ti� � �k�1K

Sk�ti�

25

4.3 Théorème de non-identifiabilitéThéorème:

Soient:

S � S�t1, . . . , tK� : S fonction de survie jointe continûment différentiable

SI � S � S � S�t1, . . . , tK� � �k�1

KSk�tk� ,

lS�t,k� la vraisemblance d’un modèle dans S,

lSI �t,k� la vraisemblance d’un modèle dans SI,

alors:

�S � S, �!SI � SI, tel que lSI �t,k� � lS�t,k�.

Preuve: voir Florens, Fougère et Mouchart (1996)

26

4.4 Cas avec covariables et hétérogénéit énon observableFonction de hasard marginale:

hk�tk � �k,Zt, �k� � h0k�t � �k� exp��k� Zt� �k, k � 1, . . .K

Hypothèse maintenue:�k � � k, Tk

� Tk � ��Zu �u�0� ,�k,�k

� �

Notations:� � � ��1,�2, . . .�K �� fonction dedensitéde �: g�� g��1,�2, . . .�K � ��

27

Fonction de vraisemblance conditionnelle à l’hétérogénéité nonobservée:

l�t,k � �Zu �u�0� , �� hk�t � �k,Zt, �k �

� �k

�

�1

KSk

� �t � �Zu �u�0� , �k

� , �k� �

Fonction de vraisemblance non conditionnelle:

l�t,k � �Zu �u�0� � � �

�1�0

�

. .��K�0

�

hk�t � �k,Zt, �k �

� �k

�

�1

KSk

� �t � �Zu �u�0� , �k

� , �k

� �

� g��1, �2, . . . �K � ��d�1. .d�K

Méthode d’estimation: maximum de vraisemblance simulé si K � 3(cf. Gouriéroux et Monfort, 1996)

28

Cas bivarié: ��1, �2� � �expw1, expw2� et �w1,w2� N�0, ��

Hypothèse simplificatrice dans le cas multivarié: �k � exp��kw� avecw N�0,1� (cf. Flinn et Heckman, 1982)

5. Censure à droiteObservation:

Y � min�T,C� et D � 1�T � C�

Hypothèse:T C � ��Zu �u�0

� , �, ��

Remarque: le modèle avec censure à droite est un modèle à deuxrisques concurrents indépendants.Fonction de vraisemblance:

l�y,d� � �fT�y�SC�y��d � �fC�y�ST�y��1�d

29

doncmax

�l�y,d� max

��fT�y��

d� �ST�y��

1�d

Généralisation au cas multivarié �T1�, . . . ,TK� ,C�: immédiate sousl’hypothèse

�k, Tk�

C

30

6. Rappels sur la méthode dumaximum de vraisemblance

6.1 Fonction de vraisemblance� Soit unev.a. X àvaleurs dans R, dont on possèdeun échantillon

indépendant de taille n, noté �x1, . . . ,xn � � Rn, et de loi P� indicéeparun paramètre réel ou multidimensionnel � � � � Rp

� Définition: On appelle vraisemblance en � de l’échantillonx � �x1, . . . ,xn �, et on note l�x;��, l’ application qui à� faitcorrespondre:1. l�x;�� fX�x1, . . . ,xn � si X1, . . . ,Xn sont n v.a. réelles de

fonction de densité jointe fX

2. l�x;�� PX�X1 � x1, . . . ,Xn � xn � si X1, . . . ,Xn sont n v.a.discrètes de probabilité jointe PX

31

� Remarque: Si les v.a. �X1, . . . ,Xn � sont iid, demême loi dedensité f,alors

l�x;�� i�1

n

f�xi �

� Exemples :1. Pour une v.a. normale Xi

iid

N�m, �2�, i � 1, . . . ,n, la

vraisemblance de l’échantillon x � �x1, . . . ,xn � est :

l�x;m, �2� � 1�

n 2�nexp �

��xi � m�2

2�2

2. Pour une v.a. de Poisson Xiiid

Poisson��, i � 1, . . . ,n, la

vraisemblance de l’échantillon est:

l�x;�� e�n� �� xi

� xi!

32

6.2 Estimateur du maximum devraisemblance (EMV)� Définition. Soit x � �x1, . . . ,xn � une réalisation de l’échantillon

�X1, . . . ,Xn �. Un estimateur du maximum devraisemblancede� estunesolution du problèmedemaximisation

��

max l�x;��

� Condition suffisanted’existence:Si l’ ensembledes paramètres � est compact et si lavraisemblancel�x;�� est continueen �, il existeun estimateur du maximum devraisemblance

� Condition d’unicité:Lorsqu’en outre la fonction de log-vraisemblanceL�x,�� ln l�x;��est une fonction globalement concaveen �, l’ estimateur du maximumdevraisemblance (EMV) est unique.

33

� Propr iété:Si � � ��1, . . . ,�p�

�� Rp, si la log-vraisemblance ln l�x;�� est

dérivableen � et si l’EMV�� appartient à l’ intérieur de �,

�� satisfait

�Ln x;��

��

� ln l x;��

�� 0

Ces équations sont appelées les équations devraisemblance

6.3 Propriétés asymptotiques de l’EMV� Conditions de régular ité:

H1. les v.a. Xi , i � 1,. . . ,n, sont iid, de même loi de densitéf�x,��,� � � � Rp

H2. l’espace � des paramètres est compactH3. la vraie valeur inconnue �0 est identifiable, i.e. il n’existe

pas d’autre valeur �1 telle que

f�x,�0� � f�x,�1�,�x

34

H4. la log-vraisemblance

Ln�x;�� i�1

n

ln f�xi;��

est continue en �H5. E�0 ln f�Xi;�� existeH6. la log-vraisemblance est telle que

1n Ln�x;��

ps� E�0 ln f�Xi;��, ��

� Propr iété:Sous les hypothèses H1-H6, il existeunesuited’estimateurs dumaximum devraisemblanceconvergeant presquesûrement vers lavraievaleur �0

35

� Conditions supplémentaires:H7. �0 appartient à l’intérieur de �H8. la log-vraisemblance Ln�x;�� est deux fois continûment

dérivable dans un voisinage ouvert de �0H9. la matrice d’information de Fisher en �0

I1��0� � E�0 ��2 lnf�Xi;��

��

existe et est inversible� Propr iété:

Sous les hypothèses H1-H9, il existeunesuite�� n demaxima locaux

de la log-vraisemblanceconvergeant presquesûrement vers�0, telleque

n�� n � �0

loi� N 0,I 1��0��1

36

� Remarque: Lamatriced’ information deFisher I1��0� dépend duparamètre inconnu �0, mais ellepeut facilement êtreestiméedemanièreconvergente, si elleest continueen �, par les estimateurssuivants

I 1�� n

ou

�1n

�2 lnl x;�� n

��

ou

1n �

i�1

n� ln f xi,

�� n

��

� ln f xi,�� n

��

37

� Rappel:

�1n

�2 ln l�x;�0 ��

ps� E�0 �

�2 lnf�Xi;��

� I 1��0�

et

I 1��0� � E�0 ��2 lnf�Xi;��

��

� E�0� lnf�Xi;��

��

� lnf�Xi;��

38

6.4 Tests fondés sur la vraisemblance� Formegénéraledu test:

H0 : g�� 0 �

g1�� 0

�

gr�� 0

Les fonctions g1, . . . ,gr sont àvaleurs dans R, dérivables, et telles que

lamatrice�g ��

��dedimension �p,r� soit de rang r,��

� Ln�x;�� log-vraisemblancedu modèleet�� n EMV de �

� Si g�� n est “proche” de0, on aura tendanceàaccepter H0 (test de

Wald)

39

Test de Wald. Sous les conditions de régularité H1-H9, le testdéfini par la région critique

W � ��nW � �1��2 �r��

avec

�nW

� n

dim��1,r�

g �� n

�

dim��r,p�

�g�

� n

��

dim��p,p�

I�

� n�1

dim��p,r�

�g ��

� n

��

�1

�

dim��r,1�

g�

� n

est de niveau asymptotique � et est convergent. Ce test estappelé test de Wald

40

� Soit�� n

0l’EMV de � contraint par

g�� 0

� Lagrangien associéau problèmed’optimisation sous contrainte:

dim��1,1�

Ln��

dim��1,r�

g ��dim��r,1�

�

� Conditions du 1er ordre:

dim��p,1�

�Ln x;�� n

0

��

dim��p,r�

�g �� n

0

��dim��r,1�

��n � 0

en notant��n la valeur prisepar levecteur � des multiplicateurs de

Lagrange

41

Test du score. Sous les conditions de régularité H1-H9, le testdéfini par la région critique

W � ��nS � �1��2 �r��

avec

�nS

�1n

dim��1,p�

�Ln x;�� n

0

��

dim��p,p�

I�� n

0 �1

dim��p,1�

�Ln x;�� n

0

��

�1n

�1,r�

��n

�

dim��r,p�

�g�� n

0

��

dim��p,p�

I�� n

0 �1

dim��p,r�

�g �� n

0

��r,1�

��n

est de niveau asymptotique �. Ce test est appelé test du score(ou test du multiplicateur de Lagrange)

42

En outre, sous H0,p lim��nW � �nS �

�n�� 0

Test du ratio des vraisemblances. Sous les conditions derégularité H1-H9, le test défini par la région critique

W � ��nR � �1��2 �r��

avec

�nR� 2 Ln x;

�� n � Ln x;

�� n

0

est de niveau asymptotique � et est convergent. Ce test estappelé test du rapport des vraisemblances. En outre, sous H0,

p lim��nR � �nS � � p lim��nR � �nW � � 0

43

1. caractérisations de la loi de la durée t - crest...econométrie des modèles de durée soit t...

Documents