Économétrie ii -...
TRANSCRIPT
Économétrie II
Économétrie IICh. 3. Hétéroscédasticité
L3 Économétrie – L3 MASS
Prof. Philippe Polomé, U. Lyon 2
Année 2016-2016
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Rappel
1. E (✏i ) = 0 8i : Espérance nulle2. var (✏i ) = �2 8i : Homoscédasticité3. cov (✏t , ✏s) = 0 8t 6= s : Pas d’auto-corrélation4. E (✏ixi ) = 0 8i : Exogénéité5. X La matrice X est de plein rang : Pas de multicolinéarité6. Le modèle est correctement spécifié7. La variable dépendante Y est continue
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Table des matières
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
DéfinitionSourcesConséquencesEstimer la matrice de variance-covarianceMoindres carrés pondérés “Weighted Least Squares”Tests
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Définition
Table des matières
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
DéfinitionSourcesConséquencesEstimer la matrice de variance-covarianceMoindres carrés pondérés “Weighted Least Squares”Tests
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Définition
Définition du problème
I L’hypothèse d’homoscédasticité requiert que la variance destermes d’erreur soit la même pour chaque observation
I Il y a hétéroscédasticité dans le modèle Y = X� + ✏ lorsque :
var (✏) = E⇣✏✏
0⌘= ⌃✏ =
2
6664
�21 0
�22
. . .0 �2
N
3
77756= �2IN
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Définition
Représentation graphique
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Sources
Table des matières
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
DéfinitionSourcesConséquencesEstimer la matrice de variance-covarianceMoindres carrés pondérés “Weighted Least Squares”Tests
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Sources
Données en moyenne
I S’il y a homoscédasticité dans les données de départ, lesdonnées en moyenne seront hétéroscédastiques
I yit avec var (yit) = 18i , t
I Mais on ne dispose que des moyennes 1Tg
Pt yit = yi où Tg
est la taille du groupeI Par ex : des moyennes régionales de données individuellesI var (yi ) =
1T2
gvar (
Pt yit) =
1T2
g
Pt var (yit) =
Tg
T2g= 1
Tg:
dépend de la taille du groupe
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Sources
Modèle à “coefficients aléatoires”
I Si le modèle sous-jacent est Yi = ↵+ (� + µi ) xi + ✏iI Par ex. effet de l’éducation sur le salaire
I Alors Yi = ↵+ �xi + µixi + ✏i = ↵+ �xi + ⌘iI Et, avec des termes d’erreurs ✏i et µi homoscédastiques et
indépendant et un régresseur xi non-stochastique, on trouveI var (⌘i ) = �2
✏ + �2µxi hétéroscédastique
I Semblable au cas suivant
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Sources
Régresseur manquant hétéroscédastique
I Si le modèle sous-jacent est yi = �0 + �1x1i + �2x2i + ✏iI Mais le modèle estimé est yi = �0 + �1x1i + µi
I Alors µi = �2x2i + ✏i donc,I si x2i n’est pas corrélé à ✏i , var (µi ) = �2
2var (x2i ) + �2
I si x2i n’est pas stochastique (analyse conditionnelle),var (µi ) = �2
2x2i + �2
I Hétéroscédastique sauf cas particulier
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Sources
Effet taille
I La variance est une mesure absolue, pas relativeI Imaginons que le CA de toutes les entreprises varie de 10%I 10% est un grand nombre pour une grande entreprise
I Part du revenu disponible dépensé en loisirsI Les familles à faibles revenus dépensent relativement peu en
loisirs. Les variations de ces dépenses entre ces familles sontdonc faibles
I Pour les familles avec des revenus importants, le montantmoyen relatif dépensé en loisirs sera plus élevé, et il y aura uneplus grande variabilité entre de telles familles
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Sources
Variables explicatives de la variance
I Un régresseur définit des groupes de variances différentesdans la variable expliquée
I Ex. Rendement de l’éducationI variance en productivité propre inobservable ✏ diffère selon les
niveaux h d’éducation atteintsI ln (salairei ) = ↵+ �educationh + Xi� + ✏i
Iavec i 2 h et var (✏i ) = �2
h = fonction (educationh)
I Similaire à l’effet tailleI
Faible éducation : salaire proche du minimum
I Également :I Qualité inobservée d’un bien par niveau de prixI Taux d’épargne par niveau de revenu
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Conséquences
Table des matières
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
DéfinitionSourcesConséquencesEstimer la matrice de variance-covarianceMoindres carrés pondérés “Weighted Least Squares”Tests
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Conséquences
Propriétés de �I MCO restent sans biais (X non-stochastique par facilité)
E⇣�⌘= E
✓⇣X
0X⌘�1
X0(X� + ✏)
◆= �+
⇣X
0X⌘�1
X0E (✏) = �
I MCO consistants / convergents (sans démonstration)I Matrice de variance-covariance des coefficients estimés n’est
plus �2⇣X
0X⌘�1
, mais bien (sandwich)
⌃� = E
✓⇣� � �
⌘⇣� � �
⌘0◆=
⇣X
0X⌘�1
X0E⇣✏✏
0⌘X⇣X
0X⌘�1
=⇣X
0X⌘�1
X0⌃✏X
⇣X
0X⌘�1
I Théorème de Gauss-Markov ne s’applique plusI MCO n’est plus efficient
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Conséquences
Inférence
I Estimateur MCO✏0✏
N � k
⇣X
0X⌘�1
est biaisé pour ⌃�
I Tests d’hypothèse usuels post-estimation (t-stat, F-stat ouLM) invalides dans leur forme classique
I Le bootstrap reste par contre valideI
asymptotiquement comme toujours
I Comment faire face à ces conséquences ? 2 approchesI Estimer ⌃� à partir de MCO & refaire l’inférenceI Proposer un estimateur alternatif
IMoindres Carrés Pondérés
IVise à récupérer l’efficience
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Estimer la matrice de variance-covariance
Table des matières
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
DéfinitionSourcesConséquencesEstimer la matrice de variance-covarianceMoindres carrés pondérés “Weighted Least Squares”Tests
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Estimer la matrice de variance-covariance
Estimateur robuste White (1980)
I On sait ⌃� =⇣X
0X⌘�1
X0⌃✏X
⇣X
0X⌘�1
sandwich
I Sauf cas particulier, ⌃✏ inconnueI White : Pour obtenir un estimateur de ⌃� , il suffit d’un
estimateur de X0⌃✏X (et pas de ⌃✏)
I Sous des conditions très générales, S = 1N
NX
i=1
✏2i XiX0i est un
estimateur consistant de 1NX
0⌃✏X
I ✏i = yi � X0
i �MCO résidu MCO iI Xi vecteur-colonne correspondant à l’observation i de X
IDonc XiX
0i est bien k ⇥ k
I Expliciter la matrice X0⌃✏X : intuition estimateur de White
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Estimer la matrice de variance-covariance
La matrice X0⌃✏Xk⇥k
=
2
6664
x11 x21 . . . xN1x12 x22 . . . xN2...
.... . .
...x1k x2k . . . xNk
3
7775
2
6664
�21 0
�22
. . .0 �2
N
3
7775
2
6664
x11 x12 . . . x1kx21 x22 . . . x2k...
.... . .
...xN1 xN2 · · · xNk
3
7775
=
2
6664
�21x11 �2
2x21 . . . �2NxN1
�21x12 �2
2x22 . . . �2NxN2
......
. . ....
�21x1k �2
2x2k . . . �2NxNk
3
7775
2
6664
x11 x12 . . . x1kx21 x22 . . . x2k...
.... . .
...xN1 xN2 · · · xNk
3
7775
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Estimer la matrice de variance-covariance
La matrice X0⌃✏Xk⇥k
=
2
66666666666664
NX
i=1
�2i x
2i1
NX
i=1
�2i xi1xi2 . . .
NX
i=1
�2i xi1xik
NX
i=1
�2i x
2i2 . . .
NX
i=1
�2i xi2xi2
. . . ...
symNX
i=1
�2i x
2ik
3
77777777777775
Comparer avec S = 1N
NX
i=1
✏2i XiX0i
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Estimer la matrice de variance-covariance
Matrice de variance-covariance “robuste”
I ⌃� = N⇣X
0X⌘�1
S⇣X
0X⌘�1
consistant pour ⌃�
I Peut-être utilisé pour tests usuels post-estimation
I Écart-types issus de White : “robustes à l’hétéroscédasticité”I Suggestion : corriger la matrice de White par n/ (n � k � 1)I Lorsque n �! 1 les deux approches sont équivalentes
I L’estimateur de White est seulement consistantI Pas sans biaisI Valable seulement asymptotiquementI Sur échantillons de petite taille
It de Student “de White” n’ont pas une distribution proche du t
ITests ont peu de puissance
IUtile de voir si Bootstrap mène aux mêmes résultats
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Estimer la matrice de variance-covariance
Matrice de White : logiciels
I La correction par la matrice de White est pré-programmée surtous les logiciels d’économétrie.
I Sous Gretl, cocher une case dans la boîte de dialogued’estimation
IPlusieurs variantes à la correction de White, manuel de Gretl
pour les détails
I Dans GRETLI Prenez les données hprice1.gdt dans Gretl WooldridgeI Régressez lprice sur llotsize, lsqrft, bdrms, colonialI Pour obtenir l’estimation “robuste” des t-stats
ICocher “erreurs standards robustes” (la constante n’est plus
significative)
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Moindres carrés pondérés “Weighted Least Squares”
Table des matières
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
DéfinitionSourcesConséquencesEstimer la matrice de variance-covarianceMoindres carrés pondérés “Weighted Least Squares”Tests
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Moindres carrés pondérés “Weighted Least Squares”
Moindres carrés pondérés “Weighted Least Squares”
I Approche alternative à celle de White pour traiterl’hétéroscédasticité
I + ancienne
I Disposer d’informations supplémentaires sur la forme del’hétéroscédasticité rencontrée permet toujours de dériver unestimateur plus efficient que celui donné par l’estimation“robuste”
I Donc si on connait la forme de l’hétéroscédasticité, on devraitpouvoir obtenir un gain en efficience
I L’idée générale est de transformer les données de sorte à ceque les erreurs deviennent homoscédastiques
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Moindres carrés pondérés “Weighted Least Squares”
Forme de l’hétéroscédasticité connue à une constante près
I Supposons que l’hétéroscédasticité puisse être modélisée sousla forme var (✏|X ) = �2h (X )
I On peut alors écrire ⌃✏ = �2
0
BBBB@
h1 0 · · · 0
0 h2...
... . . .0 · · · hN
1
CCCCA= �2
avec hi = h (Xi ) > 0I Si on réécrit le modèle Y = X� + ✏
I sous la formeYiphi
=Xiphi� +
✏iphi
I alors le terme d’erreur est homoscédastique
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Moindres carrés pondérés “Weighted Least Squares”
Remarque
I Le résidu MCP est ✏⇤ = Y ⇤ � X ⇤�MCP
I Le but de MCP est minimiser laP
des carrés des résidus surles données transformées :min ✏⇤0 ✏⇤ = min
Pi
⇣Y ⇤i � X ⇤
i �MCP
⌘2
= minP
i
✓Yiphi
� Xiphi�MCP
◆2
= minP
i
⇣Yi � Xi �MCP
⌘2/hi
I Chaque observation est pondérée par l’inverse de sa varianceI Plus une observation a une variance élevée, moins elle pèse
dans la somme des carrés des résidusI La qualité de l’ajustement (R2) aux données originales n’est
donc plus recherchée : R2 n’est plus une mesure intéressante
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Moindres carrés pondérés “Weighted Least Squares”
MCP en pratique
I Il faut connaître la forme de l’hétéroscédasticitéI Dans la plupart des cas on ne sait rien sur cette formeI Il faut donc un estimateur de h (X ) ou éventuellement d’autres
formes h (X ,Z )
I Moindres Carrés Pondérés Faisables / Feasible WeightedLeast Squares
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Moindres carrés pondérés “Weighted Least Squares”
MCP Faisable
I On suppose une forme simple de typeh (Xi ) = exp (�0 + �1x1i + �2x2i + ...)
I exp garanti la positivitéI var (✏i |Xi ) = �2 exp (�0 + �1x1i + �2x2i + ...)
I Comme MCO est sans biais en présence d’hétéroscédasticité,✏i
2 peut être vu comme une estimation de var (✏i |Xi )
I ✏2i = �2 exp (�0 + �1x1i + �2x2i + ...) ⌫i ; ⌫ terme d’erreur
I Estimer ln�✏2i�= ↵0 + �1x1i + �2x2i + ...+ ln (⌫i ) par MCO
I On peut rajouter des régresseurs Z + X dans cette équation
I Estimation de hi : hi = exp⇣↵0 + �1x1i + �2x2i + ...+1
2 �2⌫
⌘
I Il faut ajouter un terme en variance au carré parce que exp estnon-linéaire (Verbeek) – sans démonstration
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Moindres carrés pondérés “Weighted Least Squares”
Mise en garde sur les MCP faisables
I Dans le doute sur la présence et la forme de l’hétéroscédasticitéI il peut être tentant de prendre une forme usuelle et d’appliquer
les MCPI D’autant plus tentant si le logiciel utilisé propose une
procédure simple
I MaisI Si les termes d’erreurs sont homoscédastiques au départ,
Il’estimateur des MCPF pourra être biaisé et inconsistant
IPar monte-carlo, on voit que ce sont des configurations peu
courantes
I Si l’hétéroscédasticité dépend d’une variable inconnue,I
ou ne dépend pas d’une variable,
Iil peut être difficile d’apporter une correction significative
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Moindres carrés pondérés “Weighted Least Squares”
Comparaison des deux approchesI Approche 1 : MCP
I �MCP 6= �MCO
I Approche historique, en principe meilleure que MCOI
Si l’hyp sur forme de l’hétéroscédasticité est correcte
IPermet alors un gain d’efficience
I Mais risques l’hyp est fausse
I Approche 2 :\
var⇣�MCO
⌘robuste
I On garde les �MCO
I 2.a. White : basé sur un résultat plus récent (1980) que MCP ;requiert une plus grande puissance de calcul
I 2.b. bootstrap : puissance de calcul encore plus grandeI 2.a et 2.b : pas d’hypothèses supplémentaires par rapport à
MCO mais seulement valables pour de grands échantillonsI Évite de tester l’hétéroscédasticité
Iet de chercher quelle forme elle pourrait prendre
I Renonce au gain potentiel d’efficience
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Moindres carrés pondérés “Weighted Least Squares”
Importance de l’hétéroscédasticité en pratique
I L’hétéroscédasticité est la norme avec les données micro encoupe transversale
I L’homoscédasticité est l’exceptionI On va habituellement utiliser White / bootstrap
IPlus rarement MCP / MCG
I Pas aussi évident pour les séries temporellesI Car c’est toujours la même unité qui est observéeI White est aussi disponible
IMais existence de modèles alternatifs propres
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Moindres carrés pondérés “Weighted Least Squares”
Exemple dans Gretl
I Prenez les données hprice1.gdt dans Gretl WooldridgeI Régressez lprice sur llotsize, lsqrft, bdrms, colonial
I Moindres Carrés Pondérés : “Modèle” – “autres modèleslinéaires” – “MCP”
I Un seul régresseur est associé à l’hét.I Une façon alternative est “Hétéroscédasticité corrigée” qui
impose une correction “à la White”I
c’est-à-dire : l’hét. est approximée à partir d’une regression
contenant les régresseurs et leurs carrés
Icomme dans le test de White (plus loin)
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Tests
Table des matières
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
DéfinitionSourcesConséquencesEstimer la matrice de variance-covarianceMoindres carrés pondérés “Weighted Least Squares”Tests
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Tests
Principe des tests d’hétéroscédasticité
I On n’observe jamais les vrais termes d’erreur.I On les “estime” à partir des résidus de la régression par MCO ✏i
I “car” MCO sans biais en présence d’hétéroscédasticité
I 3 tests populairesI Breusch-PaganI WhiteI Goldfeld-Quandt
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Tests
Test de Breusch-Pagan
I On veut tester H0 : var (✏i |x1i , ..., xki ) = �2 8iI Equivalent à tester H0 : E
�✏2i |x1i , ..., xki
�= �2 8i car E (✏) = 0
I Si on suppose que la relation entre ✏2i et Xi est suffisammentproche du linéaire
I ✏2i = �0 + �1x1i + ...+ �kxki + ⌫I Alors tester H0 revient à tester H0 : �1 = �2 = ... = �k = 0
I Régresser carré des résidus ✏2i sur toutes les variablesexplicatives X
I Tester significativité globale via la procédure habituelle (F-testou LM-test)
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Tests
Test de White
I Test de Breusch-Pagan permet de détecter les formes linéairesd’hétéroscédasticité
I Test de White permet de prendre en compte certainesnon-linéarités en utilisant les carrés et les produits croisés detoutes les variables explicatives
I Même procédure que Breusch-PaganI En introduisant tous les x2
j et les xjxmI Et en testant que les paramètres associés sont conjointement
significatifs (F-test ou LM-test)I Rapidement : nombre de paramètres à estimer impraticable. . .
IEn proba (5%) erreur type I : ¬R H0 fréquente
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Tests
Forme alternative du test de WhiteI Les valeurs ajustées yi = Xi � sont fonction de toutes les X
I y2 est une fonction des carrés x2j et des produits croisés xjxm
I y2 peut être utilisé pour représenter les non-linéaritésI On peut utiliser y pour représenter tous les X à la fois
I Procédure1. Régresser le carré des résidus MCO ✏2i sur les valeurs ajustées
yi et y2i
2. F-test ou un LM-test sur la significativité globale de cetterégression
I On ne teste plus que les coef. de ces 2 paramètresI Ce test repose sur une hypothèse forte concernant la forme de
l’hétéroscédasticitéI Celle-ci est fonction des variables inclusesI N’impose pas la linéarité de cette forme (on peut étendre aux
cubes...)
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Tests
Test de Goldfeld-QuandtI Dans le cas où la théorie permet d’envisager une
hétéroscédasticité causée par une seule explicative xm
1. Trier les observations par les valeurs de la variable explicativesoupçonnée source d’hétéroscédasticité
I et donc corrélée avec ✏2i2. Supprimer la partie des données triées qui se trouve au milieu
de l’échantillonI entre 1/3 et 1/5 des données
3. Estimations séparées (MCO) sur les deux sous échantillons :hautes et basses valeurs de xm
4. Les rapport des variances estimées des termes d’erreur desdeux régressions suit une distribution de Fisher
I GQ =�2
1�2
2⇠ FN1�K ,N2�K
I N1 � K = nombre de degrés de liberté de la 1ère régression
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Tests
Exemple dans Gretl
I Prenez les données hprice1.gdt dans Gretl WooldridgeI Régressez lprice sur llotsize, lsqrft, bdrms, colonial
I Pour tester : MCO puis post-estimationI Gretl propose 2 tests : White (1º forme), Breusch-Pagan, mais
pas Goldfeld-QuandtI Breusch-Pagan R homoscédasticitéI White (1º forme)¬RI Difficile de conclure
Économétrie II
Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité
Tests
Devoir #3 Hétéroscédasticité
Conception d’une feuille de tableur pour montrer l’effet del’hétéroscédasticité sur les coefficients estimés dans unerégression linéaire MCO à deux variables x1 et x2 et une constante.
1. Générer le terme d’erreur ✏ ; par exemple pour chaqueobservation i , générer d’abord un nombre aléatoire↵i 2 [1, 10], puis générer ✏i = ↵in (0, 1)
2. Illustrer que les MCO sont inconsistants ou non lorsqu’il y ahétéroscédasticité
3. Employer la formule classique de calcul de la matrice devariance-covariance des estimations MCO3.1 (pour les plus motivés) Montrer que la diagonale de cette
matrice ne s’approche pas des variances des coefficientsestimés en Monte-Carlo