Économétrie ii -...

Économétrie II

Économétrie IICh. 3. Hétéroscédasticité

L3 Économétrie – L3 MASS

Prof. Philippe Polomé, U. Lyon 2

Année 2016-2016

Économétrie II

Ch. 3. 9i : var (✏i ) = �2i : Hétéroscédasticité

Rappel

1. E (✏i ) = 0 8i : Espérance nulle2. var (✏i ) = �2 8i : Homoscédasticité3. cov (✏t , ✏s) = 0 8t 6= s : Pas d’auto-corrélation4. E (✏ixi ) = 0 8i : Exogénéité5. X La matrice X est de plein rang : Pas de multicolinéarité6. Le modèle est correctement spécifié7. La variable dépendante Y est continue

Économétrie II


Table des matières


DéfinitionSourcesConséquencesEstimer la matrice de variance-covarianceMoindres carrés pondérés “Weighted Least Squares”Tests

Économétrie II


Définition

Table des matières



Économétrie II


Définition

Définition du problème

I L’hypothèse d’homoscédasticité requiert que la variance destermes d’erreur soit la même pour chaque observation

I Il y a hétéroscédasticité dans le modèle Y = X� + ✏ lorsque :

var (✏) = E⇣✏✏

0⌘= ⌃✏ =

2

6664

�21 0

�22

. . .0 �2

N

3

77756= �2IN

Économétrie II


Définition

Représentation graphique

Économétrie II


Sources

Table des matières



Économétrie II


Sources

Données en moyenne

I S’il y a homoscédasticité dans les données de départ, lesdonnées en moyenne seront hétéroscédastiques

I yit avec var (yit) = 18i , t

I Mais on ne dispose que des moyennes 1Tg

Pt yit = yi où Tg

est la taille du groupeI Par ex : des moyennes régionales de données individuellesI var (yi ) =

1T2

gvar (

Pt yit) =

1T2

g

Pt var (yit) =

Tg

T2g= 1

Tg:

dépend de la taille du groupe

Économétrie II


Sources

Modèle à “coefficients aléatoires”

I Si le modèle sous-jacent est Yi = ↵+ (� + µi ) xi + ✏iI Par ex. effet de l’éducation sur le salaire

I Alors Yi = ↵+ �xi + µixi + ✏i = ↵+ �xi + ⌘iI Et, avec des termes d’erreurs ✏i et µi homoscédastiques et

indépendant et un régresseur xi non-stochastique, on trouveI var (⌘i ) = �2

✏ + �2µxi hétéroscédastique

I Semblable au cas suivant

Économétrie II


Sources

Régresseur manquant hétéroscédastique

I Si le modèle sous-jacent est yi = �0 + �1x1i + �2x2i + ✏iI Mais le modèle estimé est yi = �0 + �1x1i + µi

I Alors µi = �2x2i + ✏i donc,I si x2i n’est pas corrélé à ✏i , var (µi ) = �2

2var (x2i ) + �2

I si x2i n’est pas stochastique (analyse conditionnelle),var (µi ) = �2

2x2i + �2

I Hétéroscédastique sauf cas particulier

Économétrie II


Sources

Effet taille

I La variance est une mesure absolue, pas relativeI Imaginons que le CA de toutes les entreprises varie de 10%I 10% est un grand nombre pour une grande entreprise

I Part du revenu disponible dépensé en loisirsI Les familles à faibles revenus dépensent relativement peu en

loisirs. Les variations de ces dépenses entre ces familles sontdonc faibles

I Pour les familles avec des revenus importants, le montantmoyen relatif dépensé en loisirs sera plus élevé, et il y aura uneplus grande variabilité entre de telles familles

Économétrie II


Sources

Variables explicatives de la variance

I Un régresseur définit des groupes de variances différentesdans la variable expliquée

I Ex. Rendement de l’éducationI variance en productivité propre inobservable ✏ diffère selon les

niveaux h d’éducation atteintsI ln (salairei ) = ↵+ �educationh + Xi� + ✏i

Iavec i 2 h et var (✏i ) = �2

h = fonction (educationh)

I Similaire à l’effet tailleI

Faible éducation : salaire proche du minimum

I Également :I Qualité inobservée d’un bien par niveau de prixI Taux d’épargne par niveau de revenu

Économétrie II


Conséquences

Table des matières



Économétrie II


Conséquences

Propriétés de �I MCO restent sans biais (X non-stochastique par facilité)

E⇣�⌘= E

✓⇣X

0X⌘�1

X0(X� + ✏)

◆= �+

⇣X

0X⌘�1

X0E (✏) = �

I MCO consistants / convergents (sans démonstration)I Matrice de variance-covariance des coefficients estimés n’est

plus �2⇣X

0X⌘�1

, mais bien (sandwich)

⌃� = E

✓⇣� � �

⌘⇣� � �

⌘0◆=

⇣X

0X⌘�1

X0E⇣✏✏

0⌘X⇣X

0X⌘�1

=⇣X

0X⌘�1

X0⌃✏X

⇣X

0X⌘�1

I Théorème de Gauss-Markov ne s’applique plusI MCO n’est plus efficient

Économétrie II


Conséquences

Inférence

I Estimateur MCO✏0✏

N � k

⇣X

0X⌘�1

est biaisé pour ⌃�

I Tests d’hypothèse usuels post-estimation (t-stat, F-stat ouLM) invalides dans leur forme classique

I Le bootstrap reste par contre valideI

asymptotiquement comme toujours

I Comment faire face à ces conséquences ? 2 approchesI Estimer ⌃� à partir de MCO & refaire l’inférenceI Proposer un estimateur alternatif

IMoindres Carrés Pondérés

IVise à récupérer l’efficience

Économétrie II


Estimer la matrice de variance-covariance

Table des matières



Économétrie II



Estimateur robuste White (1980)

I On sait ⌃� =⇣X

0X⌘�1

X0⌃✏X

⇣X

0X⌘�1

sandwich

I Sauf cas particulier, ⌃✏ inconnueI White : Pour obtenir un estimateur de ⌃� , il suffit d’un

estimateur de X0⌃✏X (et pas de ⌃✏)

I Sous des conditions très générales, S = 1N

NX

i=1

✏2i XiX0i est un

estimateur consistant de 1NX

0⌃✏X

I ✏i = yi � X0

i �MCO résidu MCO iI Xi vecteur-colonne correspondant à l’observation i de X

IDonc XiX

0i est bien k ⇥ k

I Expliciter la matrice X0⌃✏X : intuition estimateur de White

Économétrie II



La matrice X0⌃✏Xk⇥k

=

2

6664

x11 x21 . . . xN1x12 x22 . . . xN2...

.... . .

...x1k x2k . . . xNk

3

7775

2

6664

�21 0

�22

. . .0 �2

N

3

7775

2

6664

x11 x12 . . . x1kx21 x22 . . . x2k...

.... . .

...xN1 xN2 · · · xNk

3

7775

=

2

6664

�21x11 �2

2x21 . . . �2NxN1

�21x12 �2

2x22 . . . �2NxN2

......

. . ....

�21x1k �2

2x2k . . . �2NxNk

3

7775

2

6664

x11 x12 . . . x1kx21 x22 . . . x2k...

.... . .

...xN1 xN2 · · · xNk

3

7775

Économétrie II



La matrice X0⌃✏Xk⇥k

=

2

66666666666664

NX

i=1

�2i x

2i1

NX

i=1

�2i xi1xi2 . . .

NX

i=1

�2i xi1xik

NX

i=1

�2i x

2i2 . . .

NX

i=1

�2i xi2xi2

. . . ...

symNX

i=1

�2i x

2ik

3

77777777777775

Comparer avec S = 1N

NX

i=1

✏2i XiX0i

Économétrie II



Matrice de variance-covariance “robuste”

I ⌃� = N⇣X

0X⌘�1

S⇣X

0X⌘�1

consistant pour ⌃�

I Peut-être utilisé pour tests usuels post-estimation

I Écart-types issus de White : “robustes à l’hétéroscédasticité”I Suggestion : corriger la matrice de White par n/ (n � k � 1)I Lorsque n �! 1 les deux approches sont équivalentes

I L’estimateur de White est seulement consistantI Pas sans biaisI Valable seulement asymptotiquementI Sur échantillons de petite taille

It de Student “de White” n’ont pas une distribution proche du t

ITests ont peu de puissance

IUtile de voir si Bootstrap mène aux mêmes résultats

Économétrie II



Matrice de White : logiciels

I La correction par la matrice de White est pré-programmée surtous les logiciels d’économétrie.

I Sous Gretl, cocher une case dans la boîte de dialogued’estimation

IPlusieurs variantes à la correction de White, manuel de Gretl

pour les détails

I Dans GRETLI Prenez les données hprice1.gdt dans Gretl WooldridgeI Régressez lprice sur llotsize, lsqrft, bdrms, colonialI Pour obtenir l’estimation “robuste” des t-stats

ICocher “erreurs standards robustes” (la constante n’est plus

significative)

Économétrie II


Moindres carrés pondérés “Weighted Least Squares”

Table des matières



Économétrie II




I Approche alternative à celle de White pour traiterl’hétéroscédasticité

I + ancienne

I Disposer d’informations supplémentaires sur la forme del’hétéroscédasticité rencontrée permet toujours de dériver unestimateur plus efficient que celui donné par l’estimation“robuste”

I Donc si on connait la forme de l’hétéroscédasticité, on devraitpouvoir obtenir un gain en efficience

I L’idée générale est de transformer les données de sorte à ceque les erreurs deviennent homoscédastiques

Économétrie II



Forme de l’hétéroscédasticité connue à une constante près

I Supposons que l’hétéroscédasticité puisse être modélisée sousla forme var (✏|X ) = �2h (X )

I On peut alors écrire ⌃✏ = �2

0

BBBB@

h1 0 · · · 0

0 h2...

... . . .0 · · · hN

1

CCCCA= �2

avec hi = h (Xi ) > 0I Si on réécrit le modèle Y = X� + ✏

I sous la formeYiphi

=Xiphi� +

✏iphi

I alors le terme d’erreur est homoscédastique

Économétrie II



Remarque

I Le résidu MCP est ✏⇤ = Y ⇤ � X ⇤�MCP

I Le but de MCP est minimiser laP

des carrés des résidus surles données transformées :min ✏⇤0 ✏⇤ = min

Pi

⇣Y ⇤i � X ⇤

i �MCP

⌘2

= minP

i

✓Yiphi

� Xiphi�MCP

◆2

= minP

i

⇣Yi � Xi �MCP

⌘2/hi

I Chaque observation est pondérée par l’inverse de sa varianceI Plus une observation a une variance élevée, moins elle pèse

dans la somme des carrés des résidusI La qualité de l’ajustement (R2) aux données originales n’est

donc plus recherchée : R2 n’est plus une mesure intéressante

Économétrie II



MCP en pratique

I Il faut connaître la forme de l’hétéroscédasticitéI Dans la plupart des cas on ne sait rien sur cette formeI Il faut donc un estimateur de h (X ) ou éventuellement d’autres

formes h (X ,Z )

I Moindres Carrés Pondérés Faisables / Feasible WeightedLeast Squares

Économétrie II



MCP Faisable

I On suppose une forme simple de typeh (Xi ) = exp (�0 + �1x1i + �2x2i + ...)

I exp garanti la positivitéI var (✏i |Xi ) = �2 exp (�0 + �1x1i + �2x2i + ...)

I Comme MCO est sans biais en présence d’hétéroscédasticité,✏i

2 peut être vu comme une estimation de var (✏i |Xi )

I ✏2i = �2 exp (�0 + �1x1i + �2x2i + ...) ⌫i ; ⌫ terme d’erreur

I Estimer ln�✏2i�= ↵0 + �1x1i + �2x2i + ...+ ln (⌫i ) par MCO

I On peut rajouter des régresseurs Z + X dans cette équation

I Estimation de hi : hi = exp⇣↵0 + �1x1i + �2x2i + ...+1

2 �2⌫

⌘

I Il faut ajouter un terme en variance au carré parce que exp estnon-linéaire (Verbeek) – sans démonstration

Économétrie II



Mise en garde sur les MCP faisables

I Dans le doute sur la présence et la forme de l’hétéroscédasticitéI il peut être tentant de prendre une forme usuelle et d’appliquer

les MCPI D’autant plus tentant si le logiciel utilisé propose une

procédure simple

I MaisI Si les termes d’erreurs sont homoscédastiques au départ,

Il’estimateur des MCPF pourra être biaisé et inconsistant

IPar monte-carlo, on voit que ce sont des configurations peu

courantes

I Si l’hétéroscédasticité dépend d’une variable inconnue,I

ou ne dépend pas d’une variable,

Iil peut être difficile d’apporter une correction significative

Économétrie II



Comparaison des deux approchesI Approche 1 : MCP

I �MCP 6= �MCO

I Approche historique, en principe meilleure que MCOI

Si l’hyp sur forme de l’hétéroscédasticité est correcte

IPermet alors un gain d’efficience

I Mais risques l’hyp est fausse

I Approche 2 :\

var⇣�MCO

⌘robuste

I On garde les �MCO

I 2.a. White : basé sur un résultat plus récent (1980) que MCP ;requiert une plus grande puissance de calcul

I 2.b. bootstrap : puissance de calcul encore plus grandeI 2.a et 2.b : pas d’hypothèses supplémentaires par rapport à

MCO mais seulement valables pour de grands échantillonsI Évite de tester l’hétéroscédasticité

Iet de chercher quelle forme elle pourrait prendre

I Renonce au gain potentiel d’efficience

Économétrie II



Importance de l’hétéroscédasticité en pratique

I L’hétéroscédasticité est la norme avec les données micro encoupe transversale

I L’homoscédasticité est l’exceptionI On va habituellement utiliser White / bootstrap

IPlus rarement MCP / MCG

I Pas aussi évident pour les séries temporellesI Car c’est toujours la même unité qui est observéeI White est aussi disponible

IMais existence de modèles alternatifs propres

Économétrie II



Exemple dans Gretl

I Prenez les données hprice1.gdt dans Gretl WooldridgeI Régressez lprice sur llotsize, lsqrft, bdrms, colonial

I Moindres Carrés Pondérés : “Modèle” – “autres modèleslinéaires” – “MCP”

I Un seul régresseur est associé à l’hét.I Une façon alternative est “Hétéroscédasticité corrigée” qui

impose une correction “à la White”I

c’est-à-dire : l’hét. est approximée à partir d’une regression

contenant les régresseurs et leurs carrés

Icomme dans le test de White (plus loin)

Économétrie II


Tests

Table des matières



Économétrie II


Tests

Principe des tests d’hétéroscédasticité

I On n’observe jamais les vrais termes d’erreur.I On les “estime” à partir des résidus de la régression par MCO ✏i

I “car” MCO sans biais en présence d’hétéroscédasticité

I 3 tests populairesI Breusch-PaganI WhiteI Goldfeld-Quandt

Économétrie II


Tests

Test de Breusch-Pagan

I On veut tester H0 : var (✏i |x1i , ..., xki ) = �2 8iI Equivalent à tester H0 : E

�✏2i |x1i , ..., xki

�= �2 8i car E (✏) = 0

I Si on suppose que la relation entre ✏2i et Xi est suffisammentproche du linéaire

I ✏2i = �0 + �1x1i + ...+ �kxki + ⌫I Alors tester H0 revient à tester H0 : �1 = �2 = ... = �k = 0

I Régresser carré des résidus ✏2i sur toutes les variablesexplicatives X

I Tester significativité globale via la procédure habituelle (F-testou LM-test)

Économétrie II


Tests

Test de White

I Test de Breusch-Pagan permet de détecter les formes linéairesd’hétéroscédasticité

I Test de White permet de prendre en compte certainesnon-linéarités en utilisant les carrés et les produits croisés detoutes les variables explicatives

I Même procédure que Breusch-PaganI En introduisant tous les x2

j et les xjxmI Et en testant que les paramètres associés sont conjointement

significatifs (F-test ou LM-test)I Rapidement : nombre de paramètres à estimer impraticable. . .

IEn proba (5%) erreur type I : ¬R H0 fréquente

Économétrie II


Tests

Forme alternative du test de WhiteI Les valeurs ajustées yi = Xi � sont fonction de toutes les X

I y2 est une fonction des carrés x2j et des produits croisés xjxm

I y2 peut être utilisé pour représenter les non-linéaritésI On peut utiliser y pour représenter tous les X à la fois

I Procédure1. Régresser le carré des résidus MCO ✏2i sur les valeurs ajustées

yi et y2i

2. F-test ou un LM-test sur la significativité globale de cetterégression

I On ne teste plus que les coef. de ces 2 paramètresI Ce test repose sur une hypothèse forte concernant la forme de

l’hétéroscédasticitéI Celle-ci est fonction des variables inclusesI N’impose pas la linéarité de cette forme (on peut étendre aux

cubes...)

Économétrie II


Tests

Test de Goldfeld-QuandtI Dans le cas où la théorie permet d’envisager une

hétéroscédasticité causée par une seule explicative xm

1. Trier les observations par les valeurs de la variable explicativesoupçonnée source d’hétéroscédasticité

I et donc corrélée avec ✏2i2. Supprimer la partie des données triées qui se trouve au milieu

de l’échantillonI entre 1/3 et 1/5 des données

3. Estimations séparées (MCO) sur les deux sous échantillons :hautes et basses valeurs de xm

4. Les rapport des variances estimées des termes d’erreur desdeux régressions suit une distribution de Fisher

I GQ =�2

1�2

2⇠ FN1�K ,N2�K

I N1 � K = nombre de degrés de liberté de la 1ère régression

Économétrie II


Tests

Exemple dans Gretl

I Prenez les données hprice1.gdt dans Gretl WooldridgeI Régressez lprice sur llotsize, lsqrft, bdrms, colonial

I Pour tester : MCO puis post-estimationI Gretl propose 2 tests : White (1º forme), Breusch-Pagan, mais

pas Goldfeld-QuandtI Breusch-Pagan R homoscédasticitéI White (1º forme)¬RI Difficile de conclure

Économétrie II


Tests

Devoir #3 Hétéroscédasticité

Conception d’une feuille de tableur pour montrer l’effet del’hétéroscédasticité sur les coefficients estimés dans unerégression linéaire MCO à deux variables x1 et x2 et une constante.

1. Générer le terme d’erreur ✏ ; par exemple pour chaqueobservation i , générer d’abord un nombre aléatoire↵i 2 [1, 10], puis générer ✏i = ↵in (0, 1)

2. Illustrer que les MCO sont inconsistants ou non lorsqu’il y ahétéroscédasticité

3. Employer la formule classique de calcul de la matrice devariance-covariance des estimations MCO3.1 (pour les plus motivés) Montrer que la diagonale de cette

matrice ne s’approche pas des variances des coefficientsestimés en Monte-Carlo

Économétrie ii -...

Documents