回帰分析 重回帰 (1)

27
回回回回 回回回 (1)

Upload: wynter-graham

Post on 03-Jan-2016

131 views

Category:

Documents


0 download

DESCRIPTION

回帰分析 重回帰 (1). 項目. 重回帰モデルの前提 最小二乗 推定量の性質 仮説 検定(単一の制約) 決定 係数 Eviews での 回帰分析の実際 非線形 効果 ダミー変数 定数項ダミー 傾き のダミー 3 つ以上のカテゴリー. 重回帰モデル multiple regression model. 説明変数が 2 個以上. 他の説明変数を一定に保っておいて, x i だけを 1 単位増加させたときに y が何単位増えるか 他の要因をコントロールした x i 固有の影響. 重回帰モデル 前提. 線型モデル(パラメータに関し) - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 回帰分析 重回帰 (1)

回帰分析重回帰 (1)

Page 2: 回帰分析 重回帰 (1)

項目• 重回帰モデルの前提• 最小二乗推定量の性質

– 仮説検定(単一の制約)– 決定係数

• Eviews での回帰分析の実際• 非線形効果• ダミー変数

– 定数項ダミー– 傾きのダミー– 3 つ以上のカテゴリー

Page 3: 回帰分析 重回帰 (1)

重回帰モデル multiple regression model

• 説明変数が 2 個以上

uxxxy kk 2211

ii x

y

他の説明変数を一定に保っておいて, xi だけを 1 単位増加させたときに y が何単位増えるか

他の要因をコントロールした xi 固有の影響

Page 4: 回帰分析 重回帰 (1)

重回帰モデル前提

1. 線型モデル(パラメータに関し)2. 誤差項の期待値は 0

3. 誤差項は互いに独立4. 誤差項の分散は一定(分散均一性)5. 誤差項は正規分布に従う

– BLUE の成立のためにはこの条件は不要

ikikiii uxxxy 2211

Page 5: 回帰分析 重回帰 (1)

最小二乗法• 残差平方和を最小にするようにパラメータを決

定– a,b1,b2,..,bk : 未知パラメータ a,b1,b2,..bk の推定値– ei : 残差

n

ikikiii

n

iik

xbxbxbay

ebbbaS

1

22211

1

221 ),..,,,(

Page 6: 回帰分析 重回帰 (1)

最小二乗推定量

n

iie

knRSS

kns

1

22

)1(

1

)1(

1

誤差項の分散の推定量

k+1は説明変数の個数(定数項と x)SER (standard error of the regression)

jxx

jjj

jj

Sab

bE2

2)var(

)(

Sxxj   : 説明変数 xj の平

方和( xj を他の説明変数に回帰したときの残差の平方和)

Page 7: 回帰分析 重回帰 (1)

仮説の検定

1,0~2

NS

bj

xx

)1(~).(. 2

00

kntSs

b

bes

bj

xx

jj

j

jj

H0: bj=bj0

k+1は説明変数の個数(定数項とx )

Page 8: 回帰分析 重回帰 (1)

当てはまりの良さ• TSS=ESS+RSS

TSS

RSS

TSS

ESSR 12

)1/(1

)1/(

)1/(1

22

nTSS

s

nTSS

knRSSR

決定係数

自由度修正済み決定係数 adjusted R2

説明変数の数 k を増やしていけば, R2 は単調に増加する

説明変数の増加にペナルティーを課すように修正した R2

Page 9: 回帰分析 重回帰 (1)

単回帰での結果  wage1.raw

Page 10: 回帰分析 重回帰 (1)

重回帰での結果

Page 11: 回帰分析 重回帰 (1)

重回帰での結果 (2)

-8

-4

0

4

8

12

16

0 4 8 12 16 20

EDUC

RE

SID

-8

-4

0

4

8

12

16

0 10 20 30 40 50

TENURE

RE

SID

-8

-4

0

4

8

12

16

0 10 20 30 40 50 60

EXPER

RE

SID

-8

-4

0

4

8

12

16

-4 0 4 8 12 16

WAGEHAT

RE

SID

Page 12: 回帰分析 重回帰 (1)

被説明変数を ln(wage) にした場合

• Educ が 1 年増加すると賃金は 9.2%上昇

• Exper が 1 年増加すると賃金は 0.4%増加

• Tenure が 1 年増加すると賃金は 2.2%増加

ここをクリックすると, RepresentationEstimation outputCoefficient DiagnosticsResidual Diagnosticsなどのメニューが表れる(この画面はEstimation Output)

Page 13: 回帰分析 重回帰 (1)

-2.5

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

0 4 8 12 16 20

EDUC

RE

SID

-2.5

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

0 10 20 30 40 50

TENURE

RE

SID

-2.5

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

0 10 20 30 40 50 60

EXPER

RE

SID

-2.5

-2.0

-1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

0.4 0.8 1.2 1.6 2.0 2.4 2.8

LWAGEHAT

RE

SID

Page 14: 回帰分析 重回帰 (1)

非線形効果

ezbxbxbay 32

21

xbbx

y21 2

説明変数 x の 2 次の項を説明変数として加える

係数の意味

x が 1 単位増加したとき y に与える効果x の水準に依存する

係数の意味の直感的な把握の仕方• b1,b2 の値をもとに x が与えられた場合の ∂ y/∂x の大きさを計算する( Excel

の活用)• Eviews の中では,例えば, x が平均値をとる場合の効果についてはコマンド

ラインで  scalar dydx = @coefs(i) + @coefs(i+1)* @mean(x)

とするとスカラー変数 dydx が作成される( @coefs(i) 直前の回帰の i 番目の係数( x の係数:定数項は 1 番目とする) ,   @coefs(i+1): x^2 の係数, @mean(x) 変数 x の平均値)

Page 15: 回帰分析 重回帰 (1)

tenure の 2 乗項を加えた回帰

Page 16: 回帰分析 重回帰 (1)

Eviews での回帰分析の統計量• スカラー変数

@regobs オブザベーション数, @f F 統計量, @ssr  残差平方和その他  @aic, @coefs(i), @stderrs(i), @tstats(i), @dw, @r2, @rbar2

• ベクトル変数@coefs  係数ベクトル  @coefs(i) で i 番目の説明変数の係数(定数項が 1 番目), @stderrs  係数の標準誤差, @tstats   t値

コマンド行で scalar var1 = @ssr

vector var2 = @coefs

とタイプすると var1 や var2@ssr, @coefs の中身が保存される

Page 17: 回帰分析 重回帰 (1)

問題 (1)

• ln(wage) を被説明変数にし, educ, exper, tenure, tenure の 2 乗を説明変数にして回帰分析を行え。– wage1.raw のデータを用いる

• tenure の範囲を調べよ。• tenure が 1 年増加したとき, wage は何 % 増加

するか– tenure=0, 5, 10, 20, 30, 40 のそれぞれの場合につい

て• 上の回帰分析の係数の値を用い, tenure と

wage の関係をグラフで表せ。• educ の2乗を説明変数に加えるとどうなるか。

Page 18: 回帰分析 重回帰 (1)

ダミー変数

• 質を表す変数– 女性ならば 1 ,そうでなければ 0– 結婚していれば 1 .そうでなければ 0– 大学卒ならば 1 ,そうでなければ 0

• educ, wage, exper はこれに対し連続変数• 一般に, 0 または 1 をとるような変数を

ダミー変数と呼ぶ

Page 19: 回帰分析 重回帰 (1)

ダミー変数 (2)

• 定数項ダミー• 傾きに関するダミー• 3 つ以上のカテゴリーを持つ変数の場合

– 学歴• 中卒または高校中退• 高卒,大卒未満• 大卒以上

– 職業• 事務職• 研究職• 営業• 現場

Page 20: 回帰分析 重回帰 (1)

educbfemalebawage 21)ln(

educ

ln(wage)female=0 の場合

female=1 の場合

educbawage 2)ln(

educbbawage 21)ln(

b2

b2a

a+b1

図は b1<0の場合

定数項ダミー

Page 21: 回帰分析 重回帰 (1)

educfemalebeducbfemalebawage 321)ln(

educ

ln(wage)female=0 の場合

female=1 の場合

educbawage 2)ln(

educbbbawage )()ln( 321

b2

b2+b3a

a+b1 図は b1<0, b3>0の場合

傾きのダミー

Page 22: 回帰分析 重回帰 (1)

問題 (2)

• female ダミー変数を説明変数に加えた回帰を行え– 被説明変数  ln(wage)– 説明変数  educ, exper, tenure, female

• 賃金の男女格差は存在するか• 学歴の効果に男女格差が存在するか

– educ と female の交差項を作成する• exper, tenure の効果に男女格差が存在す

るか

Page 23: 回帰分析 重回帰 (1)

問題 (3)• 次の回帰を行う• 被説明変数  ln(wage)• 説明変数  educ, tenure, exper, female,

female*educ, female*tenure, female*exper• 男女別に回帰分析を行う

– EViews のメニューで sample を選択 If condition..のボックスに条件式を記入

– female=0 とすれば男性のみ, female = 1 とすれば女性のみ ; 戻すときは sample で条件式を消す

– 説明変数を  educ, tenure, exper として回帰– ダミー変数を用いた回帰と結果を比較せよ。

Page 24: 回帰分析 重回帰 (1)

3 つ以上のカテゴリー

• 例)学歴– 中卒 , 高卒(短大卒を含む) , 大卒 の 3 つのカテゴリー

• この場合, 2 つのダミー変数をつくる– 中卒をベースにした効果– D1: 中卒とした比較した高卒の効果– D2: 中卒と比較した大卒の効果– 高卒と大卒の比較は ?– 3 つダミー変数を作るとどうなるか?

• N種類のカテゴリー N-1 個のダミー変数

中卒 高卒 大卒

D1 0 1 0

D2 0 0 1

Page 25: 回帰分析 重回帰 (1)

問題 (4)• 結婚ダミーが賃金に与える影響を調べよ

– married (結婚していれば 1 )• 結婚が賃金に与える影響は男女間で異なるかもしれない

– 結婚 × 男女 の組み合わせで 4通り– married と female のそれぞれの組合せの観測度数を調べよ

• 二つの変数 (married と  female) を選択して,グループとして開く

• Menu から View/N way tabulation クロス集計票– 被説明変数  ln(wage), 説明変数 female, married,

female*married, + educ, exper, tenure として回帰 – female*married 適当な名前で新しい変数を作る– female, married, female*married の係数の意味は– 定数項の大きさは?

• 男性既婚,男性独身,女性既婚,女性独身

Page 26: 回帰分析 重回帰 (1)

問題( 5 )• 教育年数の影響は,連続変数で捉えるのではなく,

学歴別に調べた方がよいかもしれない

• 教育年数の分布を調べよ• 教育年数から次のような学歴ダミー変数を作れ

• 高卒未満  ( educ < 12)• 高卒以上 大卒未満  (12 <= educ <16)• 大卒 以上  (16 <= educ)

• 次の回帰分析を行え– 被説明変数: ln(wage) ,説明変数:学歴ダミー,そ

の他の変数  (exper, tenure, female)

Page 27: 回帰分析 重回帰 (1)

変数の作成方法メニューの Genr ボタンをクリック新変数を作成する画面で次のように記述

ED1 = (educ<16) and (educ>=12)ED2 = (educ>=16)

ED1は高卒ダミー, ED2 は大卒ダミー(中卒がベース)(educ<16)等は論理式

(   ) の中が真なら 1 ,偽なら 0and / or

ED1 は educ が 12 年以上かつ 16 年未満の時に限り 1 ,それ以外は 0 。ED2 は educ が 16 年以上の時に限り 1 ,それ以外は 0 。