bağımlı kukla değişkenlerkisi.deu.edu.tr/hamdi.emec/eko2/bağımlı kukla...

Bağımlı Kukla Değişkenler

1

•Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin

varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla

değişkenler söz konusudur.

•Bu durumdaki modelleri tahmin etmek için dört yaklaşım vardır:

-Doğrusal Olasılık Modeli

-Logit Modeli

-Probit Modeli

-Tobit Modeli

Doğrusal Olasılık Modeli

2

Yi = b1 + b2Xi +ui

Yi= 1 Eğer i. Birey istenen özelliğe sahipse

0 Diğer Durumlarda

Xi= Bağımsız değişken

Bu modele olasılıklı model denmesinin nedeni, Y’nin X için şartlı

beklenen değerinin, Y’nin X için şartlı olasılığına eşit olmasıdır.

E(Yi|Xi)=Pr(Yi=1| Xi)


3

E(Yi |Xi)= b1 + b2Xi E(ui) = 0

Yi değişkeninin olasılık dağılımı:

Yi Olasılık

0 1-Pi

1 Pi

Toplam 1

E(Yi |Xi) = SYiPi=0.(1-Pi) + 1.(Pi) = Pi

E(Yi |Xi)= b1 + b2Xi = Pi

0 E(Yi |Xi) 1

DOM Tahminindeki Sorunlar

4

ui hata teriminin normal dağılmayışı:

•Normallik varsayımının sağlanmaması durumunda tahmin

ediciler sapmasızlıklarını korurlar.

•Nokta tahminde normallik varsayımı gözardı edilir.

•Örnek hacmi sonsuza giderken EKK tahmincileri çoğunlukla

normal dağılıma uyarlar

•DOM ile yapılan istatistiksel çıkarsamalar normallik varsayımı

altındaki EKK sürecine uyarlar

u’ların Binom Dağılımlı Olması

EKKY varsayımlarından biri u değerlerinin dağılımının normal

olmasıdır. Bu varsayım sayesinde katsayı tahminlerinin güven

aralıkları hesaplanıp, test yapılabilmektedir.

DOM’de u’lar normal dağılmaz, binom dağılımı gösterir:

1 2i iu Y b b X

1 2i iY b b X u

Y 1 ve 0 değerini aldığında

Yi =1 için 1 21i iu b b X

Yi =0 için 1 2i iu b b X

u lar normal değildir. İki değerli binom dağılımlıdır. Ancak

büyük örneklerde DOM güven aralıkları ve hipotez testleri

geçerlidir ve EKKY normal dağılım varsayımının sağlandığı

kabul edilmektedir. 5

Yi ui İhtimal=P(ui)

0 -b1-b2X (1-Pi)

1 1-b1-b2X Pi

2 2

i 1 2 i 1 2 iVar(u ) ( b b X) (1 P ) (1 b b X) (P )

i 1 2 1 2Var(u ) (b b X)(1 b b X)

ui hata teriminin değişen varyanslı olması:

)(.)()( 2

ii YPYYYVar

DOM’de u lar eşit varyanslı değillerdir. Bunun için kesikli bir Y

değişkeni varyansından hareketle

Y yerine u alınarak

)(.)()(.)()( 22

ii uPuuPuuuVar

i i i i iVar(u ) E(Y | X )[1 E(Y | X )] P (1 P ) 6

u’nun varyansı farklıdır. u’nun varyansı Y’nin X için şartlı

beklenen değerine bağlıdır ve sonuçta u’nun varyansı X’in

değerine bağlı olacak ve eşit olmayacaktır.

DOM’nin EKKY ile tahmininde ortaya çıkan farklı varyans

problemine aşağıdaki dönüşümlü modeli tahmin ederek çözüm

getirmek mümkündür:

1 2 i i

i i i i

b b X uY

v v v v

i i i i iv E(Y | X )[1 E(Y | X )] P (1 P )

ui hata teriminin değişen varyanslı olması:

•Var(ui) = Pi(1-Pi)

7

DOM’de Farklı Varyansı Önleme

i i iˆ ˆv Y (1 Y )

iE(Y | X ) ler bilinmediğinden bunun yerine örnek tahmini ˆiY

değerleri hesaplanarak ifadesinde yerine

konur.

0 E(Yi |Xi) 1 varsayımının yerine gelmeyişi

DOM’de Y’nin şartlı olasılığını gösteren E(Y|X) nın 0 ila 1

arasında bulunması şarttır. Y; 0 ve 1 değerini almaktadır.Bu şart

anakütle için geçerlidir. Anakütlenin tahmincisi için geçerli

olmayabilir.

Tahmini şartlı olasılıklar 0 ile 1 olmayabilir:

ˆiY

8

0 E(Yi |Xi) 1

0 ile 1 arasında mıdır? DOM”, EKKY ile elde edildikten sonra:

îY

eşit olduğu kabul edilir.

1- Bunlardan bir kısmı 0 dan küçük, negatif değerli ise, bunlar için îY

0 değerini alır. 1’den büyük değerli ise bunlar için nin 1’e

9

îY

0.999 değeri verilir.

2- Bunlardan bir kısmı 0 dan küçük, negatif değerli ise, bunlar için îY

0.001 değerini alır. 1’den büyük değerli ise bunlar için ne

10

u

veşit varyanslıdır. Bu yöntem Tartılı En Küçük Kareler

Yöntemi (TEKKY) olarak adlandırılır.

Dönüştürmeden sonra EKKY tekrar uygulanır ve farklı varyansın

kalktığı görülebilir.

3- Bunlardan bir kısmı 0 dan küçük, negatif değerli ve 1’den büyük

değerli ise bu gözlemler atılır.

11

R2 Değerinin Genellikle Küçük Çıkarak, İlişkinin

Uyumunu Gösteren Bir Ölçü Olamaması

Belli bir X’e karşılık gelen Y, ya 0 ya da 1’dir. Öyleyse bütün Y

değerleri, ya X ekseni ya da 1’in hizasındaki doğru üzerinde yer

alır. Genellikle klasik En Küçük Kareler yöntemi ile hesaplanan

R2 , böyle modellerde 1’den çok küçük çıkma eğilimindedir.

Çoğu uygulamada R2 , 0.2 ile 0.6 arasında yer alır. Tahmin edilen

Yi , ya 0’a ya da 1’e yakın çıkacaktır.

Bu nedenle John Aldrich ile Forrest Nelson ‘Nitel bağımlı

değişkeni olan modellerde, belirlilik katsayısının bir özetleme

istatistiği olarak kullanılmasından kaçınılması gerektiğini ileri

sürmektedir (Gujarati, 1995:546).


12

Di = b1 + b2Mi +b3 Si +ui

Di= 1 Eğer i. Kadının bir işi varsa ya da iş arıyorsa

0 Diğer Durumlarda

Mi= 1 Eğer i. Kadın evliyse ve diğer durumlarda 0

Si = i.kadının yıl olarak aldığı eğitim

Di Mi Si Di Mi Si

1 0 16 1 0 10

1 1 14 1 1 14

1 1 16 0 1 10

0 0 9 0 1 12

1 0 12 1 0 13

0 1 12 1 0 14

1 0 14 1 1 12

1 0 10 0 1 7

0 0 12 0 1 11

1 0 8 0 1 12

1 0 11 1 1 10

1 0 14 1 0 15

0 1 12 0 1 10

1 1 13 0 1 11

0 1 9 1 1 12

Kadının İşgücüne Katılımı

Modeli:

Di= 1 i.Kadının bir işi varsa

ya da iş arıyorsa

0 Diğer Durumlarda

Mi= 1 i. Kadın evliyse

0 diğer durumlarda


13

Kadının İşgücüne Katılımı Modeli

14

Di = b1 + b2Mi +b3 Si +ui

Dependent Variable: DI

Included observations: 30

Variable Coefficient Std. Error t-Statistic Prob.

C -0.284301 0.435743 -0.652452 0.5196

MI -0.381780 0.153053 -2.494430 0.0190

SI 0.093012 0.034598 2.688402 0.0121

R-squared 0.363455 Mean dependent var 0.600000

Adjusted R-squared 0.316304 S.D. dependent var 0.498273

S.E. of regression 0.412001 Akaike info criterion 1.159060

Sum squared resid 4.583121 Schwarz criterion 1.299179

Log likelihood -14.38590 F-statistic 7.708257

Durbin-Watson stat 2.550725 Prob(F-statistic) 0.002247

Mi= 1 Kadın evliyse ;0 diğer durumlarda ;


15

Daha sonra modelde değişen varyans olup olmadığı araştırılmak istenmiş ve White testi

ile modelde değişen varyans problemi test edilmiştir.

White Heteroskedasticity Test:

F-statistic 1.759076 Probability 0.138742

Obs*R-squared 6.589061 Probability 0.143265

Prob değeri 0.143265>0.05 olduğu için H0 hipotezi olan Değişen varyans

yoktur, eşit varyans vardır hipotezi red edilemez. Test sonucu değişen

varyans problemi ile karşılaşılmadığından herhangi bir işlem yapılmaz.

Model olduğu gibi kabul edilir.

UYGULAMA:Akıllı telefonunun kullanılıp kullanılmamasını ifade eden bağımlı

kukla değişken 50 kişiye yapılan anket sonuncunda yaş ve aylık ortalama gelir ile

açıklanmıştır.(Y=1, akıllı telefona sahip ise, Y=0 akıllı telefona sahip değilse)

Kişi Y X(Gelir) Z(Yaş) Kişi Y X(Gelir) Z(Yaş) 1 1 250 23 26 0 185 21

2 1 350 21 27 1 250 21

3 0 150 23 28 1 500 21

4 1 600 22 29 1 790 23

5 1 200 22 30 1 500 22

6 0 150 20 31 1 675 22

7 1 390 27 32 1 490 22

8 0 200 18 33 1 500 21

9 0 900 25 34 1 760 21

10 0 150 18 35 1 550 26

11 0 255 18 36 1 400 24

12 0 300 20 37 1 200 21

13 1 640 25 38 0 220 21

14 1 500 27 39 1 175 23

15 1 300 22 40 1 840 21

16 0 550 19 41 1 150 23

17 1 800 18 42 1 200 23

18 1 875 21 43 1 200 23

19 0 600 17 44 1 485 23

20 0 500 20 45 1 250 21

21 0 500 19 46 1 300 20

22 1 500 21 47 1 470 19

23 1 550 22 48 1 800 23

24 1 750 21 49 0 250 21

25 1 225 23 50 0 130 23

16

Dependent Variable: Y

Method: Least Squares



C -1.373086 0.585035 -2.347017 0.0232

X 0.000492 0.000259 1.900372 0.0635

Z 0.086130 0.026781 3.216041 0.0024







Y=1, akıllı telefona sahip ise, Y=0 akıllı telefona sahip değilse; X(Gelir); Z(Yaş)

17

Önce Modelde değişen varyansın olup olmadığı White testi

ile araştırılır.

18

White Heteroskedasticity Test:

F-statistic 2.305076 Probability 0.010504

Obs*R-squared 10.37848 Probability 0.01195

1. Prob değeri 0.01195<0.05 olduğu için H0 hipotezi olan

Değişen varyans yoktur, eşit varyans vardır hipotezi red

edilir. Değişen varyans problemi ile karşılaşıldığından

önce hesaplanır.

2. ‘nin 0’dan küçük değerleri ve 1’den büyük değerleri veri

setinden çıkartılır..

3. Ardından hesaplanır.

4. Y= b1 + b2 X + b3 Z modelinin her iki tarafı da

değerine bölünür.

5. Model tahmin edilir.

vi

Y

Y

i i iˆ ˆv Y (1 Y )

Kişi Kişi Kişi Kişi

1 0.7308 16 0.5338 31 0.8536 46 0.4970

2 0.6077 17 0.5705 32 0.7627 47 0.4944

3 0.6817 18 0.8658 33 0.6815 48 1.0012

4 0.8167 19 0.3861 34 0.8093 49 0.5586

5 0.6201 20 0.5953 35 1.1367 50 0.6718

6 0.4233 21 0.5092 36 0.8907

7 1.1442 22 0.6815 37 0.5340

8 0.2756 23 0.7922 38 0.5438

9 1.2226 24 0.8044 39 0.6939

10 0.2510 25 0.7185 40 0.8486

11 0.3026 26 0.5266 41 0.6817

12 0.4970 27 0.5586 42 0.7062

13 1.0948 28 0.6815 43 0.7062

14 1.1982 29 0.9963 44 0.8463

15 0.6693 30 0.7676 45 0.5586

Y

Y

Y

Y

19

Dependent Variable:


Sample: 1 50


Excluded observations: 6


-1.960127 0.591996 -3.311048 0.0019

0.000468 0.000170 2.754280 0.0087

0.114551 0.028194 4.062939 0.0002



S.E. of regression 0.812241 Akaike info criterion2.487706




1/ v

Y / v

X / v

Z/ v

20

21

Örnek büyüklüğü arttıkça hata terimi normal dağılıma

yaklaşsa ve değişen varyans durumunda, ağırlıklı en küçük

kareler yöntemi kullanılsa, modelin her iki tarafı ye

bölünüp model değişimi yapılsa bile normallik ve değişen

varyans varsayımlarıyla ilgili sakıncaları giderebilmek için

logit ve probit modeller geliştirilmiştir. Bu modeller, hem

şartını sağlayabilmekte ve hem de Pi

ile Xi arasındaki ilişkiyi doğrusallıktan kurtarabilmektedirler.

Yani, logit ve probit modelleri, farklı bağımsız X

değişkeninin olasılığının 0 ile 1 arasında kalmasını

sağladıkları gibi; ayrıca, değişik bağımsız değişkene ait belli

bir artış karşısında, bu bağımsız değişkenin kullanılma

olasılığının değişik miktarda artmasını sağlamaktadırlar.

vi

1)(0 ii XYE

DOM’e Alternatif Model Arama


22

Günümüzde nitel değişkenlerden oluşan kukla değişken

verileri analiz etmek için çeşitli teknikler kullanılmaktadır.

Bunlardan log-linear modeller iki veya daha fazla kukla

değişkenin koşullu ilişkisini analiz etmek için geliştirilmiştir.

Bununla birlikte, log-linear modeller sayesinde, değişkenlerin

oluşturduğu bileşik dağılımı, iki veya daha fazla değişkenin

birbirine bağımlı olup olmadığını ve iki veya daha fazla

değişken arasındaki ilişkiyi neden-sonuç ilişkisine

dayandırmaksızın test etmek mümkündür.


23

•DOM ile ilgili sayılan sorunların hepsi bir şekilde aşılabilir

•Ancak, DOM, Pi=E(Y=1|X) olasılığının X’le doğrusal olarak

arttığını varsayar. Yani X’deki marjinal veya küçük bir artış

hep sabittir. Gerçek hayatta ise bu beklenen bir durum değildir.

•DOM ile ilgili sorunlar şu iki özellik sayesinde aşılabilir:

1.Xi arttıkça Pi=E(Y=1|X)’de artar ancak 0 ile 1 aralığının dışına

çıkmaması gerekmektedir.

2.Pi ile Xi arasındaki ilişkinin doğrusal olmaması gerekmektedir.


24

Yukarıdaki iki özelliği taşıyan modelin şekli aşağıda verilmiştir:

0

1 P

- + X

KDF

•Yukarıdaki eğri kümülatif dağılım fonksiyonuna benzemektedir.

•Bu fonksiyon kukla bağımlı değişkenli regresyon modellerinde

kullanılabilir.

Logit Model

25

Logit modeller, genelleştirilmiş doğrusal modelin belirli

koşullar altında oluşturulmuş özel durumlarıdır. Bu durumda,

eğer bağımsız değişkenlerin bazısı sürekli veya uygun (ilgili)

sınıflar içine ayrıştırılamazsa, o zaman log-linear analiz yerine

logistik regresyon kullanılmalıdır. Aynı zamanda eğer

değişkenlerin bazısı bağımlı olarak ele alınırsa, o zaman logit

model uygundur. Böyle bir durumda 0’la 1 arasında kalma

koşulunu sağlayabilmek için logit modelin uygulanması

önerilmektedir. Logit model, bağımlı değişkenin tahmini

değerlerini olasılık olarak hesaplayarak olasılık kurallarına

uygun sınıflama yapma imkanı veren, tablolaştırılmış ya da

ham veri setlerini analiz eden bir istatistiksel yöntemdir.

Logit Model

26

Logistik Dağılım Fonksiyonu

i

i

P 1 1.

1-P 1

zz

z z

ee

e e

1 2 ii (b b X )

1P =E(Y=1|X)

1 e

1

1 iZe

kümülatif lojistik dağılım fonksiyonudur.

Bahis yada olabilirlik oranı

1 2i iZ b b X

ln( ) ln1

izii e

i

PL e

P

1 1 11 1

1 1 1

i i

i i i

Z Z

Z Z Z

e eP

e e e

Bu orana ev sahibi olma lehine fark oranı denir. Lojistik modelin her

iki tarafının doğal log. alındığında

Li fark oranı logaritması olup hem X, hem parametrelere göre

doğrusaldır.Z değişkeni - dan + a değişirken, P 0 ile 1

arasında değişir.

Logit Model

27

i 1 2P =E(Y=1|X) ib b X

DOM’de

şeklindedir.

1 2 ii (b b X )

1P =E(Y=1|X)

1 e

1

1 iZe

Logit modelde olasılık

iken.

Logit Modelin Özellikleri

28

Pi=1

0

1ln

11

1ln

P1

Pln

i

i = +

Pi=0

1

0ln

01

0ln

P1

Pln

i

i

= -

1. Pi, 0’dan 1’e kadar değer aldığında, Logitte -ile + arasında değer

alır.

2. Logit, X’e göre doğrusal iken olasılıklara göre değildir.

3. Logit modelin b2 katsayısı şu şekilde yorumlanır: Bağımsız

değişkendeki bir birimlik değişme karşısında logitteki değişmeyi

gösterir.

4. Logit model tahmin edildikten sonra, X bağımsız değişkeninin belirli

bir değeri için logitin gerçekleşme olasılığı hesaplanabilir.

2

0.00

0.25

0.50

0.75

1.00

-8 -6 -4 -2 0 2 4 6

Z

Ze

ZFp

1

1)(

)(ZF

XZ 21

Bir olayın gerçekleşme olasılığının birden büyük olması

durumundan kaçınmak için olasılığın Z’nin S şeklinde bir

fonksiyonu olduğunu varsaymaktır. Z açıklayıcı değişkenlerin

fonksiyonu olarak ifade edilebilir.

Logit Model

29

3

0.00

0.25

0.50

0.75

1.00

-8 -6 -4 -2 0 2 4 6

Birçok fonksiyon S şeklinde fonksiyon özelliklere sahiptir ve

yukarıda gösterildiği gibi bunlardan biri de lojistik

fonksiyondur. Z + sonsuza gideren, e-Z sıfıra gitmekte, ve p 1’e

gitmektedir. (fakat 1’i geçmemektedir.). Z – sonsuza giderken,

e-Z de sonsuza gitmekte ve p de sıfıra gitmektedir (fakat sıfırın

altına inmemektedir.).

XZ 21

)(ZFZ

eZFp

1

1)(

Z

Logit Model

30

A- Frekanslı Serilerde Logit Modelin EKKY İle Tahmini

1.Adım: ihtimalleri hesaplanır. i i iP n N

2.Adım: fark oranı logaritmaları hesaplanır. i i iL ln(P 1 P )

3.Adım: orijinal lojistik modeli tahminlenir. i 1 2 i iL b b X u

i i i iL ln[n (N n )]

Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her

iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir. iv

i 1 2 i iL b b X u i i i iv N P (1 P ) 31

Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her

iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir. iv

i i 1 i 2 i i i iv L b v b v X v u

* *

1 i 2 i iL b v b X w Dönüşümlü veya Tartılı

EKK Lojistik Modeli

i i i iv N P (1 P )

i i iw u v32

Frekanslı Seri İçin Logit Model Uygulaması

300 aileden oluşan küçük bir kasabada ailelerin, yıllık gelirleri (Xi)

ve ev sahibi olanların sayısı (ni) aşağıdaki tabloda gösterilmiştir.

X

Milyon TL)

Aile Sayısı=

Ni

Ev Sahibi

Olan Aile

Sayısı=ni

Nispi

Frekanslar

Pi=ni/Ni

12 20 5 0.25

16 25 6 0.24

20 35 10 0.28

26 45 15 0.33

30 50 25 0.50

40 34 18 0.53

50 30 20 0.66

60 26 16 0.61

70 20 15 0.75

80 15 10 0.67

SNi = 300

Sni = 140 33

Xi

1

12

16

20

26

30

40

50

60

70

80

Ni

2

20

25

35

45

50

34

30

26

20

15

ni

3

5

6

10

15

25

18

20

16

15

10

Pi

4=3/2

0.25

0.24

0.28

0.33

0.50

0.53

0.66

0.61

0.75

0.67

1-Pi

5=1-4

0.75

0.76

0.72

0.67

0.50

0.47

0.34

0.39

0.25

0.33

Pi /1- Pi

6=4/5

0.33

0.31

0.39

0.49

1.00

1.13

1.94

1.56

3.00

2.03

Li

7=ln(6)

-1.1086

-1.1712

-0.9416

-0.7133

0.0000

0.1222

0.6626

0.4446

1.0986

0.7080 34

Dependent Variable: L




C -1.409706 0.215776 -6.533192 0.0002

X 0.032669 0.004667 7.000011 0.0001

R-squared 0.859649 Mean dependent var -0.089870





Durbin-Watson stat 1 .582165 Prob(F-statistic) 0.000113 35

v=N.P.(1-P)

8=2.4.5

3.75

4.56

7.05

9.95

12.50

8.47

6.73

6.18

3.75

3.31

vi

9= 8

1.9365

2.1354

2.6552

3.1543

3.5355

2.9103

2.5942

2.4859

1.9365

1.8193

L*

10=7.9

-2.1468

-2.5009

-2.5001

-2.4999

0.0000

0.3556

1.7189

1.1052

2.1274

1.2880

X*

11=1.9

23.2379

34.1666

53.1036

82.0134

106.0660

116.4130

129.7112

149.1576

135.5544

145.5472 36

Li*= -1.38056 vi + 0.03363 Xi

*, s= 0.8421

s(bi): (0.2315) (0.00556) , R2= 0.80

t= (-5.9617) (6.0424) , d= 1.649, F= 36.95

Gelir bir birim arttığında, ev sahibi olma lehine fark

oranının logaritması 0.033 artmaktadır. Bu fark oranına göre

belli bir gelir seviyesinde ev sahibi olma olasılığı hesaplanabilir:

X=40 iken 2.9103iv 116.4130X

değerleri yukarıdaki denklemde yerine konduğunda

L*=-0.10288 bulunur.

*ˆ

ˆlog log log( 0.10288) 0.9022ˆ1

PAnti L Anti Anti

P

ˆ0.9022

ˆ1

P

P

ˆ 0.4743P olabilirlik oranı 37

40 birim gelirli bir ailenin ev sahibi olma olasılığı %47.43’dür.

Lojistik modelden, belli bir gelir seviyesinde gelirdeki bir birimlik

artışın ev sahibi olma olasılığını ne ölçüde arttıracağı tahmin

edilebilir:

2ˆ ˆ ˆ(1 )b P P

formülünden yararlanılır. X=40 iken gelir 1 birim arttığında

ev sahibi olma olasılığı

[0.03363(1-0.4743)0.4743]=0.00838(%0.8)

38

B- En Yüksek Olabilirlik Yöntemiyle Logit Modelin Elde Edilmesi

39

Frekanslı olmayan serilerde logit modeli EKKY ile çözülemez.

ln( ) ln1

izii e i

i

PL e Z

P

Pi=1 ve Pi=0 değerleri logit Li’ deki yerine koyulduğunda ln(1/0) ve ln(0/1) değerleri elde edilir ki bunlar anlamsızdır. En küçük kareler yöntemi ile L fonksiyonundaki parametrelerin tahmin değerleri bulunamaz, fakat bu parametreler maksimum olabilirlik modeli ile tahmin edilebilir.

• Örneğin aşağıda frekanslı olmayan bir serinin en yüksek olabilirlik yöntemi ile logit model tahmini yer almaktadır:

40

41

Modeldeki katsayılar aşağıdaki gibidir;

• Logit modelde katsayılar doğrudan, bağımsız değişkenlerdeki bir değişimin bağımlı değişkenin beklenen değeri üzerindeki etkisi olarak yorumlanamamaktadır. Katsayının işareti bağımsız değişken ile olayın gerçekleşme olasılığı arasındaki ilişkinin yönünü gösterir. Modeldeki bağımsız değişkenlerin tümü olayın gerçekleşme olasılığı ile ters yönlü bir ilişki içerisindedir. Logit modelde katsayı yorumlarının yapılabilmesi için bağımsız değişkenlerin ortalamaları değerlendirmeye katılarak marjinal etkiler hesaplanır.

42

Probit Model

Probit model, y bağımlı değişkenin normal dağıldığını varsayarken, Logit model bu değişkenin lojistik eğriye dayandığını varsaymaktadır. Bu iki modelden Logit modelin dağılımda lojistik birikimli dağılım fonksiyonunun kuyruk bölgeleri Probit modele göre daha geniştir. Nitel olarak ele alındığında bu iki model benzer sonuçlar vermesine rağmen iki modelin tahmin edilen anakütle katsayılarını doğrudan karşılaştırmak mümkün değildir.

45

İki değer alabilen nitel değişkenli nitel tercih modellerinden biri olan DOM’ndeki en belirgin sorun, tahmin edilen olasılık değerlerinin 0-1 aralığının dışına çıkması sorunudur. Bu sorunun giderilmesi adına kullanılan Probit model, olasılıkların 0-1 arasında kalmasını sağlayan ve katsayılar itibariyle doğrusal olmayan bir modeldir. Probit model, genellikle gözlenemeyen bir fayda endeksi ile oluşturulduğundan, fayda endeksi hakkında bilgi verme yükümlülüğünü taşımaktadır.

46

Bağımlı kukla değişkenli modellerden kümülatif lojistik

fonksiyonundan farklı olarak, normal kümülatif dağılım

fonksiyonunu kullanan PROBİT(NORMAL) Model aşağıdaki

gibi formüle edilir:

1

2

02 22

Z Ze z( ) /

F(z)=

P R O B İ T (NORMAL) MODEL

Probit modeli şu şekilde tanımlayabiliriz:

Herhangi bir i hanesinin ev sahibi olma veya olmama

kararının gözlenemeyen bir fayda indeksi Ii’ye bağlı

olduğunu varsayalım.

47

Ii* Ii ifadesi faydanın belli bir eşik değerinden sonra söz konusu

olabileceğini gösterir. Ii* başlangıç değeri de Ii gibi gözlenemez.

Ancak, aynı ortalama ve varyanslı normal dağıldığı varsayılarak Ii

değerleri yukarıdaki regresyon denkleminden tahmin edilir.

Tahminciler bulunur.

Normal dağılım varsayımıyla Ii* ın Ii den küçük veya eşit olma

olasılığı aşağıdaki standartlaştırılmış normal KDF ile

hesaplanabilir:

Ii= b1 + b2 Xi

Ii, bağımsız değişkenlere bağlıdır. Örneğin Xi (gelir)değişkeni.

Her hane için Ii’nın belli bir değerinden itibaren ev sahibi olma

durumu söz konusudur.Ii değeri, Ii* değerini aştığı zaman hane, ev

sahibi olacak aksi durumda olmayacaktır.

Y=1 hane ev sahibi

Y=0 hane ev sahibi değil.

(1)

48

49

Endeks değerinin kendisi gibi gözlenemeyen ve Ii* ile

ifade edilen eşik değerine sahip olduğu düşünüldüğünde, eğer Ii değeri Ii

* değerini aşarsa olayın meydana gelmeyeceği söylenebilir. Ii

*

değerinin Ii değerinden küçük ya da Ii‘ye eşit olması

normallik varsayımı altında standartlaştırılmış birikimli dağılım fonksiyonlarından hareketle hesaplanmaktadır. Burada Ii gerçekte ölçülmemiş bir endeks olup normal ve sürekli bir tesadüfi değişken olarak adlandırılabilir. Belirtilmelidir ki Ii‘ler için gözlemler mevcut değildir. Ancak bu endeksin küçük ve büyük değerlerinden bireysel gözlemlerin hangi kategoriye ait oldukları bilinmektedir.

i 2I2/t dte

2

1 1

2

2 21 2

e dttb b Xi

/

=Standartlaştırılmış Normal KDF

Pi=Pr(Y=1)=Pr(Ii* Ii)=F(Ii)

)1,0(Nt =standartlaştırılmış normal değişken

Pi=Bir ev sahibi olma olasılığı.

(2)

50

Probit Model

51

0

1

Pi=F(Ii)

- +

0

1

Pi=F(Ii)

- +

Pi

Ii= b1 + b2 Xi

Pi

Ii=F-1(Pi )

Ii* <=Ii verilmişken ev sahibi olma

olasılığı Pi ordinatta bulunur

Pi verilmişken, absiste Ii bulunur.

Ii’yı bulabilmek için 2 no’lu ifadenin tersi alınmalıdır.

Ii = F-1(Ii)= F-1 (Pi)=b1+b2Xi

=Probit model

F-1: normal kümülatif dağılım fonksiyonunun tersi.

52

A- Frekanslı Serilerde Probit Modelin Tahmin Aşamaları

54

1. Pi= ni/Ni hesaplanır.

2. Ii = F-1 (Pi)= normal eşdeğer sapma bulunur.

3. Ii = b1 + b2 Xi + ui EKK ile tahmin edilir.

4. İstenirse, Ii yerine, (Ii + 5)=probit değerleri alınarak, EKKY ile

(13.19) tahmin edilir.

5. modelinin hata terimi ui farklı varyanslıdır. Bu sebepten

dönüşümlü değerler alınarak TEKKY uygulanabilir:

2

u

P P

N f

i i

i i

( )1fi= F-1 (Pi) ifadesine eşit standart normal

yoğunluk fonksiyonudur.

6. Büyük örnekler için bi'lerin güven aralıkları ve hipotez testleri

uygulanarak, anakütlede durumun geçerliliği araştırılabilir.

7. Belirlilik katsayısı R2, modelin fonksiyonel biçiminin iyi seçilip

seçilmediği konusunda bize fikir vermez.

55

Probit Model Uygulaması

56

Pi

0.25

0.24

0.28

0.33

0.50

0.53

0.66

0.61

0.75

0.67

Ii=F-1(Pi)

-0.6745

-0.7063

-0.5828

-0.4399

0.0000

0.0752

0.4124

0.2793

0.6745

0.4399

Probitler=Zi=(Ii+5)

4.3255

4.2937

4.4172

4.5601

5.0000

5.0752

5.4124

5.2793

5.6745

5.4399

Xi

12

16

20

26

30

40

50

60

70

80

Probit Model Uygulaması

57

Ii= -0.8587 + 0.0200 Xi , r2= 0.8628 r= 0.9289

s(bi) (0.0028) s= 0.2 d= 1.59

t= (7.094)

Zi= 4.1324 + 0.0201 Xi , r2= 0.8621 r= 0.9285

s(bi) (0.0028) s= 0.2 d= 1.5637

t= (7.071)

B- En Yüksek Olabilirlik Yöntemiyle Probit Modelin Elde Edilmesi

58

En Yüksek Olabilirlik Yöntemi’nde anakütle ve bu anakütleden çekilen örnek arasındaki benzerlik ilişkisinden yararlanılarak bu örneğin elde edilme olasılığını maksimum yapan parametre değerleri tahmin edilmektedir.

En Yüksek Olabilirlik Yöntemi, benzerlik fonksiyonunun maksimizasyonundan oluşmaktadır. Bu yöntemin uygulanabilmesi için hata terimlerinin dağılımının bilinmesi gereklidir.

Logit modelin en yüksek olabilirlik yöntemiyle elde edilen örneğin probit model uygulaması şu şekilde gerçekleşmiştir:

bağımlı kukla değişkenlerkisi.deu.edu.tr/hamdi.emec/eko2/bağımlı kukla...

Documents