bağımlı kukla değişkenlerkisi.deu.edu.tr/hamdi.emec/eko2/bağımlı kukla...
TRANSCRIPT
Bağımlı Kukla Değişkenler
1
•Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin
varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla
değişkenler söz konusudur.
•Bu durumdaki modelleri tahmin etmek için dört yaklaşım vardır:
-Doğrusal Olasılık Modeli
-Logit Modeli
-Probit Modeli
-Tobit Modeli
Doğrusal Olasılık Modeli
2
Yi = b1 + b2Xi +ui
Yi= 1 Eğer i. Birey istenen özelliğe sahipse
0 Diğer Durumlarda
Xi= Bağımsız değişken
Bu modele olasılıklı model denmesinin nedeni, Y’nin X için şartlı
beklenen değerinin, Y’nin X için şartlı olasılığına eşit olmasıdır.
E(Yi|Xi)=Pr(Yi=1| Xi)
Doğrusal Olasılık Modeli
3
E(Yi |Xi)= b1 + b2Xi E(ui) = 0
Yi değişkeninin olasılık dağılımı:
Yi Olasılık
0 1-Pi
1 Pi
Toplam 1
E(Yi |Xi) = SYiPi=0.(1-Pi) + 1.(Pi) = Pi
E(Yi |Xi)= b1 + b2Xi = Pi
0 E(Yi |Xi) 1
DOM Tahminindeki Sorunlar
4
ui hata teriminin normal dağılmayışı:
•Normallik varsayımının sağlanmaması durumunda tahmin
ediciler sapmasızlıklarını korurlar.
•Nokta tahminde normallik varsayımı gözardı edilir.
•Örnek hacmi sonsuza giderken EKK tahmincileri çoğunlukla
normal dağılıma uyarlar
•DOM ile yapılan istatistiksel çıkarsamalar normallik varsayımı
altındaki EKK sürecine uyarlar
u’ların Binom Dağılımlı Olması
EKKY varsayımlarından biri u değerlerinin dağılımının normal
olmasıdır. Bu varsayım sayesinde katsayı tahminlerinin güven
aralıkları hesaplanıp, test yapılabilmektedir.
DOM’de u’lar normal dağılmaz, binom dağılımı gösterir:
1 2i iu Y b b X
1 2i iY b b X u
Y 1 ve 0 değerini aldığında
Yi =1 için 1 21i iu b b X
Yi =0 için 1 2i iu b b X
u lar normal değildir. İki değerli binom dağılımlıdır. Ancak
büyük örneklerde DOM güven aralıkları ve hipotez testleri
geçerlidir ve EKKY normal dağılım varsayımının sağlandığı
kabul edilmektedir. 5
Yi ui İhtimal=P(ui)
0 -b1-b2X (1-Pi)
1 1-b1-b2X Pi
2 2
i 1 2 i 1 2 iVar(u ) ( b b X) (1 P ) (1 b b X) (P )
i 1 2 1 2Var(u ) (b b X)(1 b b X)
ui hata teriminin değişen varyanslı olması:
)(.)()( 2
ii YPYYYVar
DOM’de u lar eşit varyanslı değillerdir. Bunun için kesikli bir Y
değişkeni varyansından hareketle
Y yerine u alınarak
)(.)()(.)()( 22
ii uPuuPuuuVar
i i i i iVar(u ) E(Y | X )[1 E(Y | X )] P (1 P ) 6
u’nun varyansı farklıdır. u’nun varyansı Y’nin X için şartlı
beklenen değerine bağlıdır ve sonuçta u’nun varyansı X’in
değerine bağlı olacak ve eşit olmayacaktır.
DOM’nin EKKY ile tahmininde ortaya çıkan farklı varyans
problemine aşağıdaki dönüşümlü modeli tahmin ederek çözüm
getirmek mümkündür:
1 2 i i
i i i i
b b X uY
v v v v
i i i i iv E(Y | X )[1 E(Y | X )] P (1 P )
ui hata teriminin değişen varyanslı olması:
•Var(ui) = Pi(1-Pi)
7
DOM’de Farklı Varyansı Önleme
i i iˆ ˆv Y (1 Y )
iE(Y | X ) ler bilinmediğinden bunun yerine örnek tahmini ˆiY
değerleri hesaplanarak ifadesinde yerine
konur.
0 E(Yi |Xi) 1 varsayımının yerine gelmeyişi
DOM’de Y’nin şartlı olasılığını gösteren E(Y|X) nın 0 ila 1
arasında bulunması şarttır. Y; 0 ve 1 değerini almaktadır.Bu şart
anakütle için geçerlidir. Anakütlenin tahmincisi için geçerli
olmayabilir.
Tahmini şartlı olasılıklar 0 ile 1 olmayabilir:
ˆiY
8
0 E(Yi |Xi) 1
0 ile 1 arasında mıdır? DOM”, EKKY ile elde edildikten sonra:
ˆiY
eşit olduğu kabul edilir.
1- Bunlardan bir kısmı 0 dan küçük, negatif değerli ise, bunlar için ˆiY
0 değerini alır. 1’den büyük değerli ise bunlar için nin 1’e
9
ˆiY
0.999 değeri verilir.
2- Bunlardan bir kısmı 0 dan küçük, negatif değerli ise, bunlar için ˆiY
0.001 değerini alır. 1’den büyük değerli ise bunlar için ne
10
u
veşit varyanslıdır. Bu yöntem Tartılı En Küçük Kareler
Yöntemi (TEKKY) olarak adlandırılır.
Dönüştürmeden sonra EKKY tekrar uygulanır ve farklı varyansın
kalktığı görülebilir.
3- Bunlardan bir kısmı 0 dan küçük, negatif değerli ve 1’den büyük
değerli ise bu gözlemler atılır.
11
R2 Değerinin Genellikle Küçük Çıkarak, İlişkinin
Uyumunu Gösteren Bir Ölçü Olamaması
Belli bir X’e karşılık gelen Y, ya 0 ya da 1’dir. Öyleyse bütün Y
değerleri, ya X ekseni ya da 1’in hizasındaki doğru üzerinde yer
alır. Genellikle klasik En Küçük Kareler yöntemi ile hesaplanan
R2 , böyle modellerde 1’den çok küçük çıkma eğilimindedir.
Çoğu uygulamada R2 , 0.2 ile 0.6 arasında yer alır. Tahmin edilen
Yi , ya 0’a ya da 1’e yakın çıkacaktır.
Bu nedenle John Aldrich ile Forrest Nelson ‘Nitel bağımlı
değişkeni olan modellerde, belirlilik katsayısının bir özetleme
istatistiği olarak kullanılmasından kaçınılması gerektiğini ileri
sürmektedir (Gujarati, 1995:546).
Doğrusal Olasılık Modeli
12
Di = b1 + b2Mi +b3 Si +ui
Di= 1 Eğer i. Kadının bir işi varsa ya da iş arıyorsa
0 Diğer Durumlarda
Mi= 1 Eğer i. Kadın evliyse ve diğer durumlarda 0
Si = i.kadının yıl olarak aldığı eğitim
Di Mi Si Di Mi Si
1 0 16 1 0 10
1 1 14 1 1 14
1 1 16 0 1 10
0 0 9 0 1 12
1 0 12 1 0 13
0 1 12 1 0 14
1 0 14 1 1 12
1 0 10 0 1 7
0 0 12 0 1 11
1 0 8 0 1 12
1 0 11 1 1 10
1 0 14 1 0 15
0 1 12 0 1 10
1 1 13 0 1 11
0 1 9 1 1 12
Kadının İşgücüne Katılımı
Modeli:
Di= 1 i.Kadının bir işi varsa
ya da iş arıyorsa
0 Diğer Durumlarda
Mi= 1 i. Kadın evliyse
0 diğer durumlarda
Si = i.kadının yıl olarak aldığı eğitim
13
Kadının İşgücüne Katılımı Modeli
14
Di = b1 + b2Mi +b3 Si +ui
Dependent Variable: DI
Included observations: 30
Variable Coefficient Std. Error t-Statistic Prob.
C -0.284301 0.435743 -0.652452 0.5196
MI -0.381780 0.153053 -2.494430 0.0190
SI 0.093012 0.034598 2.688402 0.0121
R-squared 0.363455 Mean dependent var 0.600000
Adjusted R-squared 0.316304 S.D. dependent var 0.498273
S.E. of regression 0.412001 Akaike info criterion 1.159060
Sum squared resid 4.583121 Schwarz criterion 1.299179
Log likelihood -14.38590 F-statistic 7.708257
Durbin-Watson stat 2.550725 Prob(F-statistic) 0.002247
Mi= 1 Kadın evliyse ;0 diğer durumlarda ;
Si = i.kadının yıl olarak aldığı eğitim
15
Daha sonra modelde değişen varyans olup olmadığı araştırılmak istenmiş ve White testi
ile modelde değişen varyans problemi test edilmiştir.
White Heteroskedasticity Test:
F-statistic 1.759076 Probability 0.138742
Obs*R-squared 6.589061 Probability 0.143265
Prob değeri 0.143265>0.05 olduğu için H0 hipotezi olan Değişen varyans
yoktur, eşit varyans vardır hipotezi red edilemez. Test sonucu değişen
varyans problemi ile karşılaşılmadığından herhangi bir işlem yapılmaz.
Model olduğu gibi kabul edilir.
UYGULAMA:Akıllı telefonunun kullanılıp kullanılmamasını ifade eden bağımlı
kukla değişken 50 kişiye yapılan anket sonuncunda yaş ve aylık ortalama gelir ile
açıklanmıştır.(Y=1, akıllı telefona sahip ise, Y=0 akıllı telefona sahip değilse)
Kişi Y X(Gelir) Z(Yaş) Kişi Y X(Gelir) Z(Yaş) 1 1 250 23 26 0 185 21
2 1 350 21 27 1 250 21
3 0 150 23 28 1 500 21
4 1 600 22 29 1 790 23
5 1 200 22 30 1 500 22
6 0 150 20 31 1 675 22
7 1 390 27 32 1 490 22
8 0 200 18 33 1 500 21
9 0 900 25 34 1 760 21
10 0 150 18 35 1 550 26
11 0 255 18 36 1 400 24
12 0 300 20 37 1 200 21
13 1 640 25 38 0 220 21
14 1 500 27 39 1 175 23
15 1 300 22 40 1 840 21
16 0 550 19 41 1 150 23
17 1 800 18 42 1 200 23
18 1 875 21 43 1 200 23
19 0 600 17 44 1 485 23
20 0 500 20 45 1 250 21
21 0 500 19 46 1 300 20
22 1 500 21 47 1 470 19
23 1 550 22 48 1 800 23
24 1 750 21 49 0 250 21
25 1 225 23 50 0 130 23
16
Dependent Variable: Y
Method: Least Squares
Included observations: 50
Variable Coefficient Std. Error t-Statistic Prob.
C -1.373086 0.585035 -2.347017 0.0232
X 0.000492 0.000259 1.900372 0.0635
Z 0.086130 0.026781 3.216041 0.0024
R-squared 0.2401 Mean dependent var 0.700
Adjusted R-squared 0.207770 S.D. dependent var 0.462910
S.E. of regression 0.412024 Akaike info criterion 1.122653
Sum squared resid 7.978889 Schwarz criterion 1.2373
Log likelihood -25.06633 F-statistic 7.425357
Durbin-Watson stat 1.552777 Prob(F-statistic) 0.001577
Y=1, akıllı telefona sahip ise, Y=0 akıllı telefona sahip değilse; X(Gelir); Z(Yaş)
17
Önce Modelde değişen varyansın olup olmadığı White testi
ile araştırılır.
18
White Heteroskedasticity Test:
F-statistic 2.305076 Probability 0.010504
Obs*R-squared 10.37848 Probability 0.01195
1. Prob değeri 0.01195<0.05 olduğu için H0 hipotezi olan
Değişen varyans yoktur, eşit varyans vardır hipotezi red
edilir. Değişen varyans problemi ile karşılaşıldığından
önce hesaplanır.
2. ‘nin 0’dan küçük değerleri ve 1’den büyük değerleri veri
setinden çıkartılır..
3. Ardından hesaplanır.
4. Y= b1 + b2 X + b3 Z modelinin her iki tarafı da
değerine bölünür.
5. Model tahmin edilir.
vi
Y
Y
i i iˆ ˆv Y (1 Y )
Kişi Kişi Kişi Kişi
1 0.7308 16 0.5338 31 0.8536 46 0.4970
2 0.6077 17 0.5705 32 0.7627 47 0.4944
3 0.6817 18 0.8658 33 0.6815 48 1.0012
4 0.8167 19 0.3861 34 0.8093 49 0.5586
5 0.6201 20 0.5953 35 1.1367 50 0.6718
6 0.4233 21 0.5092 36 0.8907
7 1.1442 22 0.6815 37 0.5340
8 0.2756 23 0.7922 38 0.5438
9 1.2226 24 0.8044 39 0.6939
10 0.2510 25 0.7185 40 0.8486
11 0.3026 26 0.5266 41 0.6817
12 0.4970 27 0.5586 42 0.7062
13 1.0948 28 0.6815 43 0.7062
14 1.1982 29 0.9963 44 0.8463
15 0.6693 30 0.7676 45 0.5586
Y
Y
Y
Y
19
Dependent Variable:
Method: Least Squares
Sample: 1 50
Included observations: 44
Excluded observations: 6
Variable Coefficient Std. Error t-Statistic Prob.
-1.960127 0.591996 -3.311048 0.0019
0.000468 0.000170 2.754280 0.0087
0.114551 0.028194 4.062939 0.0002
R-squared 0.899751 Mean dependent var 1.9024
Adjusted R-squared 0.894861 S.D. dependent var 2.504969
S.E. of regression 0.812241 Akaike info criterion2.487706
Sum squared resid 27.04915 Schwarz criterion 2.609356
Log likelihood -51.72954 F-statistic 183.9907
Durbin-Watson stat 1.728717 Prob(F-statistic) 0.000000
1/ v
Y / v
X / v
Z/ v
20
21
Örnek büyüklüğü arttıkça hata terimi normal dağılıma
yaklaşsa ve değişen varyans durumunda, ağırlıklı en küçük
kareler yöntemi kullanılsa, modelin her iki tarafı ye
bölünüp model değişimi yapılsa bile normallik ve değişen
varyans varsayımlarıyla ilgili sakıncaları giderebilmek için
logit ve probit modeller geliştirilmiştir. Bu modeller, hem
şartını sağlayabilmekte ve hem de Pi
ile Xi arasındaki ilişkiyi doğrusallıktan kurtarabilmektedirler.
Yani, logit ve probit modelleri, farklı bağımsız X
değişkeninin olasılığının 0 ile 1 arasında kalmasını
sağladıkları gibi; ayrıca, değişik bağımsız değişkene ait belli
bir artış karşısında, bu bağımsız değişkenin kullanılma
olasılığının değişik miktarda artmasını sağlamaktadırlar.
vi
1)(0 ii XYE
DOM’e Alternatif Model Arama
DOM’e Alternatif Model Arama
22
Günümüzde nitel değişkenlerden oluşan kukla değişken
verileri analiz etmek için çeşitli teknikler kullanılmaktadır.
Bunlardan log-linear modeller iki veya daha fazla kukla
değişkenin koşullu ilişkisini analiz etmek için geliştirilmiştir.
Bununla birlikte, log-linear modeller sayesinde, değişkenlerin
oluşturduğu bileşik dağılımı, iki veya daha fazla değişkenin
birbirine bağımlı olup olmadığını ve iki veya daha fazla
değişken arasındaki ilişkiyi neden-sonuç ilişkisine
dayandırmaksızın test etmek mümkündür.
DOM’e Alternatif Model Arama
23
•DOM ile ilgili sayılan sorunların hepsi bir şekilde aşılabilir
•Ancak, DOM, Pi=E(Y=1|X) olasılığının X’le doğrusal olarak
arttığını varsayar. Yani X’deki marjinal veya küçük bir artış
hep sabittir. Gerçek hayatta ise bu beklenen bir durum değildir.
•DOM ile ilgili sorunlar şu iki özellik sayesinde aşılabilir:
1.Xi arttıkça Pi=E(Y=1|X)’de artar ancak 0 ile 1 aralığının dışına
çıkmaması gerekmektedir.
2.Pi ile Xi arasındaki ilişkinin doğrusal olmaması gerekmektedir.
DOM’e Alternatif Model Arama
24
Yukarıdaki iki özelliği taşıyan modelin şekli aşağıda verilmiştir:
0
1 P
- + X
KDF
•Yukarıdaki eğri kümülatif dağılım fonksiyonuna benzemektedir.
•Bu fonksiyon kukla bağımlı değişkenli regresyon modellerinde
kullanılabilir.
Logit Model
25
Logit modeller, genelleştirilmiş doğrusal modelin belirli
koşullar altında oluşturulmuş özel durumlarıdır. Bu durumda,
eğer bağımsız değişkenlerin bazısı sürekli veya uygun (ilgili)
sınıflar içine ayrıştırılamazsa, o zaman log-linear analiz yerine
logistik regresyon kullanılmalıdır. Aynı zamanda eğer
değişkenlerin bazısı bağımlı olarak ele alınırsa, o zaman logit
model uygundur. Böyle bir durumda 0’la 1 arasında kalma
koşulunu sağlayabilmek için logit modelin uygulanması
önerilmektedir. Logit model, bağımlı değişkenin tahmini
değerlerini olasılık olarak hesaplayarak olasılık kurallarına
uygun sınıflama yapma imkanı veren, tablolaştırılmış ya da
ham veri setlerini analiz eden bir istatistiksel yöntemdir.
Logit Model
26
Logistik Dağılım Fonksiyonu
i
i
P 1 1.
1-P 1
zz
z z
ee
e e
1 2 ii (b b X )
1P =E(Y=1|X)
1 e
1
1 iZe
kümülatif lojistik dağılım fonksiyonudur.
Bahis yada olabilirlik oranı
1 2i iZ b b X
ln( ) ln1
izii e
i
PL e
P
1 1 11 1
1 1 1
i i
i i i
Z Z
Z Z Z
e eP
e e e
Bu orana ev sahibi olma lehine fark oranı denir. Lojistik modelin her
iki tarafının doğal log. alındığında
Li fark oranı logaritması olup hem X, hem parametrelere göre
doğrusaldır.Z değişkeni - dan + a değişirken, P 0 ile 1
arasında değişir.
Logit Model
27
i 1 2P =E(Y=1|X) ib b X
DOM’de
şeklindedir.
1 2 ii (b b X )
1P =E(Y=1|X)
1 e
1
1 iZe
Logit modelde olasılık
iken.
Logit Modelin Özellikleri
28
Pi=1
0
1ln
11
1ln
P1
Pln
i
i = +
Pi=0
1
0ln
01
0ln
P1
Pln
i
i
= -
1. Pi, 0’dan 1’e kadar değer aldığında, Logitte -ile + arasında değer
alır.
2. Logit, X’e göre doğrusal iken olasılıklara göre değildir.
3. Logit modelin b2 katsayısı şu şekilde yorumlanır: Bağımsız
değişkendeki bir birimlik değişme karşısında logitteki değişmeyi
gösterir.
4. Logit model tahmin edildikten sonra, X bağımsız değişkeninin belirli
bir değeri için logitin gerçekleşme olasılığı hesaplanabilir.
2
0.00
0.25
0.50
0.75
1.00
-8 -6 -4 -2 0 2 4 6
Z
Ze
ZFp
1
1)(
)(ZF
XZ 21
Bir olayın gerçekleşme olasılığının birden büyük olması
durumundan kaçınmak için olasılığın Z’nin S şeklinde bir
fonksiyonu olduğunu varsaymaktır. Z açıklayıcı değişkenlerin
fonksiyonu olarak ifade edilebilir.
Logit Model
29
3
0.00
0.25
0.50
0.75
1.00
-8 -6 -4 -2 0 2 4 6
Birçok fonksiyon S şeklinde fonksiyon özelliklere sahiptir ve
yukarıda gösterildiği gibi bunlardan biri de lojistik
fonksiyondur. Z + sonsuza gideren, e-Z sıfıra gitmekte, ve p 1’e
gitmektedir. (fakat 1’i geçmemektedir.). Z – sonsuza giderken,
e-Z de sonsuza gitmekte ve p de sıfıra gitmektedir (fakat sıfırın
altına inmemektedir.).
XZ 21
)(ZFZ
eZFp
1
1)(
Z
Logit Model
30
A- Frekanslı Serilerde Logit Modelin EKKY İle Tahmini
1.Adım: ihtimalleri hesaplanır. i i iP n N
2.Adım: fark oranı logaritmaları hesaplanır. i i iL ln(P 1 P )
3.Adım: orijinal lojistik modeli tahminlenir. i 1 2 i iL b b X u
i i i iL ln[n (N n )]
Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her
iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir. iv
i 1 2 i iL b b X u i i i iv N P (1 P ) 31
Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her
iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir. iv
i i 1 i 2 i i i iv L b v b v X v u
* *
1 i 2 i iL b v b X w Dönüşümlü veya Tartılı
EKK Lojistik Modeli
i i i iv N P (1 P )
i i iw u v32
Frekanslı Seri İçin Logit Model Uygulaması
300 aileden oluşan küçük bir kasabada ailelerin, yıllık gelirleri (Xi)
ve ev sahibi olanların sayısı (ni) aşağıdaki tabloda gösterilmiştir.
X
Milyon TL)
Aile Sayısı=
Ni
Ev Sahibi
Olan Aile
Sayısı=ni
Nispi
Frekanslar
Pi=ni/Ni
12 20 5 0.25
16 25 6 0.24
20 35 10 0.28
26 45 15 0.33
30 50 25 0.50
40 34 18 0.53
50 30 20 0.66
60 26 16 0.61
70 20 15 0.75
80 15 10 0.67
SNi = 300
Sni = 140 33
Xi
1
12
16
20
26
30
40
50
60
70
80
Ni
2
20
25
35
45
50
34
30
26
20
15
ni
3
5
6
10
15
25
18
20
16
15
10
Pi
4=3/2
0.25
0.24
0.28
0.33
0.50
0.53
0.66
0.61
0.75
0.67
1-Pi
5=1-4
0.75
0.76
0.72
0.67
0.50
0.47
0.34
0.39
0.25
0.33
Pi /1- Pi
6=4/5
0.33
0.31
0.39
0.49
1.00
1.13
1.94
1.56
3.00
2.03
Li
7=ln(6)
-1.1086
-1.1712
-0.9416
-0.7133
0.0000
0.1222
0.6626
0.4446
1.0986
0.7080 34
Dependent Variable: L
Method: Least Squares
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C -1.409706 0.215776 -6.533192 0.0002
X 0.032669 0.004667 7.000011 0.0001
R-squared 0.859649 Mean dependent var -0.089870
Adjusted R-squared 0.842106 S.D. dependent var 0.835010
S.E. of regression 0.331799 Akaike info criterion 0.808280
Sum squared resid 0.880723 Schwarz criterion 0.868797
Log likelihood -2.041402 F-statistic 49.00015
Durbin-Watson stat 1 .582165 Prob(F-statistic) 0.000113 35
v=N.P.(1-P)
8=2.4.5
3.75
4.56
7.05
9.95
12.50
8.47
6.73
6.18
3.75
3.31
vi
9= 8
1.9365
2.1354
2.6552
3.1543
3.5355
2.9103
2.5942
2.4859
1.9365
1.8193
L*
10=7.9
-2.1468
-2.5009
-2.5001
-2.4999
0.0000
0.3556
1.7189
1.1052
2.1274
1.2880
X*
11=1.9
23.2379
34.1666
53.1036
82.0134
106.0660
116.4130
129.7112
149.1576
135.5544
145.5472 36
Li*= -1.38056 vi + 0.03363 Xi
*, s= 0.8421
s(bi): (0.2315) (0.00556) , R2= 0.80
t= (-5.9617) (6.0424) , d= 1.649, F= 36.95
Gelir bir birim arttığında, ev sahibi olma lehine fark
oranının logaritması 0.033 artmaktadır. Bu fark oranına göre
belli bir gelir seviyesinde ev sahibi olma olasılığı hesaplanabilir:
X=40 iken 2.9103iv 116.4130X
değerleri yukarıdaki denklemde yerine konduğunda
L*=-0.10288 bulunur.
*ˆ
ˆlog log log( 0.10288) 0.9022ˆ1
PAnti L Anti Anti
P
ˆ0.9022
ˆ1
P
P
ˆ 0.4743P olabilirlik oranı 37
40 birim gelirli bir ailenin ev sahibi olma olasılığı %47.43’dür.
Lojistik modelden, belli bir gelir seviyesinde gelirdeki bir birimlik
artışın ev sahibi olma olasılığını ne ölçüde arttıracağı tahmin
edilebilir:
2ˆ ˆ ˆ(1 )b P P
formülünden yararlanılır. X=40 iken gelir 1 birim arttığında
ev sahibi olma olasılığı
[0.03363(1-0.4743)0.4743]=0.00838(%0.8)
38
B- En Yüksek Olabilirlik Yöntemiyle Logit Modelin Elde Edilmesi
39
Frekanslı olmayan serilerde logit modeli EKKY ile çözülemez.
ln( ) ln1
izii e i
i
PL e Z
P
Pi=1 ve Pi=0 değerleri logit Li’ deki yerine koyulduğunda ln(1/0) ve ln(0/1) değerleri elde edilir ki bunlar anlamsızdır. En küçük kareler yöntemi ile L fonksiyonundaki parametrelerin tahmin değerleri bulunamaz, fakat bu parametreler maksimum olabilirlik modeli ile tahmin edilebilir.
• Örneğin aşağıda frekanslı olmayan bir serinin en yüksek olabilirlik yöntemi ile logit model tahmini yer almaktadır:
40
41
Modeldeki katsayılar aşağıdaki gibidir;
• Logit modelde katsayılar doğrudan, bağımsız değişkenlerdeki bir değişimin bağımlı değişkenin beklenen değeri üzerindeki etkisi olarak yorumlanamamaktadır. Katsayının işareti bağımsız değişken ile olayın gerçekleşme olasılığı arasındaki ilişkinin yönünü gösterir. Modeldeki bağımsız değişkenlerin tümü olayın gerçekleşme olasılığı ile ters yönlü bir ilişki içerisindedir. Logit modelde katsayı yorumlarının yapılabilmesi için bağımsız değişkenlerin ortalamaları değerlendirmeye katılarak marjinal etkiler hesaplanır.
42
43
44
Probit Model
Probit model, y bağımlı değişkenin normal dağıldığını varsayarken, Logit model bu değişkenin lojistik eğriye dayandığını varsaymaktadır. Bu iki modelden Logit modelin dağılımda lojistik birikimli dağılım fonksiyonunun kuyruk bölgeleri Probit modele göre daha geniştir. Nitel olarak ele alındığında bu iki model benzer sonuçlar vermesine rağmen iki modelin tahmin edilen anakütle katsayılarını doğrudan karşılaştırmak mümkün değildir.
45
İki değer alabilen nitel değişkenli nitel tercih modellerinden biri olan DOM’ndeki en belirgin sorun, tahmin edilen olasılık değerlerinin 0-1 aralığının dışına çıkması sorunudur. Bu sorunun giderilmesi adına kullanılan Probit model, olasılıkların 0-1 arasında kalmasını sağlayan ve katsayılar itibariyle doğrusal olmayan bir modeldir. Probit model, genellikle gözlenemeyen bir fayda endeksi ile oluşturulduğundan, fayda endeksi hakkında bilgi verme yükümlülüğünü taşımaktadır.
46
Bağımlı kukla değişkenli modellerden kümülatif lojistik
fonksiyonundan farklı olarak, normal kümülatif dağılım
fonksiyonunu kullanan PROBİT(NORMAL) Model aşağıdaki
gibi formüle edilir:
1
2
02 22
Z Ze z( ) /
F(z)=
P R O B İ T (NORMAL) MODEL
Probit modeli şu şekilde tanımlayabiliriz:
Herhangi bir i hanesinin ev sahibi olma veya olmama
kararının gözlenemeyen bir fayda indeksi Ii’ye bağlı
olduğunu varsayalım.
47
Ii* Ii ifadesi faydanın belli bir eşik değerinden sonra söz konusu
olabileceğini gösterir. Ii* başlangıç değeri de Ii gibi gözlenemez.
Ancak, aynı ortalama ve varyanslı normal dağıldığı varsayılarak Ii
değerleri yukarıdaki regresyon denkleminden tahmin edilir.
Tahminciler bulunur.
Normal dağılım varsayımıyla Ii* ın Ii den küçük veya eşit olma
olasılığı aşağıdaki standartlaştırılmış normal KDF ile
hesaplanabilir:
Ii= b1 + b2 Xi
Ii, bağımsız değişkenlere bağlıdır. Örneğin Xi (gelir)değişkeni.
Her hane için Ii’nın belli bir değerinden itibaren ev sahibi olma
durumu söz konusudur.Ii değeri, Ii* değerini aştığı zaman hane, ev
sahibi olacak aksi durumda olmayacaktır.
Y=1 hane ev sahibi
Y=0 hane ev sahibi değil.
(1)
48
49
Endeks değerinin kendisi gibi gözlenemeyen ve Ii* ile
ifade edilen eşik değerine sahip olduğu düşünüldüğünde, eğer Ii değeri Ii
* değerini aşarsa olayın meydana gelmeyeceği söylenebilir. Ii
*
değerinin Ii değerinden küçük ya da Ii‘ye eşit olması
normallik varsayımı altında standartlaştırılmış birikimli dağılım fonksiyonlarından hareketle hesaplanmaktadır. Burada Ii gerçekte ölçülmemiş bir endeks olup normal ve sürekli bir tesadüfi değişken olarak adlandırılabilir. Belirtilmelidir ki Ii‘ler için gözlemler mevcut değildir. Ancak bu endeksin küçük ve büyük değerlerinden bireysel gözlemlerin hangi kategoriye ait oldukları bilinmektedir.
i 2I2/t dte
2
1 1
2
2 21 2
e dttb b Xi
/
=Standartlaştırılmış Normal KDF
Pi=Pr(Y=1)=Pr(Ii* Ii)=F(Ii)
)1,0(Nt =standartlaştırılmış normal değişken
Pi=Bir ev sahibi olma olasılığı.
(2)
50
Probit Model
51
0
1
Pi=F(Ii)
- +
0
1
Pi=F(Ii)
- +
Pi
Ii= b1 + b2 Xi
Pi
Ii=F-1(Pi )
Ii* <=Ii verilmişken ev sahibi olma
olasılığı Pi ordinatta bulunur
Pi verilmişken, absiste Ii bulunur.
Ii’yı bulabilmek için 2 no’lu ifadenin tersi alınmalıdır.
Ii = F-1(Ii)= F-1 (Pi)=b1+b2Xi
=Probit model
F-1: normal kümülatif dağılım fonksiyonunun tersi.
52
53
A- Frekanslı Serilerde Probit Modelin Tahmin Aşamaları
54
1. Pi= ni/Ni hesaplanır.
2. Ii = F-1 (Pi)= normal eşdeğer sapma bulunur.
3. Ii = b1 + b2 Xi + ui EKK ile tahmin edilir.
4. İstenirse, Ii yerine, (Ii + 5)=probit değerleri alınarak, EKKY ile
(13.19) tahmin edilir.
5. modelinin hata terimi ui farklı varyanslıdır. Bu sebepten
dönüşümlü değerler alınarak TEKKY uygulanabilir:
2
u
P P
N f
i i
i i
( )1fi= F-1 (Pi) ifadesine eşit standart normal
yoğunluk fonksiyonudur.
6. Büyük örnekler için bi'lerin güven aralıkları ve hipotez testleri
uygulanarak, anakütlede durumun geçerliliği araştırılabilir.
7. Belirlilik katsayısı R2, modelin fonksiyonel biçiminin iyi seçilip
seçilmediği konusunda bize fikir vermez.
55
Probit Model Uygulaması
56
Pi
0.25
0.24
0.28
0.33
0.50
0.53
0.66
0.61
0.75
0.67
Ii=F-1(Pi)
-0.6745
-0.7063
-0.5828
-0.4399
0.0000
0.0752
0.4124
0.2793
0.6745
0.4399
Probitler=Zi=(Ii+5)
4.3255
4.2937
4.4172
4.5601
5.0000
5.0752
5.4124
5.2793
5.6745
5.4399
Xi
12
16
20
26
30
40
50
60
70
80
Probit Model Uygulaması
57
Ii= -0.8587 + 0.0200 Xi , r2= 0.8628 r= 0.9289
s(bi) (0.0028) s= 0.2 d= 1.59
t= (7.094)
Zi= 4.1324 + 0.0201 Xi , r2= 0.8621 r= 0.9285
s(bi) (0.0028) s= 0.2 d= 1.5637
t= (7.071)
B- En Yüksek Olabilirlik Yöntemiyle Probit Modelin Elde Edilmesi
58
En Yüksek Olabilirlik Yöntemi’nde anakütle ve bu anakütleden çekilen örnek arasındaki benzerlik ilişkisinden yararlanılarak bu örneğin elde edilme olasılığını maksimum yapan parametre değerleri tahmin edilmektedir.
En Yüksek Olabilirlik Yöntemi, benzerlik fonksiyonunun maksimizasyonundan oluşmaktadır. Bu yöntemin uygulanabilmesi için hata terimlerinin dağılımının bilinmesi gereklidir.
Logit modelin en yüksek olabilirlik yöntemiyle elde edilen örneğin probit model uygulaması şu şekilde gerçekleşmiştir:
59
60
61