kukla deĞİŞkenlİ modeller

100
1 KUKLA DEĞİŞKENLİ MODELLER • Bir kukla değişkenli modeller (Varyans Analiz Modelleri) • Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller (Kovaryans Analizi Modeller) • Kukla değişkenlerin karşılıklı olarak birbirini etkilemeleri • Mevsim dalgalanmalarının ölçülmesinde kukla değişkenler

Upload: cairo-booker

Post on 14-Mar-2016

97 views

Category:

Documents


3 download

DESCRIPTION

KUKLA DEĞİŞKENLİ MODELLER. Bir kukla değişkenli modeller (Varyans Analiz Modelleri). Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller (Kovaryans Analizi Modeller). Kukla değişkenlerin karşılıklı olarak birbirini etkilemeleri. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: KUKLA DEĞİŞKENLİ MODELLER

1

KUKLA DEĞİŞKENLİ MODELLER• Bir kukla değişkenli modeller (Varyans Analiz Modelleri)

• Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller (Kovaryans Analizi Modeller)

• Kukla değişkenlerin karşılıklı olarak birbirini etkilemeleri

• Mevsim dalgalanmalarının ölçülmesinde kukla değişkenler

Page 2: KUKLA DEĞİŞKENLİ MODELLER

2

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

Bir Kukla Değişkenli Modeller (Varyans Analiz Modelleri)

Har

cam

a

N

Meslek Lisesi

Devlet Lisesi

Birleştirilmiş Denklem Yıllık Okul Harcaması = 1 + 2ML + uML = 0 Devlet Lisesi Yıllık Okul Harcaması = 1 ML= 1 Meslek Lisesi Yıllık Okul Harcaması = 1 + 2

Page 3: KUKLA DEĞİŞKENLİ MODELLER

3

0.0

20000.0

40000.0

60000.0

80000.0

100000.0

120000.0

1 2 3 4 5 6 7 8 9 101Devlet Lisesi Meslek Lisesi

1

ML = 0 Devlet Lisesi

ML= 1 Meslek LisesiYıllık Okul Harcaması = b1 + b2 ML + u

Page 4: KUKLA DEĞİŞKENLİ MODELLER

4

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLERHa

rcam

a

N

Meslek Lisesi

Devlet Lisesi

KUKLA DEĞİŞKENLERİN DİĞER KANTİTATİF DEĞİŞKENLERLE ALINDIĞI MODELLER

(KOVARYANS ANALİZİ MODELLER)

Harcama:Okul harcaması

N:Öğrenci sayısı

Bu kukla değişkenlerin açıklayıcı değişken olarak regresyon denkleminde nasıl yer aldıkları incelenecektir.

Page 5: KUKLA DEĞİŞKENLİ MODELLER

5

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

Meslek lisesindeki öğrenciler belirli meslek dallarında yetenek sahibi olmaya çalışırken her meslek grubuna özgü gerekli olan araç ve gereçlerin temini için devlet lisesinde okuyan öğrencilere göre yıl içerisinde daha fazla harcama yapmaları gerekmektedir.

Her iki lisede okuyan öğrencilerin harcamaları arasındaki farkı görmek için birinci yol iki grup içinde ayrı ayrı regresyon denklemi oluşturmaktır.

Bununla birlikte iki ayrı regresyon denklemi kurmanın bazı sakıncaları olmaktadır. Bu sakıncalardan bir tanesi; büyük bir anakütle ile çalışmak yerine ayrı ayrı küçük örneklemler ile çalışmak katsayı tahminlerinin doğruluğu üzerinde ters etki olmasına neden olacaktır.

Page 6: KUKLA DEĞİŞKENLİ MODELLER

6

OCC = 0 Devlet Lisesi Harcama = 1 + 2N + uOCC = 1 Meslek Lisesi Harcama= 1' + 2N + u

İki lise harcamaları arasındaki fark için diğer bir yol ise ; meslek lisesi harcama denkleminin sabit terimi 1' in devlet lisesinden daha büyük olduğunu varsayan bir hipotez kurmaktır.

Harc

ama

N

Meslek Lisesi

Devlet Lisesi

1

1'

Aslında, bu varsayım ile her iki lise için yıllık marjinal maliyetlerin aynı fakat sabit maliyetlerin farklı olduğu varsayımı yapılmaktadır. Marjinal maliyet varsayımı görünüşte makul gözükmese de, bu varsayım anlatımı kolaylaştırmak için yapılmaktadır.

Page 7: KUKLA DEĞİŞKENLİ MODELLER

7

Har

cam

a

N

Meslek Lisesi

Devlet Lisesi

İki sabit terim arasındaki fark olarak tanımlanabilir: = 1' - 1.

1

1'

Devlet Lisesi Harcama = 1 + 2N + u Meslek Lisesi Harcama = 1' + 2N + u

Page 8: KUKLA DEĞİŞKENLİ MODELLER

8

1' = 1 + olacaktır ve meslek lisesine ait harcama fonksiyonu aşağıdaki gibi yazılabilir:

OCC = 0 Devlet Lisesi Harcama = 1 + 2N + uOCC = 1 Meslek Lisesi Harcama = 1 + + 2N + u

= 1' - 1 idi.

Artık iki harcama fonksiyonunu birleştirip kukla değişken ML oluşturulabilir. ML öğrenci devlet lisesine gidiyor ise 0 değerini, meslek lisesine gidiyor ise 1 değerini almaktadır.

Birleştirilmiş Denklem Harcama = 1 + ML + 2N + uML = 0 Devlet Lisesi Harcama = 1 + 2N + uML= 1 Meslek Lisesi Harcama = 1 + + 2N + u

Page 9: KUKLA DEĞİŞKENLİ MODELLER

9

Her zaman kukla değişkenler sadece iki değer alırlar; 0 yada 1. Eğer ML 0 değerini alır ise harcama fonksiyonu devlet lisesine giden öğrencilerin harcama fonksiyonu olmakta, yada eğer ML 1 değerini alırsa harcama fonksiyonu meslek lisesine giden öğrencilerin harcama fonksiyonu olmaktadır.

Har

cam

a

N

Meslek Lisesi

Devlet Lisesi

1

1+

Birleştirilmiş Denklem Harcama = 1 + ML + 2N + uML = 0 Devlet Lisesi Harcama = 1 + 2N + uML= 1 Meslek Lisesi Harcama = 1 + + 2N + u

Page 10: KUKLA DEĞİŞKENLİ MODELLER

10

Bu aşamada bir şehirdeki 74 lise için gerçek veri setini kullanarak regresyon denklemi oluşturulabilir.

0100000200000300000400000500000600000700000

0 500 1000 1500

N

Har

cam

a

MeslekLisesiDevletLisesi

Page 11: KUKLA DEĞİŞKENLİ MODELLER

11

Okul Okul Tipi Okul Harcaması N ML

1 Meslek 345,000 623 1

2 Meslek 537,000 653 1

3 Devlet 170,000 400 0

4 Meslek 526.000 663 1

5 Devlet 100,000 563 0

6 Devlet 28,000 236 0

7 Devlet 160,000 307 0

8 Meslek 45,000 173 1

9 Meslek 120,000 146 1

10 Meslek 61,000 99 1

Tablo ilk 10 okulun verilerini göstermektedir. Yıllık harcama yuan olarak ölçülmüştür. Bir yuan yaklaşık olarak 20 U.S centine eşittir. N okullardaki öğrenci sayısıdır.

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

ML okul tipini gösteren kukla değişkendir.

Page 12: KUKLA DEĞİŞKENLİ MODELLER

12

. reg Harcama N ML

Source | SS df MS Number of obs = 74---------+------------------------------ F( 2, 71) = 56.86 Model | 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000Residual | 5.6553e+11 71 7.9652e+09 R-squared = 0.6156---------+------------------------------ Adj R-squared = 0.6048 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 89248

------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML | 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons | -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61------------------------------------------------------------------------------

Her ne kadar ML kukla değişken olsa da yeni bir açıklayıcı değişkenmiş gibi düşünülerek; Harcama değişkeni , N ve ML değişkenleri üzerine regresyona tabi tutulmaktadır.

Katsayı yorumları: Regresyon sonuçları eşitlik şeklinde yeniden yazılabilir. ML değişkenine 0 ve 1 değerleri verilerek yeni eşitlikler türetilebilir.

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

Page 13: KUKLA DEĞİŞKENLİ MODELLER

13

Devlet Lisesi (ML = 0)

Harcama = -34,000 + 133,000ML + 331N

Harcama = -34,000 + 331N^

^

Eğer ML=0 olursa, devlet lisesine ait eşitlik elde edilir. Buradan yıllık marjinal harcamanın öğrenci başına 331 yuan olduğu ve sabit harcamanın da -34,000 Yuan olduğu ifade edilebilir.Kukla değişkenin katsayısı ile tahminlenmektedir. Meslek lisesindeki öğrenciler için extra yıllık sabit harcamayı ifade etmektedir.

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

Page 14: KUKLA DEĞİŞKENLİ MODELLER

14

Devlet Lisesi (ML= 0)

Meslek Lisesi (ML = 1)

Eğer ML yerine 1 değeri konulursa, meslek lisesi öğrencileri için yıllık sabit harcamayı 99,000 yuan olarak hesaplayabiliriz. Meslek lisesindeki öğrencinin marjinal harcaması ise devlet okulundaki öğrenci ile aynıdır.

Harcama = -34,000 + 133,000ML + 331N

Harcama = -34,000 + 331N

Harcama = -34,000 + 133,000 + 331N = 99,000 + 331N

^

^

^

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

Page 15: KUKLA DEĞİŞKENLİ MODELLER

15

Dağılma diyagramı regresyon sonuçlarından elde edilen iki harcama fonksiyonunu göstermektedir.

-100000

0

100000

200000

300000

400000

500000

600000

700000

0 500 1000 1500

Har

cam

a

N

Meslek Lisesi

Devlet Lisesi

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

Page 16: KUKLA DEĞİŞKENLİ MODELLER

16

. reg Harcama N ML

Source | SS df MS Number of obs = 74---------+------------------------------ F( 2, 71) = 56.86 Model | 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000Residual | 5.6553e+11 71 7.9652e+09 R-squared = 0.6156---------+------------------------------ Adj R-squared = 0.6048 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 89248

------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML | 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons | -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61------------------------------------------------------------------------------

Kukla değişkeninin katsayısını test etmek için; H0: = 0 ve H1: ≠ 0 hipotezleri t testi yardımı ile test edilebilir. Bir başka ifadeyle, H0 hipotezi iki okul türü arasında sabit harcamalar bakımından fark olmadığını ifade etmektedir. ML’nin katsayısının prob değeri 0.05 önem düzeyinden küçük olduğu için H0 hipotezi reddedilebilmektedir. Yani iki okul türünün sabit harcamaları arasında fark vardır.

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

Page 17: KUKLA DEĞİŞKENLİ MODELLER

17

reg Harcama N ML

Source | SS df MS Number of obs = 74---------+------------------------------ F( 2, 71) = 56.86 Model | 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000Residual | 5.6553e+11 71 7.9652e+09 R-squared = 0.6156---------+------------------------------ Adj R-squared = 0.6048 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 89248

------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML| 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons | -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61------------------------------------------------------------------------------

Benzer şekilde diğer katsayılar içinde t-testi yapabiliriz. İlk olarak N ele alınırsa; N ‘in katsayısının da istatistiksel olarak anlamlı olduğu söylenebilir. Bu da bize marjinal harcamaların istatistiksel olarak sıfırdan oldukça farklı olduğunu göstermektedir.

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

Page 18: KUKLA DEĞİŞKENLİ MODELLER

18

. reg Harcama N ML

Source | SS df MS Number of obs = 74---------+------------------------------ F( 2, 71) = 56.86 Model | 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000Residual | 5.6553e+11 71 7.9652e+09 R-squared = 0.6156---------+------------------------------ Adj R-squared = 0.6048 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 89248

------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML | 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons | -33612.55 23573.47 -1.426 0.158 -80616.71 13391.61------------------------------------------------------------------------------

1 = 0 yani sabit terim için t istatistiğine baktığımızda bu katsayının anlamsız olduğu görülmektedir.

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER

Page 19: KUKLA DEĞİŞKENLİ MODELLER

19

BİRDEN FAZLA KUKLA DEĞİŞKENLİ MODELLER

Harcama:Okul harcaması

Sadece bir Di kukla değişkenli modellerin yanında, D sayısı iki, üç, hatta yirmiye kadar olan modeller de söz konusu olmaktadır.

Daha önce devlet lisesi ve meslek liseleri arasındaki harcama fonksiyonu arasındaki farkı belirtmek için kukla değişken kullanmıştık.

Şangay’da iki tip devlet okulu bulunmaktadır.

Bunlardan bir tanesi olağan akademik eğitimin verildiği genel liseler, diğeri ise akademik eğitim ile birlikte ticaret eğitimi veren ticaret liseleridir.

Harcama = 1+ TTEK + NNİT + İTİC + 2N + u

Page 20: KUKLA DEĞİŞKENLİ MODELLER

20

Harcama = 1+ TTEK + NNİT + İTİC + 2N + u

Ticaret okullarının öğretim programı genel liselerden çok az bir farklılık göstermekte, sadece genel liselere göre birkaç ticaret eğitimleri bulunmaktadır.

Aynı şekilde iki tip meslek lisesi bulunmaktadır. Teknik eğitim okulları(TEK) ve Nitelikli (NİT) öğrenci yetiştiren liselerdir. Sonuçta kalitatif değişkenimiz dört gruba sahiptir.

Uygulamada; bir kategori temel sınıf olarak seçilmektedir ve buna bağlı olarak diğer kukla değişkenler tanımlanmaktadır. Genellikle, kategoriler içerisinde en basit ve normal olan kategori temel sınıf olarak seçilmektedir.

Page 21: KUKLA DEĞİŞKENLİ MODELLER

21

Harcama = 1+ TTEK + NNİT + İTİC + 2N + u

Şangay örneğinde genel liseleri temel sınıf olarak seçmek en uygundur. Çünkü genel liseler sayıca çok olan liselerdir ve diğer liseler genel liselerin birer varyasyonlarıdır. Dolayısıyla okul tiplerine bağlı olarak üç tane kukla değişken tanımlayabiliriz. TEK : teknik eğitim okulları için kukla değişken; eğer öğrenci teknik okula gidiyorsa 1, diğer durumda 0 değerini alan kukla değişken.

Benzer şekilde NİT ve TİC kukla değişkenleri sırasıyla nitelikli öğrenci yetiştiren ve ticaret eğitimi veren okullar için birer kukla değişkenlerdir.

Her bir kukla değişkenin katsayı değeri bulunmaktadır ve bu katsayılar temel kategoriye göre her bir okul için ayrı ayrı ekstra harcama maliyetlerini ifade etmektedir.

Dikkat edilirse temel kategori (referans kategori) modelde yer almamaktadır ve çıkarılmış kategori olarak ifade edilir.

Page 22: KUKLA DEĞİŞKENLİ MODELLER

22

Eğer gözlem genel lise ile ilgili ise; diğer kukla değişkenler sıfır değerini almakta ve regresyon modeli en basit duruma indirgenmektedir.

Harcama = 1+ TTEK + NNİT + İTİC + 2N + u

Genel Lise Harcama = 1+ 2N + u(TEK = NİT = TİC = 0)

Page 23: KUKLA DEĞİŞKENLİ MODELLER

23

Eğer gözlem teknik lise ile ilgili ise; TEK değişkeni 1 değerini, diğer kukla değişkenlerde 0 değerini almaktadır. Regresyon denklemi ise yukarıda gösterildiği gibi olmaktadır.

Harcama = 1+ TTEK + NNİT + İTİC + 2N + u

Genel Lise Harcama = 1+ 2N + u(TEK = NİT = TİC = 0)

Teknik Lise Harcama = (1+ T) + 2N + u(TEK = 1; NİT= TİC = 0)

Page 24: KUKLA DEĞİŞKENLİ MODELLER

24

Harcama = 1+ TTEK + NNİT + İTİC + 2N + u

Genel Lise Harcama = 1+ 2N + u(TEK = NİT = TİC = 0)

Teknik LiseHarcama = (1+ T) + 2N + u(TEK = 1; NİT = TİC = 0)

Nitelikli Öğr. Yet. Lİsesi Harcama = (1+ N) + 2N + u(NİT= 1; TEK = TİC = 0)

Ticaret Lisesi Harcama = (1+ Tİ) + 2N + u(TİC = 1; TEK = NİT = 0)

Benzer şekilde gözlem nitelikli öğrenci yetiştiren lisesi yada Ticaret lisesi ise, regresyon denklemleri yukarıda gösterildiği gibi oluşturulmaktadır.

Page 25: KUKLA DEĞİŞKENLİ MODELLER

25

Yukarıdaki diyagram modeli grafiksel olarak göstermektedir. katsayısı; teknik, nitelikli ve ticaret lisesi için genel liseye göre ekstra gider harcamalarını ifade etmektedir.

Har

cam

a

N

1+T

1+

1+İ

1

Nitelikli

Ticaret

N

İ

T

Teknik

Genel

Page 26: KUKLA DEĞİŞKENLİ MODELLER

26

Dikkat edilecek olurda katsayıların büyüklülüğü ve işaretleri için önceden bir varsayımda bulunulmamaktadır. Örnek verilerinden tahminlenecektir.

Har

cam

a

N

1+T

1+N

1+Tİ

1

Nitelikli

Ticaret

N

T

Teknik

Genel

Page 27: KUKLA DEĞİŞKENLİ MODELLER

27

Okul Tip Harcama N TEK NİT TİC

1 Teknik 345,000 623 1 0 02 Teknik 537,000 653 1 0 03 Genel 170,000 400 0 0 04 Nitelikli 526.000 663 0 1 05 Genel 100,000 563 0 0 06 Ticaret 28,000 236 0 0 17 Ticaret 160,000 307 0 0 18 Teknik 45,000 173 1 0 09 Teknik 120,000 146 1 0 0

10 Nitelikli 61,000 99 0 1 0

Yukarıdaki tabloda 74 liseden 10 tanesine ait veriler gösterilmektedir. Her bir kukla değişken TEK, NİT ve TİC kukla değişkenleri okul tiplerine göre oluşturulmuştur.

Page 28: KUKLA DEĞİŞKENLİ MODELLER

28

Dağılma diyagramı yeni okulların verilerini göstermektedir.

0100000200000300000400000500000600000700000

0 500 1000 1500

Harc

ama

NTeknik Lise Ticaret Lisesi Genel Lise Nitelikli Lisesi

Page 29: KUKLA DEĞİŞKENLİ MODELLER

29

. reg Harcama N TEK NİT TİC

Source | SS df MS Number of obs = 74---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578

------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748------------------------------------------------------------------------------

Verilere ait regresyon sonuçları tabloda gösterilmiştir. N in katsayısı her bir öğrenci için marjinal harcamayı ifade etmektedir ve yaklaşık 343 yuandır.

Page 30: KUKLA DEĞİŞKENLİ MODELLER

30

. reg Harcama N TEK NİT TİC

Source | SS df MS Number of obs = 74---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578

------------------------------------------------------------------------------ Harcama| Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748------------------------------------------------------------------------------

TEK, NİT ve TİC değişkenlerinin katsayıları 154,000, 143,000, ve 53,000 sırasıyla genel liselere göre ilave yıllık sabit harcamaları ifade etmektedir.

Page 31: KUKLA DEĞİŞKENLİ MODELLER

31

. reg Harcama N TEK NİT TİC

Source | SS df MS Number of obs = 74---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578

------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748------------------------------------------------------------------------------

Sabit terim genel liselerde sabit harcamaların -55000 yuan olduğunu söylemektedir.

Page 32: KUKLA DEĞİŞKENLİ MODELLER

32

Harcama = -55,000 + 154,000TEK + 143,000NİT+ 53,000TİC + 343N

En üsteki regresyon sonuçlarını göstermektedir. Her bir okul için harcama fonksiyonları ayrı ayrı gösterilecektir.

^

Page 33: KUKLA DEĞİŞKENLİ MODELLER

33

Harcama= -55,000 + 154,000TECH + 143,000NİT + 53,000TİC + 343N

Genel Lise Harcama = -55,000 + 343N(TEK= NİT = TİC = 0)

Öğrenci başına yıllık marjinal harcama 343 yuandır. Öğrenci başına yıllık sabit harcamalar her bir okul için -55,000 yuan olarak tahmin edilmiştir.

^

^

Page 34: KUKLA DEĞİŞKENLİ MODELLER

34

Harcama = -55,000 + 154,000TEK + 143,000NİT + 53,000TİC + 343N

Genel Lise Harcama = -55,000 + 343N(TEK= NİT = TİC = 0)

Teknik Lise Harcama = -55,000 + 154,000 + 343N(TEK = 1; NİT = TİC = 0) = 99,000 + 343N

Genel liseye göre teknik lisenin ekstra yıllık sabit harcaması 154,000 yuan olarak tahminlenmiştir.

^

^

^

Page 35: KUKLA DEĞİŞKENLİ MODELLER

35

Harcama = -55,000 + 154,000TEK + 143,000NİT + 53,000TİC + 343N

Genel Lise Harcama = -55,000 + 343N(TEK= NİT = TİC = 0)

Teknik Lise Harcama = -55,000 + 154,000 + 343N(TEK = 1; NİT = TİC = 0) = 99,000 + 343N

Nitelikli Lisesi Harcama = -55,000 + 143,000 + 343N(NİT = 1; TEK = TİC = 0) = 88,000 + 343N

Ticaret Lisesi Harcama = -55,000 + 53,000 + 343N(TİC = 1; TEK = NİT = 0) = -2,000 + 343N

Benzer şekilde nitelikli öğrenci yetiştiren ve ticaret okulunun genel liseye göre yıllık ekstra harcaması 143,000 and 53,000 yuandır.

^

^

^

^

^

Page 36: KUKLA DEĞİŞKENLİ MODELLER

36

Dikkat edilirse öğrenci başına yıllık marjinal harcama 343 yuan olarak tahmin edilmiştir.

^

^

^

^

^

Harcama = -55,000 + 154,000TECH + 143,000NİT + 53,000TİC + 343N

Genel Lise Harcama = -55,000 + 343N(TEK = NİT = TİC = 0)

Teknik Lise Harcama = -55,000 + 154,000 + 343N(TEK = 1; NİT = TİC = 0) = 99,000 + 343N

Nitelikli Lisesi Harcama = -55,000 + 143,000 + 343N(NİT = 1; TEK = TİC = 0) = 88,000 + 343N

Ticaret Lisesi Harcama = -55,000 + 53,000 + 343N(TİC = 1; TEK = NİT = 0) = -2,000 + 343N

Page 37: KUKLA DEĞİŞKENLİ MODELLER

37

Dört harcama grafiği şekilde gösterilmiştir.

-100000

0

100000

200000

300000

400000

500000

600000

700000

0 200 400 600 800 1000 1200 1400

Har

cam

a

N

Teknik Lise Ticaret Lisesi Genel Lise Nitelikli

Page 38: KUKLA DEĞİŞKENLİ MODELLER

38

. reg Harcama N TEK NİT TİC

Source | SS df MS Number of obs = 74---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578

------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748------------------------------------------------------------------------------

Bütün katsayılar için t-testi yapabiliriz. N değişkenin katsayısı için t istatistiği 8.52 ve bu da bize beklenildiği gibi marjinal harcamaların istatistiksel olarak sıfırdan oldukça farklı olduğunu göstermektedir.

Page 39: KUKLA DEĞİŞKENLİ MODELLER

39

. reg Harcama N TEK NİT TİC

Source | SS df MS Number of obs = 74---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578

------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK| 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748------------------------------------------------------------------------------

Ayrıca teknik lise t-istatistiği katsayısı da istatistiksel olarak anlamlıdır. Bunun anlamı ise teknik lise yıllık sabit harcamalarının genel liselerin sabit harcamalarından oldukça büyük olduğunu göstermektedir.

Page 40: KUKLA DEĞİŞKENLİ MODELLER

40

. reg Harcama N TEK NİT TİC

Source | SS df MS Number of obs = 74---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578

------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748------------------------------------------------------------------------------

Benzer şekilde vasıflı NİT lerin t istatistiği 5.15 olarak bulunmuştur.

Page 41: KUKLA DEĞİŞKENLİ MODELLER

41

. reg Harcama N TEK NİT TİC

Source | SS df MS Number of obs = 74---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578

------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748------------------------------------------------------------------------------

Bununla birlikte Ticaret lisesinin t istatistiği sadece 1.71 dir ve bu da ticaret lisesi sabit harcamalarının genel lise sabit harcamalarında yeterince farklı olmadığını göstermektedir.Bu sonuç çok şaşırtıcı değil, çünkü ticaret lisesi genel liselerden çok farklı bir eğitime sahip değil.

Page 42: KUKLA DEĞİŞKENLİ MODELLER

42

. reg Harcama N TEK NİT TİC

Source | SS df MS Number of obs = 74---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578

------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748------------------------------------------------------------------------------

Son olarak kukla değişkenlerin ortak açıklayıcısı gücünü test etmek için F testi yapabiliriz. H0: T = N = Tİ = 0 olarak tanımlanabilir. Alternatif hipotez ise en az bir sıfırdan farklıdır şeklinde kurulmaktadır.

Page 43: KUKLA DEĞİŞKENLİ MODELLER

43

. reg Harcama N TEK NİT TİC

Source | SS df MS Number of obs = 74---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578

------------------------------------------------------------------------------ Harcama| Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK | 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT | 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC | 53228.64 31061.65 1.714 0.091 -8737.646 115194.9 _cons | -54893.09 26673.08 -2.058 0.043 -108104.4 -1681.748------------------------------------------------------------------------------

Kukla değişkenli modelinde hata kareler toplamı 5.41×1011.

Page 44: KUKLA DEĞİŞKENLİ MODELLER

44

. reg Harcama N

Source | SS df MS Number of obs = 74---------+------------------------------ F( 1, 72) = 46.82 Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940---------+------------------------------ Adj R-squared = 0.3856 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05

------------------------------------------------------------------------------ Harcama | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- N | 339.0432 49.55144 6.842 0.000 240.2642 437.8222 _cons | 23953.3 27167.96 0.882 0.381 -30205.04 78111.65------------------------------------------------------------------------------

Kukla değişkensiz modelin hata kareler toplamı 8.92×1011.

Page 45: KUKLA DEĞİŞKENLİ MODELLER

45

. reg Harcama N

Source | SS df MS Number of obs = 74---------+------------------------------ F( 1, 72) = 46.82 Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940---------+------------------------------ Adj R-squared = 0.3856 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05

. reg Harcama N TEK NİT TİC

Source | SS df MS Number of obs = 74---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578

Değişkenlerin katsayılarına 0 sınırlaması konan genel F testi uygulanabilir.

Page 46: KUKLA DEĞİŞKENLİ MODELLER

46

. reg Harcama N

Source | SS df MS Number of obs = 74---------+------------------------------ F( 1, 72) = 46.82 Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940---------+------------------------------ Adj R-squared = 0.3856 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05

. reg Harcama N TEK NİT TİC

Source | SS df MS Number of obs = 74---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578

92.1469/1041.5

3/)1041.51092.8()69,3( 11

1111

F

F istatistiğinin payında hesaplanan RSS modeldeki kukla değişken sayısına bölünmektedir. Bir başka ifadeyle, modele eklenen yeni değişken sayısına bölünmektedir.

f1 = c =3

f2 =n-k=74-5=69

Page 47: KUKLA DEĞİŞKENLİ MODELLER

47

. reg Harcama N

Source | SS df MS Number of obs = 74---------+------------------------------ F( 1, 72) = 46.82 Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940---------+------------------------------ Adj R-squared = 0.3856 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05

. reg Harcama N TEK NİT TİC

Source | SS df MS Number of obs = 74---------+------------------------------ F( 4, 69) = 29.63 Model | 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000Residual | 5.4138e+11 69 7.8461e+09 R-squared = 0.6320---------+------------------------------ Adj R-squared = 0.6107 Total | 1.4713e+12 73 2.0155e+10 Root MSE = 88578

H0 hipotezi redddilebilir

92.1469/1041.5

3/)1041.51092.8()69,3( 11

1111

F 17.6)60,3( %1.0 crit, F

Page 48: KUKLA DEĞİŞKENLİ MODELLER

48

KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU

1.HAL: Sabit Terimlerin Farklı Eğimlerin Eşit olması

i 1 2 i 3 i iY b b D b X u

i i 1 2 3 iE(Y | D 1,X ) b b b X i i 1 3 iE(Y | D 0,X ) b b X

=

Page 49: KUKLA DEĞİŞKENLİ MODELLER

49

KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU

2.HAL: Sabit Terimlerin Eşit, Eğimlerin Farklı Olması Hali

i 1 2 i i 3 i iY b b D X b X u

i i 1 2 3 iE(Y | D 1, X ) b (b b )X i i 1 3 iE(Y | D 0,X ) b b X

=

Page 50: KUKLA DEĞİŞKENLİ MODELLER

50

)

) b2 + b3

b3

b1

Yi

Xi

i i 1 3 iE(Y | D 0,X ) b b X

i i 1 2 3 iE(Y | D 1, X ) b (b b )X

Page 51: KUKLA DEĞİŞKENLİ MODELLER

51

KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU

3.HAL: Sabit Terim ve Eğimin İki Sınıf İçin Farklı Olması

i 1 2 i 3 i i 4 i iY b b D b D X b X u

i i 1 2 3 4 iE(Y | D 1, X ) (b b ) (b b )X i i 1 4 iE(Y | D 0,X ) b b X

Page 52: KUKLA DEĞİŞKENLİ MODELLER

52

Yi

Xi

i i 1 4 iE(Y | D 0,X ) b b X

i i 1 2 3 4 iE(Y | D 1,X ) (b b ) (b b )X

) b4 ) b3+b4

b1

b1+b2

Page 53: KUKLA DEĞİŞKENLİ MODELLER

53

İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ

i 1 2 i 3 i i 4 i iY b b D b D X b X u

2. Chow Testi

1. t testi ne bakılır. b3 katsayısı anlamsız ve b2 anlamlı ise 1.durum (sabit

terim farklı eğimler aynı) -b2 katsayısı anlamsız b3 anlamlı ise 2. durum (sabit

terim aynı eğimler farklı) her iki katsayı da anlamlı ise 3. durum (iki fonk.

birbirinden farklıdır denir)

Eğim farkıSabit terim farkı

Page 54: KUKLA DEĞİŞKENLİ MODELLER

54

İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ

Uygulama: Yıllık Sigara

Tüketimi

Cinsiyet (Di)(Erkek = 1, Kadın =

0)

Yıllık Gelir (Xi)

25 1 40020 0 26019 0 27024 1 36020 0 24022 1 31021 1 28018 0 20019 0 26022 1 320

i 1 2 i 3 i i 4 i iY b b D b D X b X u

Page 55: KUKLA DEĞİŞKENLİ MODELLER

55

İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ

Dependent Variable: YMethod: Least Squares Included observations: 10

Variable Coefficient Std. Error t-Statistic Prob. C 14.94231 2.598383 5.750619 0.0012Di -3.786344 3.350850 -1.129965 0.3016Xi 0.017308 0.010508 1.647020 0.1507DiX 0.017555 0.012245 1.433624 0.2017

R-squared 0.955060 Mean dependent var 21.00000Adjusted R-squared 0.932591 S.D. dependent var 2.260777S.E. of regression 0.586972 Akaike info criterion 2.061496Sum squared resid 2.067219 Schwarz criterion 2.182530Log likelihood -6.307482 F-statistic 42.50422Durbin-Watson stat 1.943502 Prob(F-statistic) 0.000195

Sabit Terim FarkıEğim Farkı

Page 56: KUKLA DEĞİŞKENLİ MODELLER

56

Sonuç olarak İki sınıf tüketim fonksiyonlarının aynı olduğunu söyleyebiliriz.

Page 57: KUKLA DEĞİŞKENLİ MODELLER

57

BİR MODELDE KUKLA DEĞİŞKENLERİN KARŞILIKLI OLARAK BİRBİRİNİ ETKİLEMELERİ PROBLEMİ

i 1 2 2 3 3 4 i iY b b D b D b X u

i 1 2 2 3 3 4 2 3 5 i iY b b D b D b D D b X u

2

1, Erkek D

0, Kadın

3

1, Şehirde Oturanlar D

0, Kırsal Kesimde Oturanlar

i iY : Tüketim,X : Gelir

i 2 3 i 1 5 iE Y | D 0,D 0,X b b X

i 2 3 i 1 2 3 4 5 iE Y | D 1,D 1,X b b b b b X

Erkeğin Tüketim Farkı Şehirde Oturanların Tüketim Farkı

Şehirde Oturan bir Erkeğin Tüketim Farkı

Page 58: KUKLA DEĞİŞKENLİ MODELLER

58

b4 katsayısının t istatistiğine bakılır. Şayet

anlamlıysa iki kukla değişkenin modelde birlikte yer

alması, bunların bireysel etkilerini azaltabilir veya

arttırabilir. Bu durumda bu katsayının modelde yer

almaması da spesifikasyon hatalarına yol açabilir.

Page 59: KUKLA DEĞİŞKENLİ MODELLER

59

MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA

Üçer Aylar

Karlar (Milyon Dolar)

Şatışlar (Milyon Dolar)

1965-I 10503 114862II 12092 123968

III 10834 121454IV 12201 131917

1966-I 12245 129911II 14001 140976

III 12213 137828IV 12820 145465

D2

01000100

D3

00100010

D4

00010001

2

1, İkinci Üç Aylık Dönem D

0, Diğer Dönemler

3

1, Üçüncü Üç Aylık Dönem D

0, Diğer Dönemler

4

1, Dördüncü Üç Aylık Dönem D

0, Diğer Dönemler

Page 60: KUKLA DEĞİŞKENLİ MODELLER

60

MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA

1 2 2 3 3 4 4 5 t ttKar b b D b D b D b (Satış) u

Dependent Variable: Kar

Variable Coefficient Std. Error t-Statistic Prob.

C 6688.363 1711.366 3.908201 0.0009

D2 1322.892 638.4745 2.071957 0.0521

D3 -217.8054 632.2552 -0.344490 0.7343

D4 183.8564 654.2925 0.281000 0.7817

Satış 0.038246 0.011481 3.331281 0.0035

R2=0.525494

İstatistiki olarak anlamsız

Page 61: KUKLA DEĞİŞKENLİ MODELLER

61

MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA

Dependent Variable: Kar

Sample: 1965:1 1970:4

VariableCoefficient Std. Error t-Statistic Prob.

C 6515.581 1623.083 4.014323 0.0006

D2 1331.352 493.0214 2.700395 0.0134

Satış 0.039310 0.010575 3.717315 0.0013

R2 = 0.515460Mevsim dalgalanmalarının etkisinde

Page 62: KUKLA DEĞİŞKENLİ MODELLER

EŞİK DEĞER ETKİLERİ*

*62-81 arası slaytlar, Mustafa SEVÜKTEKİN, Ekonometriye Giriş, 563-576

Page 63: KUKLA DEĞİŞKENLİ MODELLER

Kukla değişkenler arasında nitelik, kategorik, vasıf, özellik, ortaya çıkış ya da

gerçekleşme farklılıkları söz konusudur. Gerçek hayatta herhangi bir kukla

değişkenin vasıfları veya özellikleri arasındaki geçiş noktaları olarak

tanımlanan eşik değerler her zaman kesin sınırlarla belirlenemeyebilir. Bu

konuda uygulanabilecek bir yaklaşım, bağımlı değişkenin açıklayıcı

değişkenlere göre dağılım diyagramından açıklayıcı değişkenin

belli bir spesifik değerinden sonra kesin bir değişimin görülüp

görülmediğini incelemektir.

Ya da geleneksel uygulamalar yardımıyla benzer gözlemler ile eşik

değerler saptanmaya çalışılır. Düzeyler arasındaki farklılıklar eşik

değerlerle tanımlanabilir ve kukla değişkenler ile gösterilebilir.

Page 64: KUKLA DEĞİŞKENLİ MODELLER

Parçalı Kesikli (Spline) FonksiyonlarGenelde farklı parçaların birleştirilmesiyle oluşan kesikli yapıdaki fonksiyonlara parçalı kesikli (spline) fonksiyon

denir.

Parçalar farklı eğimli doğru parçaları olabilecekleri gibi, doğrusal olmayan fonksiyonlar da olabilir

Fonksiyon, parçalarının birleşme noktasında kırılma gösterir. Bu kırılma noktaları eşik değerler olarak nitelendirilir.

Örnek olarak; bireylerin değişen yaşlarının ve eğitim düzeylerinin gelire olan etkileri incelenmiş ve özellikle eğitim

düzeyi ile ilgili eşik değerlerden yararlanılmıştır. Eğitim düzeyi ile yaşlar arasında başka bir eşik değer tanımı

yapılabilir. Eğitim düzeyi ile ilişkilendirilen yaş eşik değerleri; 20 yaş için lisans öncesi eğitimin, 25 yaş için lisans

eğitiminin tamamlandığı şeklinde oluşturulur. Bu tanım yardımı ile kabaca bireyler için gelirin zaman profili

çıkarılabilir.

Page 65: KUKLA DEĞİŞKENLİ MODELLER

65

Gelir Yaş Eğitim LÖ L YL DO700 16 0 1 0 0 0900 17 0 1 0 0 0850 18 0 1 0 0 0

1350 19 0 1 0 0 01300 19 0 1 0 0 01200 20 1 0 1 0 01100 20 0 1 0 0 01450 20 1 0 1 0 01700 21 0 1 0 0 01750 21 0 1 0 0 02400 22 1 0 1 0 02400 23 1 0 1 0 02650 23 0 1 0 0 02000 24 0 1 0 0 01750 24 0 1 0 0 02900 24 0 1 0 0 03500 25 2 0 0 1 03200 25 1 0 1 0 02850 28 1 0 1 0 02300 28 1 0 1 0 03700 29 2 0 0 1 02850 31 0 1 0 0 04000 33 3 0 0 0 14200 34 3 0 0 0 13450 34 0 1 0 0 04000 36 2 0 0 1 03200 38 1 0 1 0 05000 42 3 0 0 1 03750 44 1 0 1 0 04300 45 2 0 0 1 0

Page 66: KUKLA DEĞİŞKENLİ MODELLER

66

Eğitim değişkeni nitel olarak orta ve lisans öncesi eğitim-öğretim (LÖ);

lisans (üniversite, yüksek okul veya M.Y. okulu) (L), yüksek lisans

(YL) ve doktora (DO) gibi sınıflandırılsın. Eğitim düzeyine ilişkin bu

düzeyler değerlendirilirken

lisans öncesi eğitim düzeyi kontrol grubu olarak seçilip 0 değerini,

lisan düzeyi 1,

yüksek lisans düzeyi 2 ve

doktora düzeyi 3 değerini alır.

Page 67: KUKLA DEĞİŞKENLİ MODELLER

Buna göre önce belirlenen yaş eşikleri için tahminler üç yaş grubuna ayrılarak tahmin edilmiştir;

Yaş ≤ 20 için Gelir1 = -1614 + 146 Yaş1

20 < Yaş ≤ 25 için Gelir2 = -4559 + 301 Yaş2

Yaş > 25 için Gelir3 = 719 + 82.9 Yaş3

biçiminde elde edilir . (1)Gelir1 = 20 yaşından küçük gelir ve yaş değişkenlerine ait gözlemler kullanılarak elde edilmiştir.

Gelir2 = 20 – 25 yaş arasındaki gelir ve yaş değişkenlerine ait gözlemler kullanılarak elde edilmiştir.

Gelir3 = 25 yaşından büyük gelir ve yaş değişkenlerine ait gözlemler kullanılarak elde edilmiştir.

Page 68: KUKLA DEĞİŞKENLİ MODELLER

Şekil 1

Page 69: KUKLA DEĞİŞKENLİ MODELLER

Yukarıda tanımlanan eşik değerle 20 ve 25 yaş sınırları

aynı zamanda birer dönme noktaları olarak da

adlandırılır. Daha sonra bu dönme noktaları kukla

değişken gibi tanımlanacak olursa:

D1 = 1, eğer yaş > y1* ise

(2)D2 = 1, eğer yaş > y2

* ise

y1* ve y2

* eşik değerlerdir; y1* = 20 ve y2

* = 25 dir.

Page 70: KUKLA DEĞİŞKENLİ MODELLER

70

Yaş D1 D2 Yas1 Yas2

16 0 0 0 017 0 0 0 018 0 0 0 019 0 0 0 019 0 0 0 020 0 0 0 020 0 0 0 020 0 0 0 021 1 0 1 021 1 0 1 022 1 0 2 023 1 0 3 023 1 0 3 024 1 0 4 024 1 0 4 024 1 0 4 025 1 0 5 025 1 0 5 028 1 1 8 328 1 1 8 329 1 1 9 431 1 1 11 633 1 1 13 834 1 1 14 934 1 1 14 936 1 1 16 1138 1 1 18 1342 1 1 22 1744 1 1 24 1945 1 1 25 20

Page 71: KUKLA DEĞİŞKENLİ MODELLER

Denklem (2) eşik değerleri açısından ifade edilecek olursa;D1 = 1, eğer yaş > 20 ise

(3)

D2 = 1, eğer yaş > 25 ise

şeklinde yazılır. Denklem (1)’e kukla değişkenler dahil ederek

aşağıdaki (4) nolu denklem tahmin edilmiştir:

Gelir = β0 + β1 Yaş + α1 D1 + γ1 D1 Yaş + α2 D2 + γ2 D2 Yaş + u (4)

Gelir = -1614 + 146 Yaş – 2945 D1 + 155 D1 Yaş + 5278 D2 – 218 D2 Yaş (5)

Page 72: KUKLA DEĞİŞKENLİ MODELLER

Şekil 2

Page 73: KUKLA DEĞİŞKENLİ MODELLER

Birinci eşik değer öncesi grup için yani, lisans eğitimi

olmayan bireyler için gelir ve yaş ilişkisi;

(Yaş ≤ 20) = -1614 + 146 Yaş (6)

Lisans eğitimi alan bireyler için gelir ve yaş ilişkisi;

(20 < Yaş ≤ 25) = -4559 + 301 Yaş (7)

ve lisansüstü (yüksek lisans + doktora) eğitimi alan bireyler

için gelir ve yaş ilişkisi;

(Yaş > 25) = 719 + 83 Yaş (8)

Dikkat edilecek olursa denklem (1)’de elde edilen sonuçlar ve

denklem (5)’de elde edilen sonuçlar aynıdır.

Page 74: KUKLA DEĞİŞKENLİ MODELLER

Parçalı Sürekli (Piecewise) Fonksiyonlar

Ekonomik modellerin birçoğunda herhangi bir açıklayıcı

değişken ya da değişkenlerde küçük bir değişme

olduğunda bağımlı değişken üzerindeki etkinin ölçülmesi

gerekir. Dolayısıyla bir ekonomik modelde özellikle

niteliksel veya kukla değişken kullanıldığında regresyon

modelinin hem sabit, hem eğim, hem de her ikisinde bir

kayma ve değişme hesaplanmak istendiğinde temel model

yapısı yeniden gözden geçirilmelidir.

Page 75: KUKLA DEĞİŞKENLİ MODELLER

Daha ayrıntılı analiz için kesikli parçalardan oluşan bir

model sürekli olarak tahmin edilmek istenirse bazı

kısıtlamalarla bu sağlanabilir. Örnekte bazı kısıtlamalar

ile eğitimdeki değişmelere izin verilebilir. Aşağıda gelir

ve yaş ilişkisinin grafiği verilmiştir.

Page 76: KUKLA DEĞİŞKENLİ MODELLER

Şekil 3

Page 77: KUKLA DEĞİŞKENLİ MODELLER

Şekilde tire çizgili fonksiyonlar üç parçalı ve eğimleri birbirinden farklı olan ve farklı yaş grubundaki kişilere ilişkin gelir fonksiyonlarıdır.

Bu fonksiyonların tahminleri denklem (1) ve şekil 1’de verilmiştir. Bu parçalı fonksiyonların spline fonksiyon tahmini denklem (5) ve regresyon doğrusu şekil 2’de verilmiştir.

Gelir = -1614 + 146 Yaş – 2945 D1 + 155 D1 Yaş + 5278 D2 – 218 D2 Yaş (5)

Farklı yaş grupları açısından regresyon doğruları süreksiz (kesikli) bir yapı gösterse de, yaşın gelir üzerindeki etkisine ilişkin gerçek doğru model, yapısal kırılmalı (eşik değerli) sürekli bir modeldir.

Page 78: KUKLA DEĞİŞKENLİ MODELLER

Eğer yaşın bir fonksiyonu olarak gelir açıklanmak

istenirse, eğitim düzeylerine bağlı olarak bazı eşik

değerler dikkate alındığında yapısal kırılmalar ortaya

çıkacaktır. Bu durumda fonksiyonda kırılmadan

kaynaklanan kesiklilik (veya süreksizlik) söz konusu olur.

Yani gelir düzeyinde yıldan yıla kaymalar yaşanabilir.

Page 79: KUKLA DEĞİŞKENLİ MODELLER

Dolayısıyla fonksiyon üç düz doğrudan oluşan bir parçalı

(piecewise) doğrusal modeldir. Parçalı doğrusal

modeller oldukça büyük modeller setinin veya spline

olarak adlandırılan ilişkilerin özel bir halidir. Spline

fonksiyonlar ayrı ayrı fonksiyonlardır, fakat her bir

parçayı gösteren eğri sürekli bir fonksiyondur ve düz bir

doğru şart değildir.

Page 80: KUKLA DEĞİŞKENLİ MODELLER

Örnekte yaş değişkeni için aşağıdaki gibi tanımlamalar

yapılabilir:

Yaş1 = Yaş

Yaş2 = Yaş – 20, Eğer yaş > 20 ise

değilse 0

Yaş3 = Yaş – 25, Eğer yaş > 25 ise

değilse 0

Page 81: KUKLA DEĞİŞKENLİ MODELLER

ve denklem (4) bu tanımlamalar ile yeniden yazılırsa;

Gelir = β0 + β1 Yaş1 + γ1 D1 Yaş2 + γ2 D2 Yaş3 + u (6)

denklemi elde edilir. Denklem (6) tahmin edilerek;

Gelir = -2003 +169 Yaş + 141 D1 Yaş2 – 236 D2 Yaş3 (7)

sonucu elde edilir. Buna göre parçalı doğrusal modeli

aşağıda şekil 4’de görülmektedir. Kırılma (eşik)

noktalarında fonksiyonun farkı şekil 2 ile

karşılaştırılabilir.

Page 82: KUKLA DEĞİŞKENLİ MODELLER

Şekil 4

Page 83: KUKLA DEĞİŞKENLİ MODELLER

83

ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI

UYGULAMA: 1935-1954 yıllarına arasında General Motor, Westinghouse ve General Electric firmalarna ait yatırım (Y), firmanın değeri (X2 ) ve sermaye stoğu (X3) verilerine ait tablo aşağıda verilmiştir.

Page 84: KUKLA DEĞİŞKENLİ MODELLER

84

ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI

Firmaların yatırımları arasında fark olup olmadığını inceleyebilmek için de kukla değişkenlerden yararlanabiliriz. Firmaların ilk üç yıllarına ait veriler ile oluşturulan yeni tablo aşağıdaki gibidir.

Yıllar Y X2 X3 Di Firma1935 317.6 3078.5 2.8 1 GM1936 391.8 4661.7 52.6 1 GM1937 410.6 5387.1 156.9 1 GM1935 12.93 191.5 1.8 0 WE1936 25.90 516.0 0.8 0 WE1937 35.05 729.0 7.4 0 WE1935 33.1 1170.6 97.8 0 GE1936 45.0 2015.8 104.4 0 GE1937 77.2 2803.3 118.0 0 GE

Page 85: KUKLA DEĞİŞKENLİ MODELLER

85

ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI

i

1, G.M gözlemleri için D

0, Diğerleri için

GM yatırımlarının diğer firma yatırımlarından sabit terim kadar farklı olduğunu ifade etmektedir.

i 1 2 2 3 3 4 i iY b b X b X b D u

Page 86: KUKLA DEĞİŞKENLİ MODELLER

86

Dependent Variable: YMethod: Least SquaresIncluded observations: 60

Variable Coefficient Std. Error t-Statistic Prob. C -61.80754 23.79039 -2.598004 0.0120X2 0.038311 0.016752 2.286884 0.0260X3 0.347303 0.032048 10.83683 0.0000Di 278.5911 51.74338 5.384091 0.0000

R-squared 0.924866 Mean dependent var 251.067Adjusted R-squared 0.920841 S.D. dependent var 311.6501S.E. of regression 87.68352 Akaike info criterion 11.84969Sum squared resid 430550.4 Schwarz criterion 11.9893Log likelihood -351.4906 F-statistic 229.7778Durbin-Watson stat 0.502776 Prob(F-statistic) 0.000000

ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI

İstatistiki olarak anlamlı

GM yatırımları, diğer firma yatırımlarından farklı ve fazladır.

Page 87: KUKLA DEĞİŞKENLİ MODELLER

87

ÖRNEKLER

Page 88: KUKLA DEĞİŞKENLİ MODELLER

88

Yi = + Di +ui

Yi = Öğretim Üyelerinin Yıllık Maaşları

Di = 1 Öğretim Üyesi Erkekse

= 0 Diğer Durumlar (yani Kadın Öğretim Üyesi)

Varyans Analiz Modelleri (ANOVA)

Kadın Öğretim Üyelerinin Ortalama Maaşları: E( Yi|Di = 0 ) =

Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Yi|Di = 1) = +

Örnek:Özel bir üniversitede öğretim üyelerinin yıllık maaşları ile cinsiyetleri arasında önce varyans daha sonra tecrübe değişkeni eklenerek kovaryans modeli oluşturulacaktır:

Page 89: KUKLA DEĞİŞKENLİ MODELLER

89

Yi = + Di

(0.32) (0.44)

t (57.74)(7.44) , R2=0.8737

1516171819202122232425

-0.5 0 0.5 1 1.5 2

3.280

18.00

21.280

Page 90: KUKLA DEĞİŞKENLİ MODELLER

90

Yi = + Di + Xi + ui

Yi = Öğretim Üyelerinin Yıllık Maaşları

Xi = Öğretim Üyesinin Yıl olarak Tecrübesi

Di = 1 Öğretim Üyesi Erkekse

= 0 Diğer Durumlar (yani Kadın Öğretim Üyesi)

Kadın Öğretim Üyelerinin Ortalama Maaşları :

E( Yi|Xi,Di = 0 ) = Xi

Erkek Öğretim Üyelerinin Ortalama Maaşları :

E ( Yi|Xi,Di = 1) = ( + Xi

Page 91: KUKLA DEĞİŞKENLİ MODELLER

91

Maaş Cinsiyet Tecrübe22 1 1619 0 1218 0 12

21.7 1 1518.5 0 1021 1 11

20.5 1 1317 0 8

17.5 0 921.2 1 14

Page 92: KUKLA DEĞİŞKENLİ MODELLER

92

Yıll

ık M

aaş

Tecrübe (yıl olarak)

Y

X

2

1

YXi

Y( + Xi

Kadın

Erkek

Yi = + Di + 0.289 Xi

s(b) (0.95) (0.44) (0.09)

p (0.000) (0.002) (0.020) , R2=0.949

Di = 1 Öğretim Üyesi Erkekse = 0 Öğretim Üyesi Kadınsa

Page 93: KUKLA DEĞİŞKENLİ MODELLER

93

DATA7-191960-1988 yılları arasında Türkiye’deki Sigara Tüketimi

Q Yetişkinlerin sigara tüketim miktarı(kg), Range 1.86 - 2.723.

Y GNP(1968) TL, Range 2560 - 5723.

P Türkiye’deki sigara fiyatları Range 1.361 - 3.968.

ED1 Kayıtlı ortaokul ve lise mezunu nüfus oranı(12-17 yaş) Range 0.112 - 0.451.

ED2 Kayıtlı üniversite mezunu oranı (20-24) Range 0.026 - 0.095.

D82 = 1 , 1982 ve sonrası

D86 = 1 , 1986 ve sonrası

Page 94: KUKLA DEĞİŞKENLİ MODELLER

94

Dependent Variable: QSample: 1960 1988Included observations: 29

Variable Coefficient Std. Error t-Statistic Prob.

P -0.097291 0.079389 -1.225493 0.2340ED2 -5.547295 2.679248 -2.07046 0.0509ED1 -2.994166 2.708828 -1.105336 0.2815D86 -0.262700 0.090825 -2.89238 0.0087D82 -0.288739 0.083649 -3.451774 0.0024Y 0.000762 0.000190 4.009205 0.0006C 5.1139345 0.34132 0.101585 0.9200

Katsayılar istatistiki olarak anlamsız

Page 95: KUKLA DEĞİŞKENLİ MODELLER

95

Dependent Variable: Q

Method: Least Squares

Sample: 1960 1988

Included observations: 29

Variable Coefficient Std. Error t-Statistic Prob.

ED2 -6.455259 2.724204 -2.369595 0.0266

D86 -0.351822 0.078985 -4.454297 0.0002

D82 -0.269429 0.084743 -3.179385 0.0042

Y 0.000672 0.000170 3.945228 0.0006

C 58.18878 33.26618 1.749187 0.0936

Page 96: KUKLA DEĞİŞKENLİ MODELLER

96

DATA7-2Belirli bir şirkette çalışan 49 kişinin istihdam durumu ve ücretleri

WAGE = Aylık Ücret (Range 981 - 3833)

EDUC = 8 yıllık eğitimden sonraki sahip olunan eğitim seviyesi(Range 1 - 11)

EXPER =Şirkette çalışma süresi(Range 1 - 23)

AGE = Yaş (25 - 64)

GENDER = 1, Erkek ise; 0 kadın ise

RACE = 1, beyaz ise; 0 diğerleri

CLERICAL = 1 büro memuru ise, 0 diğerleri

MAINT = 1 bakım işlerinde çalışıyor ise; 0 diğerleri

CRAFTS =1,usta ise; 0 diğerleri

Temel sınıf Profesyonel meslek grupları.

Page 97: KUKLA DEĞİŞKENLİ MODELLER

97

Dependent Variable: WAGE

Method: Least Squares

Included observations: 49

Variable Coefficient Std. Error t-Statistic Prob.

C 1637.202 263.6726 6.209224 0.0000

EDUC 49.33178 27.99678 1.762052 0.0855

EXPER 27.29509 9.488883 2.876533 0.0064

GENDER 473.6966 152.4818 3.106578 0.0034

RACE 207.0888 130.4491 1.587506 0.1201

CLERICAL-946.7380 174.6505 -5.420758 0.0000

MAINT -1053.424 203.4297 -5.178320 0.0000

CRAFTS -708.8822 176.0507 -4.026580 0.0002

R-squared 0.737516 Mean dependent var 1820.204

Adjusted R-squared 0.692702 S.D. dependent var 648.2687

S.E. of regression 359.3643 Akaike info criterion 14.75483

Sum squared resid 5294850. Schwarz criterion 15.06370

Log likelihood -353.4934 F-statistic 16.45717

Durbin-Watson stat 2.107977 Prob(F-statistic) 0.000000

Page 98: KUKLA DEĞİŞKENLİ MODELLER

98

DATA 7-9 1985 yılında koleje giriş yapan öğrencilerin ilk yıl başarılarını göstermekte

colgpa = 1986 sonbaharındaki ortalamaları (Range 0.85 - 3.97) hsgpa = Lise GPA (Range 2.29 - 4.5) vsat = Sözel derecesi (Range 200 - 700) msat = Sayısal derecesi (Range 330 - 770) dsci = 1 Bilim dalı için, 0 diğerleri dsoc = 1 Sosyal bilim dallı için, 0 diğerleri dhum = 1 Beşeri bilimdalı için 0 diğerleri darts = 1 Sanat dalı için, 0 diğerleri dcam = 1 Öğrenci kampüste yaşıyorsa, 0 diğerleri dpub = 1 Genel lise mezunu ise, 0 diğerleri

Page 99: KUKLA DEĞİŞKENLİ MODELLER

99

Dependent Variable: COLGPAMethod: Least Squares

Sample: 1 427Included observations: 427

Variable Coefficient Std. Error t-Statistic Prob. C 0.367296 0.224302 1.637506 0.1023HSGPA 0.405914 0.063418 6.400630 0.0000VSAT 0.000726 0.000290 2.503907 0.0127MSAT 0.001086 0.000303 3.586609 0.0004DSCI -0.027323 0.057319 -0.476673 0.6338DSOC 0.056148 0.072778 0.771494 0.4409DHUM -0.004059 0.141771 -0.028632 0.9772DARTS 0.228650 0.188921 1.210294 0.2269DCAM -0.040705 0.052162 -0.780362 0.4356DPUB 0.029403 0.063040 0.466416 0.6412

Katsayılar istatistiki olarak anlamsız

Page 100: KUKLA DEĞİŞKENLİ MODELLER

100

Dependent Variable: COLGPA

Variable Coefficient Std. Error t-Statistic Prob. C 0.423249 0.219749 1.926053 0.0548HSGPA 0.398349 0.060586 6.574882 0.0000VSAT 0.000737 0.000281 2.627361 0.0089MSAT 0.001015 0.000294 3.457749 0.0006