model pilihan kualitatif - dadang iskandar · karakteristik seperti ini adalah fungsi peluang...
TRANSCRIPT
MODEL PILIHAN KUALITATIF
Oleh
Bambang Juanda
Seringkali dalam suatu survei kita berhadapan
dengan peubah kualitatif yang mempunyai skala
pengukuran nominal atau ordinal. Nilai-nilai
peubah respons kualitatif ini terbatas (limited
dependent variable), bahkan sering hanya bernilai
dua kemungkinan saja. Misalnya, apakah
seseorang membeli mobil atau tidak; memilih
atau tidak dalam Pilkada (pemilihan kepala
daerah); punya penyakit jantung koroner atau
tidak; dan masih banyak contoh lainnya. Peubah
kualitatif yang hanya mempunyai dua
kemungkinan nilai ini disebut peubah biner.
Meskipun logis kita memperkirakan suatu
hubungan langsung antara pendapatan dan
perilaku pembelian, namun kita tidak dapat yakin
apakah masing-masing konsumen dengan
pendapatan tertentu pasti akan membeli produk.
Oleh karena itu, tujuan model pilihan kualitatif
adalah menentukan peluang bahwa individu
dengan karakteristik-karakteristik tertentu akan
memilih suatu pilihan tertentu dari beberapa
alternatif yang tersedia. Jika pilihannya hanya ada
dua alternatif disebut model pilihan biner.
Overview
C o n t i n u o u s
C a t e g o r i c a l
L i n e a r R e g r e s s i o n
A n a l y s i s
-
R e s p o n s e A n a l y s i s
-Model Peluang Linear
-Model Probit
Ilustrasi
Studi mengenai pengaruh tingkat pendapatan,
jenis kelamin dan umur terhadap membeli
tidaknya seseorang pada suatu produk yang
dijual dengan harga tertentu.
Peubah Penjelas (bebas): umur, jenis kelamin dan
tingkat pendapatan
Peubah Respons(Y): membeli (=1) atau tidak (=0)
Ilustrasi utk 1 Peubah Bebas
Studi mengenai pengaruh tk pendapatan atau
jenis kelamin (X) terhadap membeli tidaknya
seseorang (Y) pada suatu produk yang dijual
dengan harga tertentu.
Peubah Respons: Y = 1, jika membeli
0, jika tidak membeli
Peubah Penjelas (bebas):
Tk Pendapatan: X = Rp …… juta
atau Jenis Kelamin: X= 1, jika Pria
0, jika Wanita
1. Model Peluang Linear
Yi = + Xi + εi (10.1)
Dimana Xi = nilai karakteristik (misalnya pendapatan) individu ke-i,
Yi = 1 , jika pilihan kesatu dipilih (misalnya membeli mobil)
0 , jika pilihan kedua dipilih (tidak membeli mobil).
εi = peubah acak yang menyebar bebas dengan nilai tengah 0.
Untuk menginterpretasikan persamaan (10.1) kita tentukan nilai harapan dari masing-masing pengamatan peubah respons Yi :
E(Yi) = + Xi (10.2)
Karena Yi hanya mempunyai kemungkinan dua macam nilai (1 dan 0), kita dapat menggambarkan sebaran peluang Y dengan memisalkan:
Pi = P(Yi=1) dan 1-Pi = P(Yi=0),
sehingga E(Yi) = 1 (Pi) + 0 (1-Pi) = Pi. (10.3)
model (10.1) peluang bahwa individu konsumen ke-i dengan pendapatan tertentu (Xi) akan membeli mobil.
Slope garis mengukur pengaruh perubahan 1 unit pendapatan terhadap perubahan peluang membeli mobil
Dugaan Model Peluang Linear
+ Xi , jika 0<(+Xi)<1
Pi = 1 , jika (+Xi) ≥ 1
0 , jika (+Xi) ≤ 0 (10.4)
Sebaran Peluang bagi εi
Yi εi Peluang
1 1- - Xi Pi
0 - - Xi 1 - Pi
E(εi) = (1- - Xi) Pi + (- - Xi) (1-Pi) = 0
sehingga Pi = + Xi
(1-Pi) = 1 - - Xi
Ragam komponen sisaan
Jadi, peubah Y menyebar menurut
sebaran (distribusi) peluang Bernouli.
Masalah heteroskedastisitas
)1()1()()1()( 222iiiiiii PPPXPXE
)()1()](1[)()()( 2222iiiiiiiii EPPYEYEYEYEYVar
Kendala dalam model peluang linear perlu transformasi model (linear) awal sedemikian rupa sehingga prediksi nilai Y berada dalam selang (0;1) untuk semua nilai peubah bebas X. Salah satu bentuk transformasi yang mempunyai karakteristik seperti ini adalah fungsi peluang kumulatif (cumulative probability function), F.[1] Sebaran peluangnya dapat direpresentasikan dalam bentuk:
Pi = F( + Xi) = F(Zi)
Sebenarnya banyak fungsi peluang kumulatif yang mungkin dapat digunakan, namun disini hanya dua macam yang dipertimbangkan, yaitu fungsi peluang normal dan logistik kumulatif.
[1] Fungsi peluang kumulatif adalah F(xi)=Peluang (X≤xi)
Model Probit Pi = F( + Xi) = F(Zi)
asumsikan ada suatu indeks Zi yg bernilai kontinu secara teoritis, yg ditentukan oleh nilai peubah penjelas X shg dapat ditulis:
Zi = + Xi
asumsikan bahwa Z merupakan peubah acak yang menyebar normal sehingga peluang bahwa Z lebih kecil (atau sama dengan) Zi dapat dihitung dari fungsi peluang normal kumulatif. Untuk fungsi peluang normal baku kumulatif dapat dituliskan dalam rumus:
dimana s: peubah acak menyebar normal dgn nilai tengah 0 dan ragam1. Dgn rumus transformasi diatas, peubah Pi akan bernilai dlm selang (0;1). Pi menggambarkan peluang individu berkarakteristik (berpendapatan) Xi memilih pilihan-1 (beli mobil). Karena nilai peluang ini diukur berdasarkan luas daerah dibawah kurva normal baku dari - sampai Zi, maka peluang pilihan-1 (beli mobil) makin tinggi jika nilai indeks Zi makin tinggi. Untuk menduga indeks Zi, kita menggunakan kebalikan (inverse) dari fungsi normal baku kumulatif (10.9) dengan:
Zi = F-1(Pi) = + Xi
i
Zs
ii dseZFP 22
2
1)(
Hubungan Nilai Indeks Z dan
Sebaran Peluang Normal Kumulatifnya
Z F(Z) Z F(Z)
-3.0 .001 0.5 .691
-2.5 .006 1.0 .841
-2.0 .023 1.5 .933
-1.5 .067 2.0 .977
-1.0 .159 2.5 .994
-0.5 .309 3.0 .999
0.0 .500 3.5 .999
Model (Peluang) Linear vs Model Probit
Model Linear
Meskipun model probit lebih menarik dari
model peluang linear, namun untuk
menduga parameter koefisiennya
menggunakan pendugaan kemungkinan
maksimum (maximum likelihood, ML) non
linear. Selain itu, justifikasi atau interpretasi
koefisiennya agak terbatas. Oleh karena itu
sebaiknya menggunakan model logit yang
dibahas dalam subbab berikut
menggunakan peubah penjelasnya (dpt peubah kategorik atau peubah numerik) untuk menduga peluang kejadian tertentu dari peubah respons kategori.
)(
)(
10
10
1)/1(
i
i
X
X
iie
eXYE
)()( 1
1
1
1)(
10XgXii
eePXP
i
Model Regresi Logistik (Model logit)
Model Logit Sederhana :
Sebaran Logistik menyerupai kurva berbentuk S,
sehingga interpretasinya logis. 0 ≤ E(Y/X) ≤ 1
Interpretasi: Peluang kejadian tertentu dari peubah respons kategori (misalnya membeli) jika pendapatannya Xi
Transformasi Logit
Peluang kejadian tertentu dari peubah respons kategori (pi), ditransformasi shg
i indeks semua kasus (observasi 1,2,..,n).
pi peluang kejadian (misalnya, membeli) terjadi untuk kasus ke-i.
log adalah natural log (bilangan dasar e).
logit( ) logpp
pi
i
i
1ii Xxg 10)(
Fungsi g(x) sudah Linear dalam Parameter,
dan -~ ≤ g(x) ≤ ~, shg dpt diduga dgn OLS
Assumption
(peubah X berskala Interval)
P i
Predictor (X)
Transformasi
logit
Predictor (X)
Interpretasi Koefisien Model Logit Utk Peubah Bebas biner, mis Jenis Kelamin (X=1, X=0)
)(101
1)1(1
e
P
0
0
1)0(
e
eP
)(
)(
10
10
1)1(
e
eP
01
1)0(1
e
P
)(
)(
10
10
1)(
i
i
X
X
ie
eXP
X=1 X=0
Y=1
Y=0
P(1) : Peluang membeli produk utk konsumen Pria
P(0) : Peluang membeli produk utk konsumen Wanita )1(1
)1(
P
POdd pria
)0(1
)0(
P
POddwanita
1 1 Jumlah
eP
P
P
POddsRatio
)0(1
)0(/
)1(1
)1( 1
Interpretasi Koefisien
1 = g(X+1) – g(X)
utk X biner: 1 = g(1) – g(0)
ii
i
i XXgXP
XP10)(
)(1
)(log
))0(1/()0(
))1(1/()1(log
)01(1
)0(log
)1(1
)1(log
PP
PP
P
P
P
P
1
)0(1/)0(
)1(1/)1( ePP
PP
Odds Ratio:
“Berapa kali Kemungkinan
membeli utk konsumen Pria
dibandingkan Konsumen Wanita”
Interpretasi Pendekatan Peluang Relatif P(1)/P(0)
ini berlaku bila P(x) kecil
Utk X kontinu, exp(1) : Berapa kali Kemungkinan
membelinya jika X naik 1 unit
Ukuran Asosiasi
Properties of the Odds Ratio
0
O D D S R A T I O O F G R O U P A T O G R O U P B
- 0 . 5
N o A s s o c i a t i o n
=x+1 =x
• SK (1-) 100% bagi Odds Ratio: exp(c ± z/2 c s)
• Dlm realitas P(x) jika x berbeda 1 unit (12 dgn 1011)
dapat cukup berbeda. →Dilema utk peubah kontinu
dimodelkan linear dlm model logit. Jika yakin bahwa logit
tdk linear dgn covariate grouping (Dummy)
^ ^
Note:
Multiple Logistic Regression
Purchase Gender Income Age
logit (pi) = 0 + 1X1 + 2X2 + 3X3
Ilustrasi model utk mengkaji pengaruh jenis kelamin (X1),
umur (X2), dan tingkat pendapatan (X2) terhadap membeli
tidaknya seseorang pada suatu produk yang dijual dengan
harga tertentu.
logit (pi) = iiii
i
i XXXXgXP
XP3322110)(
)(1
)(log
)(
)(
332210
332210
1)(
iii
iii
XXX
XXX
ie
eXP
Utk Peubah Bebas X kontinu, seringkali 1 unit terlalu kecil atau
besar utk dipertimbangkan Pendugaan utk perubahan “c” unit
1),()( c
excxc
g(x+c) – g(x) = c 1
Odds Ratio-nya:
Pengujian Model dgn p Peubah Bebas
Uji Model secara keseluruhan:
H0: 1= 2=…=p=0
H1: ada j≠0
Likelihood Ratio Test Statistics (G) ~
Uji parsial koefisien:
H0: j=0
H1: j≠0
WaldTest Statistics (W) ~ Z
2
(p)
Categorical Variables Codings
132 1,000 ,000
144 ,000 1,000
155 ,000 ,000
240 1,000
191 ,000
Low
Medium
High
INCOME
Female
Male
GENDER
Frequency (1) (2)
Parameter coding
Classification Tablea
236 33 87,7
131 31 19,1
61,9
Observed
0
1
PURCHASE
Overall Percentage
Step 1
0 1
PURCHASE Percentage
Correct
Predicted
The cut v alue is ,500a.
Variables in the Equation
.025 .018 1.974 1 .160 1.026
.511 .209 5.954 1 .015 1.667
12.305 2 .002
-.787 .253 9.676 1 .002 .455
-.686 .243 7.945 1 .005 .503
-1.325 .720 3.382 1 .066 .266
AGE
GENDER(1)
INCOME
INCOME(1)
INCOME(2)
Constant
Step
1a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AGE, GENDER, INCOME.a.
Adjusted Odds Ratio
P r e d i c t o r
G e n d e r
O u t c o m e
P u r c h a s e
C o n t r o l l i n g f o r
Types of Logistic Regression
R e s p o n s e V a r i a b l e
Y e s N o
B i n a r y T w o
C a t e g o r i e s
T y p e o f L o g i s t i c R e g r e s s i o n
B i n a r y
N o m i n a l
O r d i n a l
T h r e e o r
M o r e C a t e g o r i e s
Hipotesis: Sabuk Pengaman akan membuat Pengendara Lebih
aman jika terjadi KECELAKAAN. Pengendara yang menggunakan
Sabuk Pengaman lebih besar Peluangnya mengalami cidera lebih
ringan dibandingkan yg tdk menggunakan
1. Tidak ada yang luka
2. Terjadi luka ringan
3. Terjadi luka dan memerlukan rawat jalan
4. Terjadi luka dan memerlukan rawat inap
5. Meninggal
Regresi Logistik Ordinal • Y skala ordinal yg punya c kategori
• Peluang Kumulatif P(Y≤j): peluang respons Y pd
kategori 1,2,...,j
• P(Y≤j)=P(Y=1)+ P(Y=2)+...+ P(Y=j)
• P(Y≤1) ≤ P(Y≤2) ≤ ..... ≤ P(Y≤c)=1
• Odd ratio = P(Y≤j) / P(Y>j) = exp(β)
• Logit P(Y≤j) = Log { P(Y≤j) / P(Y>j) }
• Logit P(Y≤j) = αj + β X; j=1,2,..,c-1
• Asumsi: pengaruh X sama utk tiap peluang kumulatif.
Jika tdk, gunakan regresi logistik nominal.
• β >0: Peluang utk nilai order lebih kecil, lebih besar
jika X naik satu unit