laporan regresi logistik ordinal

11
1 LAPORAN TUGAS ANALISIS DATA KUALITATIF MODEL REGRESI LOGISTIK ORDINAL Oleh: 1. Aqidatur Riska Puspitasari (1311100008) 2. Marina Marsudi Putri (1311100028) 3. Mentari Sonya Ningtyas (1311100036) 4. Jainap Niken Melasasi (1311100049) Dosen Pengampu: Dr. Vita Ratna Sari S.Si, M.Si Jurusan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh Nopember Surabaya 2014

Upload: klinik-radiologi

Post on 13-Jul-2016

116 views

Category:

Documents


18 download

DESCRIPTION

laporan tugas analisis data kualitatif model regresi logistik original yang ditulis untuk memenuhi tugas kelompok mahasiswa jurusan statistika fakultas matematika

TRANSCRIPT

Page 1: Laporan Regresi Logistik Ordinal

1

LAPORAN TUGAS

ANALISIS DATA KUALITATIF

MODEL REGRESI LOGISTIK ORDINAL

Oleh:

1. Aqidatur Riska Puspitasari (1311100008)

2. Marina Marsudi Putri (1311100028)

3. Mentari Sonya Ningtyas (1311100036)

4. Jainap Niken Melasasi (1311100049)

Dosen Pengampu:

Dr. Vita Ratna Sari S.Si, M.Si

Jurusan Statistika

Fakultas Matematika dan Ilmu Pengetahuan Alam

Institut Teknologi Sepuluh Nopember

Surabaya

2014

Page 2: Laporan Regresi Logistik Ordinal

2

REGRESI LOGISTIK ORDINAL

1. Definisi Regresi Logistik Ordinal

Regresi logistik adalah prosedur pemodelan yang diterapkan untuk memodelkan

variabel terikat (Y) yang bersifat kategori berdasarkan satu atau lebih variabel prediktor

(X), baik itu yang bersifat kategori maupun kontinyu. Dalam dunia nyata, ada kalanya

permasalahan yang dihadapi bukan hanya variabel respon yang bersifat nominal, tetapi juga

ordinal. Pada permasalahan seperti ini bisa saja diterapkan metode regresi logistik

multinomial, tetapi bagaimanapun juga metode ini tidak memperhitungkan sifat ordinalitas

variabel respon. Oleh karena itu, regresi logistik ordinal sangatlah berperan disini.

Regresi logistik ordinal adalah salah satu metode satu metode statistika untuk

menganalisis variabel terikat yang mempunya skala ordinal yang terdiri atas tiga variabel

atau lebih. Variabel bebas yang dapat disertakan dalam model dapat berupa data kategori

atau kontinyu yang terdiri dari dua variabel atau lebih. Menurut Holmer dan Lemenshow

(2000), regresi logistik ordinal adalah suatu metode analisis yang digunakan untuk

mengetahui hubungan antara variabel respon dengan variabel prediktor, dimana variabel

responnya memiliki lebih dari dua kategori dan dalam setiap kategori memiliki tingkatan.

(Holmer dan Lemenshow, 2000)

Model yang dapat digunakan untuk regresi logistik ordinal adalah model logit. Model

logit tersebut dalam regresi logistik ordinal disebut dengan cumulative logit models. Pada

model logit ini sifat ordinal dari respon Y ditunjukkan dalam probabilitas kumulatif

sehingga cumulative logit models merupakan model yang didapatkan denga

membandingkan probabilitas kumulatif.

Perbandingan probabilitas kumulatif yaitu probabilitas yang kurang dari atau sama

dengan kategori respon ke-j dengan probabilitas yang lebih besar dari kategori

respon ke-j . Model logit dari regresi logistik ordinal tersebut adalah sebagai

berikut:

[

]

Page 3: Laporan Regresi Logistik Ordinal

3

Keterangan:

j = banyaknya kategori pada variabel respon, j = 0,1,2,3,.... j-1

k = banyaknya variabel prediktor.

Fungsi logit yang dapat dibentuk jika terdapat J kategori respon adalah sebanyak J-1

fungsi logit. Setelah diketahui fungsi logit maka selajutnya dapat dicari persamaan dari

probabilitas kumulatif kategori respon ke-j dengan penjabaran sebagai berikut:

*

+ ∑

∑ ∑

( )

∑ ( ) ∑

Sehingga didapatkan fungsi probabilitas kumulatif kategori respon ke-j sebagai berikut.

Jika menyatakan probabilitas kategori respon ke-j pada p

variabel prediktor yang dinyatakan dalam vektor dan menyatakan

probabilitas kumulatif pada variabel prediktor yang dinyatakan dalam vektor xi maka fungsi

probabilitas kumulatif tersebut dapat dinyatakan sebagai berikut:

2. Estimasi Parameter

Pada penelitian ini metode yang digunakan untuk menaksir nilai adalah metode

Maksimum Likelihood Estimation (MLE). Metode ini digunakan untuk menaksir parameter

yang tidak diketahui. Prinsip metode ini adalah menaksir nilai dengan memaksimumkan

fungsi likelihood. Bentuk umum dari fungsi likelihood untuk sampel dengan n observasi

independen, ( dimana i=1,2,..n adalah sebagai berikut

Page 4: Laporan Regresi Logistik Ordinal

4

Selanjutnya didapatkan fungsi log likelihood sebagai berikut.

∑ [ ] [ ] [ ]

Parameter-parameter diperoleh dengan menurunkan persamaan terhadap

parameter yang ingin diketahui dan selanjutnya turunan pertama tersebut disamadengankan

nol. Selanjutnya berdasarkan teori maximum likelihood, taksiran varian kovarian

didapatkan dari turunan kedua fungsi log-likeklihoodnya. Nilai parameter diestimasi dengan

menggunakan metode numerik karena persamaannya bersifat nonlinier. Metoder numerik

tersbut adalah metode iterasi Newton- Raphson (Agresti, 1990).

3. Pengujian Parameter

Menurut Hosmer dan Lameshow (2000), model yang telah diperoleh perlu diuji

kesignifikannya dengan melakukan pengujian statistik. Pengujian dilakukan terhadap

koefisien dari model yang telah diperoleh. Dalam model regresi logistik terdapat dua

jenis pengujian yaitu pengujian secara parsial dan pengujian serentak.

3.1 Uji Serentak

Uji serentak dilakukan untuk memeriksa keberartian koefisien secara keseluruhan

atau serentak. Jika parameter yang diuji signifikan maka dapat dikatakan jika model yang

dibentuk sesuai untuk memodelkan variabel respon. Hipotesis yang digunakan adalah

sebagai berikut.

H0 : 1 = 2 = p = 0

H1 : paling sedikit terdapat satu dengan k =1,2,...p

Statistik uji yang digunakan adalah statistik uji G atau likelihood ratio test.

[(

)

(

)

]

Keterangan:

n0 = banyaknya observasi yang berkategori 0

Page 5: Laporan Regresi Logistik Ordinal

5

n1 = banyaknya observasi yang berkategori 1

Daerah penolakan H0 adalah jika

dengan derajat bebas sebesar db

dimana db = (I-1)(J-1). Dalam hal ini G menyebar mengikuti distribusi Chi-square dengan

derajat bebas p.

3.2 Uji Parsial

Uji parsial digunakan untuk mengetahui signifikansi parameter terhadap variabel

respon. Statistik uji yang digunakan adalah uji Wald. Berdasarkan hasil dari uji Wald maka

akan diketahui apakah suatu variabel prediktor layak atau tidak masuk dalam model.

Hipotesis yang digunakan adalah sebagai berikut.

H0 :

H1 : dengan k = 1,2,...p

P = jumlah prediktor dalam model

Statistik uji Wald adalah sebagai berikut

Keterangan : SE ( adalah taksiran standar error parameter

Daerah penolakan H0 adalah jika atau

dengan derajat bebas

sebesar v.

4. Uji Kesesuaian Model

Uji kesesuaian model dilakukan untuk mengetahui apakah suatu model yang terbentuk

sudah sesuai untuk digunakan atau tidak. Statistik uji yang digunakan adalah uji pearson

chi-square dengan hipotesis sebagai berikut.

H0 : Model sesuai (tidak ada perbedaan yang nyata antara hasil observasi dengan

kemungkinan hasil prediksi model)

H1 : Model tidak sesuai (ada perbedaan yang nyata antara hasil observasi dengan

kemungkinan hasil prediksi model)

Statistik uji Chi-square adalah sebagai berikut:

Page 6: Laporan Regresi Logistik Ordinal

6

√ ( )

Daerah penolakan H0 jika p-value < atau

dengan derajat bebas

sebesar jumlahan dari derajat bebas sebesar jumlahan dari derajat bebas pada estimasi

parameter setiap variabel yang masuk kedalam model.

Page 7: Laporan Regresi Logistik Ordinal

7

Contoh Kasus Regresi Logistik Ordinal

Suatu penelitian dilakukan dengan tujuan untuk mengetahui faktor-faktor yang

mempengaruhi nilai IPK (Y) mahasiswa lulusan program studi Statistika FMIPA

Universitas Mulawarman, yaitu jenis kelamin (X1), jenis sekolah menengah (X2), daerah

asal (X3), pekerjaan orang tua (X4), lama studi (X5) dan usia masuk perguruan tinggi (X5),

akan dianalisis menggunakan analisis regresi logistik ordinal. Berikut adalah hasil tabulasi

silang faktor-faktor yang mempengaruhi nilai IPK (Y) mahasiswa lulusan program studi

Statistika FMIPA Universitas Mulawarman:

Tabel 1 Tabulasi Jenis Kelamin (X1) terhadap IPK (Y)

IPK Jenis Kelamin

Jumlah Perempuan Laki-Laki

Memuaskan 6 11 17

Sangat Memuaskan 39 37 76

Dengan Pujian 53 10 63

Jumlah 98 58 156

Tabel 2 Tabulasi Jenis Sekolah Menengah (X2) terhadap IPK (Y)

IPK Jenis Sekolah Menengah

Jumlah SMK/MAN SMA

Memuaskan 2 15 17

Sangat Memuaskan 6 70 76

Dengan Pujian 2 61 63

Jumlah 10 146 156

Tabel 3 Tabulasi Daerah Asal (X3) terhadap IPK (Y)

IPK Daerah Asal

Jumlah Luar Samarinda Samarinda

Memuaskan 9 8 17

Sangat Memuaskan 32 44 76

Dengan Pujian 31 32 63

Jumlah 72 84 156

Page 8: Laporan Regresi Logistik Ordinal

8

Tabel 4 Tabulasi Pekerjaan Orang Tua (X4) terhadap IPK (Y)

IPK Pekerjaan Orang Tua

Jumlah Pekerjaan Lainnya PNS Wiraswasta Swasta

Memuaskan 3 4 0 10 17

Sangat Memuaskan 9 21 11 35 76

Dengan Pujian 3 18 10 32 63

Jumlah 15 43 21 77 156

Tabel 5 Tabulasi Lama Study (X5) terhadap IPK (Y)

IPK Lama Studi (Tahun)

Jumlah 5,33 < X5 < 7 3,66 < X5 < 5,33

Memuaskan 2 15 17

Sangat Memuaskan 6 70 76

Dengan Pujian 2 61 63

Jumlah 10 146 156

Tabel 6 Tabulasi Usia (X6) terhadap IPK (Y)

IPK Usia (tahun)

Jumlah 19 < X6 < 22 16 < X6 < 19

Memuaskan 1 16 17

Sangat Memuaskan 3 73 76

Dengan Pujian 0 63 63

Jumlah 4 152 156

Penyelesaian:

1. Estimasi Parameter

Setelah dilakukan estimasi parameter menggunakan metode MLE diperoleh hasil seperti

pada Tabel 7 berikut:

Page 9: Laporan Regresi Logistik Ordinal

9

Tabel 7 Hasil Estimasi Parameter Model

Variabel P-value

X1 -1,767 0,000

X2 -1,144 0,106

X3 -0,502 0,161

X4 -0,984 0,128

X5 1,777 0,000

X6 -0,504 0,634

Konstanta (1) 0,331 0,002

Konstanta (2) 3,642 0,008

Berdasarkan Tabel 7 tentang hasil estimasi parameter menggunakan metode MLE

dapat digunakan untuk membuat taksiran model regresi logistik yang telah ditransformasi

logit. Berikut adalah model logit regresi logistik ordinal:

2. Uji Serentak

Pengujian secara serentak dilakukan dengan menggunakan likelihood ratio test.

Tabel 8 Hasil Likelihood Ratio Test

G df P-value

55,158 8 0,000

Berdasarkan Tabel 8 dapat disimpulkan bahwa nilai statistik uji G sebesar 55,158

yang lebih besar dari nilai tabel = 12,592 dan nilai p-value = 0,000 yang lebih kecil

dari α = 0,05 maka dapat diambil kesimpulan Tolak H0, yang berarti bahwa pada pengujian

secara serentak model regresi logistik ordinal antara variabel respon (Y) nilai IPK dengan

enam variabel bebas terdapat minimal satu variabel yang signifikan.

3. Uji Parsial

Pengujian secara individu digunakan untuk mengetahui signifikansi masing-masing

variabel bebas (X) terhadap variabel respon (Y). Berikut adalah hasil pengujian individu

untuk masing-masing variabel prediktor:

Page 10: Laporan Regresi Logistik Ordinal

10

Tabel 9 Uji Individu Variabel X dengan Variabel Y

Variabel Uji Wald P-value Keputusan

Konstanta (1) 2,25 0,002 Tolak H0

Konstanta (2) 2,65 0,008 Tolak H0

X1 -4,49 0,000 Tolak H0

X2 -1,62 0,106 Gagal Tolak H0

X3 -1,40 0,161 Gagal Tolak H0

X4 1,52 0,128 Gagal Tolak H0

X5 4,70 0,000 Tolak H0

X6 -0,48 0,634 Gagal Tolak H0

Berdasarkan Tabel 9 dapat diketahui pada hasil pengujian signifikansi variabel

prediktor, variabel prediktor yang berpengaruh signifikan terhadap variabel respon adalah

dua konstanta yang dihasilkan pada model logit dan variabel X1, yaitu jenis kelamin dan

variabel X5, yaitu lama studi, sedangkan variabel jenis sekolah menengah (X2), daerah asal

(X3) dan pekerjaan orang tua (X4) tidak berpengaruh secara signifikan atau dapat dikatakan

bahwa variabel prediktor tersebut memiliki pengaruh yang kecil terhadap variabel respon.

4. Model Terbaik Regresi Logistik Ordinal

Berikut ini adalah hasil pengujian untuk mengetahui model terbaik dari regresi logistik

ordinal:

Tabel 10 Hasil Pengujian Model Terbaik

Variabel P-value

Konstanta (1) -2,360 0,004

Konstanta (2) 0,754 0,027

X1 -1,515 0,000

X5 1,521 0,000

Berdasarkan pengujian terhadap variabel prediktor yang berpengaruh signifikan

terhadap variavel respon untuk mendapatkan model terbaik, diperoleh bahwa pada semua

variabel prediktor dan kedua konstanta model logit memiliki nilai P-value yang kurang dari

α = 0,05 sehingga Tolak H0, yang berarti bahwa model telah sesuai. Berikut adalah model

logit pada yang digunakan dalam model regresi logistik ordinal:

Page 11: Laporan Regresi Logistik Ordinal

11

5. Interpretasi Model

Interpretasi model regresi logistik ordinal dapat dilakukan dengan menggunakan nilai

Odds Ratio. Berikut adalah nilai Odds Ratio untuk masing-masing variabel prediktor yang

signifikan:

Tabel 11 Nilai Odds Ratio

Variabel Nilai Odds Ratio

X1 0,22

X5 4,58

Pada variabel X1, yaitu jenis kelamin didapatkan nilai Odds Ratio sebesar 0,22 yang

artinya adalah mahasiswa perempuan memiliki resiko 4,54 kali lebih besar untuk

mendapatkan IPK yang lebih tinggi dibandingkan dengan mahasiswa laki-laki. Pada

variabel X5, yaitu lama studi didapatkan nilai Odds Ratio sebesar 4,58 yang artinya adalah

mahasiswa yang memiliki lama studi antara 3,66 < X5 < 5,33 resiko 4,58 kali lebih besar

untuk mendapatkan IPK yang lebih tinggi dibandingkan dengan mahasiswa yang memiliki

lama studi antara 5,33 < X5 < 7.