laporan regresi logistik ordinal
DESCRIPTION
laporan tugas analisis data kualitatif model regresi logistik original yang ditulis untuk memenuhi tugas kelompok mahasiswa jurusan statistika fakultas matematikaTRANSCRIPT
![Page 1: Laporan Regresi Logistik Ordinal](https://reader035.vdocuments.site/reader035/viewer/2022072106/577c83341a28abe054b40894/html5/thumbnails/1.jpg)
1
LAPORAN TUGAS
ANALISIS DATA KUALITATIF
MODEL REGRESI LOGISTIK ORDINAL
Oleh:
1. Aqidatur Riska Puspitasari (1311100008)
2. Marina Marsudi Putri (1311100028)
3. Mentari Sonya Ningtyas (1311100036)
4. Jainap Niken Melasasi (1311100049)
Dosen Pengampu:
Dr. Vita Ratna Sari S.Si, M.Si
Jurusan Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Teknologi Sepuluh Nopember
Surabaya
2014
![Page 2: Laporan Regresi Logistik Ordinal](https://reader035.vdocuments.site/reader035/viewer/2022072106/577c83341a28abe054b40894/html5/thumbnails/2.jpg)
2
REGRESI LOGISTIK ORDINAL
1. Definisi Regresi Logistik Ordinal
Regresi logistik adalah prosedur pemodelan yang diterapkan untuk memodelkan
variabel terikat (Y) yang bersifat kategori berdasarkan satu atau lebih variabel prediktor
(X), baik itu yang bersifat kategori maupun kontinyu. Dalam dunia nyata, ada kalanya
permasalahan yang dihadapi bukan hanya variabel respon yang bersifat nominal, tetapi juga
ordinal. Pada permasalahan seperti ini bisa saja diterapkan metode regresi logistik
multinomial, tetapi bagaimanapun juga metode ini tidak memperhitungkan sifat ordinalitas
variabel respon. Oleh karena itu, regresi logistik ordinal sangatlah berperan disini.
Regresi logistik ordinal adalah salah satu metode satu metode statistika untuk
menganalisis variabel terikat yang mempunya skala ordinal yang terdiri atas tiga variabel
atau lebih. Variabel bebas yang dapat disertakan dalam model dapat berupa data kategori
atau kontinyu yang terdiri dari dua variabel atau lebih. Menurut Holmer dan Lemenshow
(2000), regresi logistik ordinal adalah suatu metode analisis yang digunakan untuk
mengetahui hubungan antara variabel respon dengan variabel prediktor, dimana variabel
responnya memiliki lebih dari dua kategori dan dalam setiap kategori memiliki tingkatan.
(Holmer dan Lemenshow, 2000)
Model yang dapat digunakan untuk regresi logistik ordinal adalah model logit. Model
logit tersebut dalam regresi logistik ordinal disebut dengan cumulative logit models. Pada
model logit ini sifat ordinal dari respon Y ditunjukkan dalam probabilitas kumulatif
sehingga cumulative logit models merupakan model yang didapatkan denga
membandingkan probabilitas kumulatif.
Perbandingan probabilitas kumulatif yaitu probabilitas yang kurang dari atau sama
dengan kategori respon ke-j dengan probabilitas yang lebih besar dari kategori
respon ke-j . Model logit dari regresi logistik ordinal tersebut adalah sebagai
berikut:
[
]
![Page 3: Laporan Regresi Logistik Ordinal](https://reader035.vdocuments.site/reader035/viewer/2022072106/577c83341a28abe054b40894/html5/thumbnails/3.jpg)
3
∑
Keterangan:
j = banyaknya kategori pada variabel respon, j = 0,1,2,3,.... j-1
k = banyaknya variabel prediktor.
Fungsi logit yang dapat dibentuk jika terdapat J kategori respon adalah sebanyak J-1
fungsi logit. Setelah diketahui fungsi logit maka selajutnya dapat dicari persamaan dari
probabilitas kumulatif kategori respon ke-j dengan penjabaran sebagai berikut:
*
+ ∑
∑
∑
∑ ∑
( )
∑ ( ) ∑
Sehingga didapatkan fungsi probabilitas kumulatif kategori respon ke-j sebagai berikut.
∑
∑
Jika menyatakan probabilitas kategori respon ke-j pada p
variabel prediktor yang dinyatakan dalam vektor dan menyatakan
probabilitas kumulatif pada variabel prediktor yang dinyatakan dalam vektor xi maka fungsi
probabilitas kumulatif tersebut dapat dinyatakan sebagai berikut:
2. Estimasi Parameter
Pada penelitian ini metode yang digunakan untuk menaksir nilai adalah metode
Maksimum Likelihood Estimation (MLE). Metode ini digunakan untuk menaksir parameter
yang tidak diketahui. Prinsip metode ini adalah menaksir nilai dengan memaksimumkan
fungsi likelihood. Bentuk umum dari fungsi likelihood untuk sampel dengan n observasi
independen, ( dimana i=1,2,..n adalah sebagai berikut
![Page 4: Laporan Regresi Logistik Ordinal](https://reader035.vdocuments.site/reader035/viewer/2022072106/577c83341a28abe054b40894/html5/thumbnails/4.jpg)
4
∏
Selanjutnya didapatkan fungsi log likelihood sebagai berikut.
∑ [ ] [ ] [ ]
Parameter-parameter diperoleh dengan menurunkan persamaan terhadap
parameter yang ingin diketahui dan selanjutnya turunan pertama tersebut disamadengankan
nol. Selanjutnya berdasarkan teori maximum likelihood, taksiran varian kovarian
didapatkan dari turunan kedua fungsi log-likeklihoodnya. Nilai parameter diestimasi dengan
menggunakan metode numerik karena persamaannya bersifat nonlinier. Metoder numerik
tersbut adalah metode iterasi Newton- Raphson (Agresti, 1990).
3. Pengujian Parameter
Menurut Hosmer dan Lameshow (2000), model yang telah diperoleh perlu diuji
kesignifikannya dengan melakukan pengujian statistik. Pengujian dilakukan terhadap
koefisien dari model yang telah diperoleh. Dalam model regresi logistik terdapat dua
jenis pengujian yaitu pengujian secara parsial dan pengujian serentak.
3.1 Uji Serentak
Uji serentak dilakukan untuk memeriksa keberartian koefisien secara keseluruhan
atau serentak. Jika parameter yang diuji signifikan maka dapat dikatakan jika model yang
dibentuk sesuai untuk memodelkan variabel respon. Hipotesis yang digunakan adalah
sebagai berikut.
H0 : 1 = 2 = p = 0
H1 : paling sedikit terdapat satu dengan k =1,2,...p
Statistik uji yang digunakan adalah statistik uji G atau likelihood ratio test.
[(
)
(
)
∏
]
Keterangan:
n0 = banyaknya observasi yang berkategori 0
![Page 5: Laporan Regresi Logistik Ordinal](https://reader035.vdocuments.site/reader035/viewer/2022072106/577c83341a28abe054b40894/html5/thumbnails/5.jpg)
5
n1 = banyaknya observasi yang berkategori 1
Daerah penolakan H0 adalah jika
dengan derajat bebas sebesar db
dimana db = (I-1)(J-1). Dalam hal ini G menyebar mengikuti distribusi Chi-square dengan
derajat bebas p.
3.2 Uji Parsial
Uji parsial digunakan untuk mengetahui signifikansi parameter terhadap variabel
respon. Statistik uji yang digunakan adalah uji Wald. Berdasarkan hasil dari uji Wald maka
akan diketahui apakah suatu variabel prediktor layak atau tidak masuk dalam model.
Hipotesis yang digunakan adalah sebagai berikut.
H0 :
H1 : dengan k = 1,2,...p
P = jumlah prediktor dalam model
Statistik uji Wald adalah sebagai berikut
Keterangan : SE ( adalah taksiran standar error parameter
Daerah penolakan H0 adalah jika atau
dengan derajat bebas
sebesar v.
4. Uji Kesesuaian Model
Uji kesesuaian model dilakukan untuk mengetahui apakah suatu model yang terbentuk
sudah sesuai untuk digunakan atau tidak. Statistik uji yang digunakan adalah uji pearson
chi-square dengan hipotesis sebagai berikut.
H0 : Model sesuai (tidak ada perbedaan yang nyata antara hasil observasi dengan
kemungkinan hasil prediksi model)
H1 : Model tidak sesuai (ada perbedaan yang nyata antara hasil observasi dengan
kemungkinan hasil prediksi model)
Statistik uji Chi-square adalah sebagai berikut:
![Page 6: Laporan Regresi Logistik Ordinal](https://reader035.vdocuments.site/reader035/viewer/2022072106/577c83341a28abe054b40894/html5/thumbnails/6.jpg)
6
√ ( )
∑
Daerah penolakan H0 jika p-value < atau
dengan derajat bebas
sebesar jumlahan dari derajat bebas sebesar jumlahan dari derajat bebas pada estimasi
parameter setiap variabel yang masuk kedalam model.
![Page 7: Laporan Regresi Logistik Ordinal](https://reader035.vdocuments.site/reader035/viewer/2022072106/577c83341a28abe054b40894/html5/thumbnails/7.jpg)
7
Contoh Kasus Regresi Logistik Ordinal
Suatu penelitian dilakukan dengan tujuan untuk mengetahui faktor-faktor yang
mempengaruhi nilai IPK (Y) mahasiswa lulusan program studi Statistika FMIPA
Universitas Mulawarman, yaitu jenis kelamin (X1), jenis sekolah menengah (X2), daerah
asal (X3), pekerjaan orang tua (X4), lama studi (X5) dan usia masuk perguruan tinggi (X5),
akan dianalisis menggunakan analisis regresi logistik ordinal. Berikut adalah hasil tabulasi
silang faktor-faktor yang mempengaruhi nilai IPK (Y) mahasiswa lulusan program studi
Statistika FMIPA Universitas Mulawarman:
Tabel 1 Tabulasi Jenis Kelamin (X1) terhadap IPK (Y)
IPK Jenis Kelamin
Jumlah Perempuan Laki-Laki
Memuaskan 6 11 17
Sangat Memuaskan 39 37 76
Dengan Pujian 53 10 63
Jumlah 98 58 156
Tabel 2 Tabulasi Jenis Sekolah Menengah (X2) terhadap IPK (Y)
IPK Jenis Sekolah Menengah
Jumlah SMK/MAN SMA
Memuaskan 2 15 17
Sangat Memuaskan 6 70 76
Dengan Pujian 2 61 63
Jumlah 10 146 156
Tabel 3 Tabulasi Daerah Asal (X3) terhadap IPK (Y)
IPK Daerah Asal
Jumlah Luar Samarinda Samarinda
Memuaskan 9 8 17
Sangat Memuaskan 32 44 76
Dengan Pujian 31 32 63
Jumlah 72 84 156
![Page 8: Laporan Regresi Logistik Ordinal](https://reader035.vdocuments.site/reader035/viewer/2022072106/577c83341a28abe054b40894/html5/thumbnails/8.jpg)
8
Tabel 4 Tabulasi Pekerjaan Orang Tua (X4) terhadap IPK (Y)
IPK Pekerjaan Orang Tua
Jumlah Pekerjaan Lainnya PNS Wiraswasta Swasta
Memuaskan 3 4 0 10 17
Sangat Memuaskan 9 21 11 35 76
Dengan Pujian 3 18 10 32 63
Jumlah 15 43 21 77 156
Tabel 5 Tabulasi Lama Study (X5) terhadap IPK (Y)
IPK Lama Studi (Tahun)
Jumlah 5,33 < X5 < 7 3,66 < X5 < 5,33
Memuaskan 2 15 17
Sangat Memuaskan 6 70 76
Dengan Pujian 2 61 63
Jumlah 10 146 156
Tabel 6 Tabulasi Usia (X6) terhadap IPK (Y)
IPK Usia (tahun)
Jumlah 19 < X6 < 22 16 < X6 < 19
Memuaskan 1 16 17
Sangat Memuaskan 3 73 76
Dengan Pujian 0 63 63
Jumlah 4 152 156
Penyelesaian:
1. Estimasi Parameter
Setelah dilakukan estimasi parameter menggunakan metode MLE diperoleh hasil seperti
pada Tabel 7 berikut:
![Page 9: Laporan Regresi Logistik Ordinal](https://reader035.vdocuments.site/reader035/viewer/2022072106/577c83341a28abe054b40894/html5/thumbnails/9.jpg)
9
Tabel 7 Hasil Estimasi Parameter Model
Variabel P-value
X1 -1,767 0,000
X2 -1,144 0,106
X3 -0,502 0,161
X4 -0,984 0,128
X5 1,777 0,000
X6 -0,504 0,634
Konstanta (1) 0,331 0,002
Konstanta (2) 3,642 0,008
Berdasarkan Tabel 7 tentang hasil estimasi parameter menggunakan metode MLE
dapat digunakan untuk membuat taksiran model regresi logistik yang telah ditransformasi
logit. Berikut adalah model logit regresi logistik ordinal:
2. Uji Serentak
Pengujian secara serentak dilakukan dengan menggunakan likelihood ratio test.
Tabel 8 Hasil Likelihood Ratio Test
G df P-value
55,158 8 0,000
Berdasarkan Tabel 8 dapat disimpulkan bahwa nilai statistik uji G sebesar 55,158
yang lebih besar dari nilai tabel = 12,592 dan nilai p-value = 0,000 yang lebih kecil
dari α = 0,05 maka dapat diambil kesimpulan Tolak H0, yang berarti bahwa pada pengujian
secara serentak model regresi logistik ordinal antara variabel respon (Y) nilai IPK dengan
enam variabel bebas terdapat minimal satu variabel yang signifikan.
3. Uji Parsial
Pengujian secara individu digunakan untuk mengetahui signifikansi masing-masing
variabel bebas (X) terhadap variabel respon (Y). Berikut adalah hasil pengujian individu
untuk masing-masing variabel prediktor:
![Page 10: Laporan Regresi Logistik Ordinal](https://reader035.vdocuments.site/reader035/viewer/2022072106/577c83341a28abe054b40894/html5/thumbnails/10.jpg)
10
Tabel 9 Uji Individu Variabel X dengan Variabel Y
Variabel Uji Wald P-value Keputusan
Konstanta (1) 2,25 0,002 Tolak H0
Konstanta (2) 2,65 0,008 Tolak H0
X1 -4,49 0,000 Tolak H0
X2 -1,62 0,106 Gagal Tolak H0
X3 -1,40 0,161 Gagal Tolak H0
X4 1,52 0,128 Gagal Tolak H0
X5 4,70 0,000 Tolak H0
X6 -0,48 0,634 Gagal Tolak H0
Berdasarkan Tabel 9 dapat diketahui pada hasil pengujian signifikansi variabel
prediktor, variabel prediktor yang berpengaruh signifikan terhadap variabel respon adalah
dua konstanta yang dihasilkan pada model logit dan variabel X1, yaitu jenis kelamin dan
variabel X5, yaitu lama studi, sedangkan variabel jenis sekolah menengah (X2), daerah asal
(X3) dan pekerjaan orang tua (X4) tidak berpengaruh secara signifikan atau dapat dikatakan
bahwa variabel prediktor tersebut memiliki pengaruh yang kecil terhadap variabel respon.
4. Model Terbaik Regresi Logistik Ordinal
Berikut ini adalah hasil pengujian untuk mengetahui model terbaik dari regresi logistik
ordinal:
Tabel 10 Hasil Pengujian Model Terbaik
Variabel P-value
Konstanta (1) -2,360 0,004
Konstanta (2) 0,754 0,027
X1 -1,515 0,000
X5 1,521 0,000
Berdasarkan pengujian terhadap variabel prediktor yang berpengaruh signifikan
terhadap variavel respon untuk mendapatkan model terbaik, diperoleh bahwa pada semua
variabel prediktor dan kedua konstanta model logit memiliki nilai P-value yang kurang dari
α = 0,05 sehingga Tolak H0, yang berarti bahwa model telah sesuai. Berikut adalah model
logit pada yang digunakan dalam model regresi logistik ordinal:
![Page 11: Laporan Regresi Logistik Ordinal](https://reader035.vdocuments.site/reader035/viewer/2022072106/577c83341a28abe054b40894/html5/thumbnails/11.jpg)
11
5. Interpretasi Model
Interpretasi model regresi logistik ordinal dapat dilakukan dengan menggunakan nilai
Odds Ratio. Berikut adalah nilai Odds Ratio untuk masing-masing variabel prediktor yang
signifikan:
Tabel 11 Nilai Odds Ratio
Variabel Nilai Odds Ratio
X1 0,22
X5 4,58
Pada variabel X1, yaitu jenis kelamin didapatkan nilai Odds Ratio sebesar 0,22 yang
artinya adalah mahasiswa perempuan memiliki resiko 4,54 kali lebih besar untuk
mendapatkan IPK yang lebih tinggi dibandingkan dengan mahasiswa laki-laki. Pada
variabel X5, yaitu lama studi didapatkan nilai Odds Ratio sebesar 4,58 yang artinya adalah
mahasiswa yang memiliki lama studi antara 3,66 < X5 < 5,33 resiko 4,58 kali lebih besar
untuk mendapatkan IPK yang lebih tinggi dibandingkan dengan mahasiswa yang memiliki
lama studi antara 5,33 < X5 < 7.