analisis kemiskinan di provinsi kalimantan barat dengan pendekatan dummy linear regression, logistic...
DESCRIPTION
One of the major problems currently faced by almost all provinces in Indonesia including the province of West Kalimantan is poverty. Poverty is the beginning of the emergence of other social problems are closely associated with the quality of education, crime, hunger, etc. which would indirectly interfere with security or stability of the country. Therefore local governments in each country sought to address the problem of poverty with a variety of policies. Various government policies related to poverty will certainly be effective if the right policies lead to the factors that affect poverty itself. So that will be formulated the alternative poverty alleviation policies more intensive and targeted. In order to obtain the number of poor households as well as the factors that influence it. The method that is often used to answer this question is by multiple linear regression analysis or logistic regression. Sometimes, the researchers encountered a problem in their research, it is the asumption of these methods can not be fulfilled that cause these method can not be used. Over the past few decades developed a method that can overcome this problem by looking at the behavior of the data by feedforward neural networks (FFNN) approach. Results show the best model that produces the lowest error rate in classifying poor households in the province of West Kalimantan is the best model of multiple linear regression with dummy variables.TRANSCRIPT
1
ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT
DENGAN PENDEKATAN DUMMY LINEAR REGRESSION,
LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL
NETWORKS
Adi Wijaya
NRP. 1310201720
Mahasiswa Program Pascasarjana, Jurusan Komputasi Statistika, Fakultas MIPA,
Institut Teknologi Sepuluh Nopember, Surabaya
email: [email protected]
Abstract
One of the major problems currently faced by almost all provinces in Indonesia
including the province of West Kalimantan is poverty. Poverty is the beginning of the
emergence of other social problems are closely associated with the quality of education,
crime, hunger, etc. which would indirectly interfere with security or stability of the
country. Therefore local governments in each country sought to address the problem of
poverty with a variety of policies. Various government policies related to poverty will
certainly be effective if the right policies lead to the factors that affect poverty itself. So
that will be formulated the alternative poverty alleviation policies more intensive and
targeted. In order to obtain the number of poor households as well as the factors that
influence it. The method that is often used to answer this question is by multiple linear
regression analysis or logistic regression. Sometimes, the researchers encountered a
problem in their research, it is the asumption of these methods can not be fulfilled that
cause these method can not be used. Over the past few decades developed a method that
can overcome this problem by looking at the behavior of the data by feedforward neural
networks (FFNN) approach. Results show the best model that produces the lowest error
rate in classifying poor households in the province of West Kalimantan is the best
model of multiple linear regression with dummy variables.
Keywords: Poverty, classification, dummy variable, linear regression, logistic
regression model, FFNN.
1. Pendahuluan
Salah satu masalah utama saat ini yang dihadapi hampir oleh semua provinsi di
Indonesia adalah kemiskinan. Kemiskinan merupakan awal dari timbulnya masalah-
masalah sosial lainnya yang terkait erat dengan kualitas pendidikan, kriminalitas,
kelaparan dsb yang secara tidak langsung akan mengganggu ketahanan atau stabilitas
negara (Arisanti, 2008). Oleh karena itu pemerintah daerah di tiap negara berusaha
untuk mengatasi masalah kemiskinan dengan beragam kebijakan-kebijakan, termasuk
Provinsi Kalimantan Barat.
adiw
talks
.word
press
.com
2
Beragam kebijakan pemerintah terkait dengan kemiskinan tentunya akan efektif
jika kebijakan tepat mengarah pada faktor-faktor yang mempengaruhi kemiskinan itu
sendiri. Sehingga akan dapat dirumuskan alternatif kebijakan pengentasan kemiskinan
yang lebih intensif dan tepat sasaran. Salah satunya dengan mengklasifikasikan rumah
tangga menjadi dua kategori yaitu rumah tangga miskin atau bukan rumah tangga
miskin. Sehingga diperoleh jumlah rumah tangga miskin sekaligus faktor-faktor yang
mempengaruhinya. Cara yang sering digunakan untuk menjawab pertanyaan ini adalah
dengan analisis pemodelan regresi linier berganda atau dengan regresi logistik.
Salah satu kendala yang sering dijumpai peneliti adalah tidak terpenuhinya
asumsi metode-metode tersebut sehingga metode tidak dapat digunakan. Selama
beberapa dekade terakhir dikembangkan metode yang dapat mengatasi hal ini dengan
melihat perilaku datanya yaitu dengan pendekatan neural networks.
Dengan diklasifikasikannya rumah tangga miskin secara tepat menurut kriteria-
kriteria kemiskinan di Provinsi Kalimantan Barat, akan dapat dijadikan salah satu
rujukan dalam program pengentasan kemiskinan yang tepat sasaran.
2. Tinjauan Pustaka
2.1. Regresi Linier dengan variabel dummy
Regresi linier merupakan salah satu metode statistika yang membentuk sebuah
model hubungan antara variabel respon (Y) dengan satu atau lebih variabel prediktor (X)
atau dengan kata lain model yang digunakan untuk mengukur kekuatan hubungan,
besarnya pengaruh dan memprediksi pengaruh antar variabel respon dan variabel
prediktornya (Draper dan Smith, 1998). Regresi linier tidak hanya dapat digunakan pada
variabel prediktor dengan tipe skala rasio, akan tetapi juga bisa diterapkan dengan
menggunakan variabel dengan tipe skala nominal yang biasa dikenal dengan variabel
indikator, variabel kategorik, variabel kualitatif atau variabel dummy (Gujarati, 2004).
Regresi linier dengan menggunakan variabel dummy secara umum dapat
dimodelkan seperti ini:
dimana,
yi = variabel respon
0 … z = parameter-parameter regresi
xi1 … xip = variabel prediktor
Diq … Diz = variabel prediktor dummy
i = residual
Metode yang dikenal paling sederhana dan paling umum digunakan untuk
menghasilkan estimator dalam model regresi linier adalah ordinary least square (OLS).
Metode ini memperkecil kesalahan pendugaan yang terkecil (dan merupakan yang
terbaik) dengan memenuhi beberapa asumsi.
Asumsi-asumsi yang perlu dipenuhi dalam regresi linier adalah:
1. Berdistribusi normal
Error menyebar normal dengan rata-rata nol dan suatu ragam (variance) tertentu.
Penulisan matematis dari asumsi normalitas ini adalah:
)
Statistik uji yang paling sering digunakan untuk menguji asumsi kenormalan error
dengan menggunakan data residual adalah Kolmogorov-Smirnov normality test
2. Identik atau homoskedastik
adiw
talks
.word
press
.com
3
Ragam dari error bersifat homogen. Secara matematis ditulis =
=
dimana i, j = 1, ...., n; dan n = banyaknya pengamatan.
3. Independen
Adanya autokorelasi pada error mengindikasikan bahwa ada satu atau beberapa
faktor (variabel) penting yang mempengaruhi variabel respon Y yang tidak dimasukkan
ke dalam model regresi. Statistik uji yang sering dipakai adalah Uji Durbin-Watson
(DW-statistics).
Langkah penting selanjutnya setelah terpenuhi asumsi-asumsi regresi linier
adalah uji terhadap model dan koefisien-koefisien regresi baik secara simultan maupun
parsial dan mengetahui koefisien determinasinya. Koefisien determinasi adalah
besarnya keragaman (informasi) di dalam variabel Y yang dapat diberikan oleh model
regresi yang didapatkan.
Uji simultan (over all test) pada konsep regresi linier adalah pengujian mengenai
apakah variabel-variabel memiliki pengaruh yang signifikan terhadapa variabel respon
secara simultan. Sedangkah langkah berikutnya adalah uji parsial digunakan untuk
menguji apakah sebuah variabel-variabel prediktor benar-benar memberikan kontribusi
terhadap variabel respon secara terpisah.
2.2 Regresi logistik
Metode analisis regresi logistik merupakan metode analisis yang
menggambarkan hubungan antara sebuah variabel respon dengan satu atau beberapa
variabel prediktor. Tujuan menggunakan model ini adalah sama dengan teknik
pembuatan model yang lain, yaitu mencari model terbaik yang menggambarkan
hubungan antara variabel respon dan variabel prediktor (Agresi, 1990).
Model regresi logistik digunakan untuk menganalisis variabel respon yang
bertipe kategorik. Sedangkan variabel prediktor dapat berbentuk kuantitatif atau
kualitatif dengan menggunakan variabel dummy. Model ini juga digunakan untuk
mengetahui besarnya pengaruh variabel prediktor terhadap variabel respon yang
mengikuti sebaran distribusi Bernoulli.
Jika variabel independen yang digunakan berskala kategorik, yaitu ordinal
maupun nominal, maka variabel tersebut harus diubah menjadi variabel dummy. Secara
umum, bila suatu variabel mempunyai p kategori, maka diperlukan p-1 variabel dummy
(Hosmer dan Lemesow, 2000).
Menurut Iriawan dan Astuti (2006) secara umum persamaan dalam regresi
logistik dinyatakan dalam bentuk:
Dalam hal ini π(x) merupakan peluang sukses apabila variabel prediktor bernilai x.
Bentuk lain regresi logistik dapat dinyatakan dalm bentuk persamaan sebagai berikut.
Dari beberapa metode untuk mengestimasi parameter logistik, metode yang
banyak digunakan adalah metode maximum likelihood dengan alasan lebih praktis dan
mudah untuk digunakan (Nachrowi dan Usman, 2002). Langkah selanjutnya adalah
dengan memeriksa ketepatan model dengan menggunakan statistik chi-square (χ2) dan
G2.
adiw
talks
.word
press
.com
4
2.3 Feedforward Neural Networks (FFNN)
Jaringan saraf tiruan atau biasa dikenal dengan artificial neural networks (ANN),
atau juga disebut simulated neural network (SNN) atau umumnya hanya disebut neural
network (NN) merupakan jaringan dari sekelompok unit pemroses kecil yang
dimodelkan berdasarkan jaringan saraf manusia. Menurut Haykin (1999) Sebuah
jaringan saraf adalah sebuah prosessor yang terdistribusi paralel dan mempuyai
kecenderungan untuk menyimpan pengetahuan yang didapatkannya dari pengalaman
dan membuatnya tetap tersedia untuk digunakan. Hal ini menyerupai kerja otak dalam
dua hal yaitu:
1. Pengetahuan diperoleh oleh jaringan melalui suatu proses belajar
2. Kekuatan hubungan antar sel saraf yang dikenal dengan bobot sinapsis
digunakan untuk menyimpan pengetahuan
Jaringan saraf tiruan merupakan sistem adaptif yang dapat mengubah
strukturnya untuk memecahkan masalah berdasarkan informasi eksternal maupun
internal yang mengalir melalui jaringan tersebut. Secara sederhana, jaringan saraf tiruan
adalah sebuah alat pemodelan data statistik non-linier. Jaringan saraf tiruan dapat
digunakan untuk memodelkan hubungan yang kompleks antara input dan output untuk
menemukan pola-pola pada data.
Layer penyusun sebuah arsitektur neural network yaitu input layer, hidden layer
dan output layer. Input layer berfungsi sebagai tempat data di masukkan untuk proses
lebih lanjut, hidden layer merupakan unit proses dari data yang telah dimasukkan,
output layer merupakan tempat keluaran hasil dari proses yang telah dilakukan,
sedangkan weights adalah penimbang yang selalu berubah setiap input dimasukkan
untuk diproses. Bentuk arsitektur neural networks (NN) yang secara umum paling
banyak digunakan dalam aplikasi di bidang teknik atau rekayasa Feedforward Neural
Networks (FFNN).
Feedforward Neural Networks (FFNN) merupakan tipe yang pertama kali dan
paling sederhana dari jaringan syaraf tiruan yang diciiptakan. Data atau informasi
bergerak dalam satu arah kedepan (forward) dari input layer melalui hidden layer lalu
ke output layer. Tidak ada perputaran atau pengulangan pada jaringan (Rojas, 1996).
Secara sederhana dapat dilihat pada gambar berikut.
Gambar 1
Contoh sebuah arsitektur FFNN
adiw
talks
.word
press
.com
5
Metode dengan menggunakan pendekatan feedforward neural network banyak
diterapkan dalam berbagai bidang keilmuan, misalnya penggunaan feedforward neural
network untuk pemodelan data runtun waktu (Suhartono, 2007), analisis nilai tukar uang
riil (Kaashoek dan Van Dijk, 2002) dan pada dunia kedokteran terkait dengan penyakit
alzheimer (Kipennhan dkk,1992).
2.3 Konsep dan Definisi
Penduduk miskin adalah penduduk yang memiliki rata-rata pengeluaran per
kapita perbulan dibawah garis kemiskinan (BPS, 2010). Untuk mengukur kemiskinan,
BPS menggunakan konsep kemampuan memenuhi kebutuhan dasar (basic needs
approach). Dengan pendekatan ini, kemiskinan dipandang sebagai ketidakmampuan
dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan makanan yang
diukur dari sisi pengeluaran. Dengan pendekatan ini, dapat dihitung Head Count Index
(HCI), yaitu persentase penduduk miskin terhadap total penduduk.
Metode yang digunakan adalah menghitung Garis Kemiskinan (GK), yang
terdiri dari dua komponen yaitu Garis Kemiskinan Makanan (GKM) dan Garis
Kemiskinan Bukan-Makanan. Penghitungan Garis Kemiskinan dilakukan secara
terpisah untuk daerah perkotaan dan perdesaan. Garis Kemiskinan Makanan (GKM)
merupakan nilai pengeluaran kebutuhan minimum makanan yang disetarakan dengan
2.100 kilo kalori per kapita perhari. Paket komoditi kebutuhan dasar makanan diwakili
oleh 52 jenis komoditi (padi-padian, umbi-umbian, ikan, daging, telur dan susu, sayuran,
kacang-kacangan, buah-buahan, minyak dan lemak, dll). Garis Kemiskinan Bukan
Makanan (GKBM) adalah kebutuhan minimum untuk perumahan, sandang, pendidikan,
dan kesehatan. Paket komoditi kebutuhan dasar nonmakanan diwakili oleh 51 jenis
komoditi di perkotaan dan 47 jenis komoditi di perdesaan (BPS, 2010).
3. Metodologi
3.1 Sumber Data
Data yang digunakan adalah data sekunder dari Survei Sosial Ekonomi Nasional
(Susenas) tahun 2009 Provinsi Kalimantan Barat dengan 1 variabel respon dan 13
variabel prediktor. Secara keseluruhan data yang digunakan merupakan data cross
section dengan unit observasi sejumlah 500 rumah tangga. Variabel yang digunakan
pada penelitian ini adalah :
a. Variabel respon (Y) yaitu rata-rata pengeluaran perkapita rumah tangga perbulan
b. Variabel prediktor (X) terdiri dari 14 variabel, yaitu :
X1 = jumlah anggota rumah tangga
X2 = jenis kelamin kepala rumah tangga
X3 = umur kepala rumah tangga
X4 = status perkawinan kepala rumah tangga
X5 = ijasah tertinggi yang dimiliki kepala rumah tangga
X6 = kemampuan membaca huruf latin
X7 = status bekerja kepala rumah tangga seminggu terakhir
X8 = waktu terbanyak yang digunakan seminggu terakhir
X9 = jumlah jam kerja kepala rumah tangga
X10 = lapangan pekerjaan kepala rumah tangga
X11 = status rumah tangga terhadap penggunaan air
X12 = status rumah tangga terhadap penggunaan listrik
X13 = bahan bakar yang digunakan rumah tangga
adiw
talks
.word
press
.com
6
Tabel 1.
Jumlah variabel dummy yang dibentuk pada model sesuai dari variabel
prediktornya
3.2 Metode Analisis
Langkah-langkah analisis yang dilakukan pada penelitian ini adalah sebagai
berikut.
1. Menetapkan set data untuk training 75% dan untuk testing 25%
2. Analisis model 1 yaitu model regresi linier berganda (melibatkan semua variabel
prediktor) dengan menggunakan variabel dummy pada beberapa variabel
prediktornya karena merupakan data kategorik
3. Analisis model 2 yaitu model regresi linier terbaik dengan variabel dummy pada
beberapa variabel prediktornya menggunakan Stepwise Procedure (eliminasi
variabel prediktor yang tidak signifikan secara bertahap)
4. Analisis model 3 yaitu regresi logistik (melibatkan semua variabel prediktor)
5. Analisis model 4 yaitu model regresi logistik terbaik
6. Analisis model 5 yaitu pendekatan feedforward neural network pada model 1
7. Analisis model 6 yaitu pendekatan feedforward neural network pada model 2
8. Analisis model 7 yaitu pendekatan feedforward neural network pada model 3
9. Analisis model 8 yaitu pendekatan feedforward neural network pada model 4
10. Melakukan testing model 1 dan 2 dengan 25% data set dengan menggunakan
batas garis kemiskinan untuk Provinsi Kalimantan Barat
11. Analisis perbandingan ketepatan klasifikasi rumah tangga miskin antara model 1,
2, 3 hingga 8 dengan melakukan model testing 25% data set dengan
menggunakan batas garis kemiskinan untuk Provinsi Kalimantan Barat
12. Interpretasi dan kesimpulan model terbaik
4. Hasil dan Pembahasan
Dari hasil pengolahan data dengan menggunakan software MINITAB, SPSS dan
MATLAB dirangkum dalam tabel-tabel berikut:
Model 1 yaitu model regresi linier berganda dengan variabel dummy (melibatkan
semua variabel prediktor), diperoleh model regresinya:
i = 601072 - 28020 ART + 1397 Umur + 163 jam kerja + 76548 JK_1 + 50757
kawin_1 - 64964 kawin_2 + 47941 kawin_3 - 94665 ijasah tertinggi yang dimiliki_0
- 68820 ijasah tertinggi yang dimiliki_1 - 19903 ijasah tertinggi yang dimiliki_2
- 122171 ijasah tertinggi yang dimiliki_3 + 18524 ijasah tertinggi yang dimiliki_4
- 39097 ijasah tertinggi yang dimiliki_5 + 57728 ijasah tertinggi yang dimiliki_6
+ 150403 ijasah tertinggi yang dimiliki_7 + 118045 ijasah tertinggi yang dimiliki_8
variabel X2 X4 X5 X6 X7
jumlah variabel
dummy
1 3 11 1 1
variabel X8 X10 X11 X12 X13 total
jumlah variabel
dummy
3 9 8 3 5 45
adiw
talks
.word
press
.com
7
+ 30994 ijasah tertinggi yang dimiliki_9 + 147923 ijasah tertinggi yang dimiliki_10
- 70469 baca latin_1 + 31777 Seminggu terakhir bekerja?_1
- 133626 lap kerja_0 - 167680 lap kerja_1 - 109941 lap kerja_2 - 167680 lap kerja_3
+ 93803 lap kerja_4 - 240546 lap kerja_5 - 158306 lap kerja_6
- 133849 lap kerja_7 + 620808 lap kerja_8 - 175405 lap kerja_9
- 8377 air_1+ 477501 air_2 - 44112 air_3 - 64034 air_5 - 69758 air_6 + 40808 air_7
- 77797 air_9 - 170300 air_10 - 15164 listrik_1 + 106618 listrik_2 - 149978 listrik_4
- 63463 bahanbakar_1 + 94962 bahanbakar_2 - 86429 bahanbakar_3
- 21829 bahanbakar_4 - 80060 bahanbakar_5
+ 29763 waktu terbanyak seminggu terakh_0
+ 63867 waktu terbanyak seminggu terakh_1
+ 89044 waktu terbanyak seminggu terakh_3
Tabel 2
Hasil pengolahan regresi linier berganda dengan variabel dummy
(melibatkan semua variabel prediktor)
hasil keterangan
Asumsi Normalitas uji kolmogorov-smirnov
tidak signifikan pada
level 5%
residual tidak
berdistribusi normal
Asumsi Non-
Multikolinieritas
terdapat
multikolinieritas (nilai
VIF lebih dari 10)
beberapa variabel bebas
dari multikolinieritas
Asumsi Non-Autokorelasi nilai DW = 1,88102
tidak terdapat
autokorelasi
Overall test (Uji F) model signifikan pada
level 5%
nilai p-value < 0,05
Partial test (Uji t) signifikan beberapa
variabel pada level 5%
variabel yang ditandai
di atas yang signifikan
MSE 24736960235 sangat besar
R2 49,8%
Model 2 yaitu model regresi linier terbaik dengan variabel dummy pada
beberapa variabel prediktornya menggunakan Stepwise Procedure (eliminasi variabel
prediktor yang tidak signifikan secara bertahap) diperoleh model regresi terbaik adalah:
i = 412838 - 28045 ART + 115681 jasah tertinggi yang dimiliki_8 + 349947 lap
kerja_4 + 824178 lap kerja_8 + 480220 air_2 + 184580 bahanbbakar_2
adiw
talks
.word
press
.com
8
Tabel 3
Hasil pengolahan regresi linier terbaik dengan variabel dummy
(menggunakan stepwise procedure)
hasil keterangan
Asumsi Normalitas uji kolmogorov-smirnov
tidak signifikan pada
level 5%
residual tidak
berdistribusi normal
Asumsi Non-
Multikolinieritas
bebas dari
multikolinieritas
nilai VIF sekitar 1 (>10)
Asumsi Non-Autokorelasi nilai DW = 1,88102 tidak terdapat
autokorelasi
Overall test (Uji F) signifikan pada level 5% nilai p-value < 0,05
Partial test (Uji t) signifikan pada level 5% nilai p-value < 0,05
MSE 26146324990 sangat besar
R2 40%
Model 3 yaitu model regresi logistik (melibatkan semua variabel prediktor), dari
hasil pengolahan pada Minitab diperoleh hasil seperti pada tabel berikut:
Tabel 4
Hasil pengolahan model regresi logistik dengan melibatkan semua variabel
Indikator Hasil Keterangan
Ketepatan
model
Log-Likelihood = -75,053
Test that all slopes are zero: G =
58,972, DF = 49, P-Value = 0,156
Secara keseluruhan
parameter tidak
signifikan dalam model,
p-value > 0,05
Goodness of
Fit
Goodness-of-Fit Tests
Method Chi-Square DF P
Pearson 301,616 325 0,820
Deviance 150,105 325 1,000
Hosmer-Lemeshow 6,195 8 0,625
model fit karena nilai p-
value > 0,05
Variabel
yang
signifikan
wktu terbanyak seminggu terakh_1
variabel dummy ke-2
dari variabel waktu
terbanyak yang
digunakan seminggu
terakhir
Model 4 yaitu model regresi logistik terbaik. Dari hasil pengolahan diperoleh
hasil bahwa dengan menggunakan metode eliminasi mundur (backward elimination
procedure) dengan uji Wald maupun Likelihood Ratio (LR) tidak ada satupun variabel
prediktor yang signifikan.
Model 5 yaitu model dengan pendekatan feedforward neural network pada
model 1 yaitu model regresi linier berganda dengan variabel dummy (melibatkan semua
adiw
talks
.word
press
.com
9
variabel prediktor). Setelah dilakukan proses training dan simulasi dengan
menggunakan 1 hidden layer pada tiap neuron (maksimal 5 neuron), maka diperoleh
jaringan yang memiliki MSE paling kecil yaitu 1.6537e+012. Tiap training data akan
memberikan nilai MSE dan hasil prediksi yang berbeda-beda.
Tabel 5
Hasil pengolahan model dengan pendekatan feedforward neural network pada model 1
Neuron MSE
1 5.2012e+011
2 1.6537e+012
3 2.4331e+011
4 2.5397e+011
5 9.3404e+012
Model 6 yaitu model dengan pendekatan feedforward neural network pada
model 2 yaitu model regresi linier terbaik dengan variabel dummy pada beberapa
variabel prediktornya. Setelah dilakukan proses training dan simulasi dengan
menggunakan 1 hidden layer pada tiap neuron (maksimal 5 neuron), maka diperoleh
jaringan yang memiliki MSE paling kecil yaitu 1.3155e+012
Tabel 6
Hasil pengolahan model dengan pendekatan feedforward neural network pada model 2
Neuron MSE
1 8.8462e+011
2 3.6721e+012
3 1.3155e+012
4 3.9548e+011
5 2.1239e+011
Model 7 yaitu model dengan pendekatan feedforward neural network pada
model 3 yaitu model regresi logistik (melibatkan semua variabel prediktor). Setelah
dilakukan proses training dan simulasi dengan menggunakan 1 hidden layer pada tiap
neuron (maksimal 5 neuron), maka diperoleh jaringan yang memiliki MSE paling kecil
yaitu 0.0965.
adiw
talks
.word
press
.com
10
Tabel 7
Hasil pengolahan model dengan pendekatan feedforward neural network pada model 3
Neuron MSE
1 0.1851
2 0.6420
3 1.1330
4 0.0965
5 0.9113
Model 8 yaitu model dengan pendekatan feedforward neural network pada
model 4 tidak dapat dilakukan karena pada model 4 tidak diperoleh model loistik
terbaik.
Untuk melihat seberapa efektif sebuah model, maka dapat dilihat dari seberapa
kecil tingkat kesalahan prediksi atau klasifikasi terhadap rumah tangga miskin itu
sendiri. Hasil prediksi dengan tingkat kesalahan prediksi dan klasifikasi antar model sbb
Tabel 4
Hasil pengolahan semua model penelitian dengan tingkat kesalahan prediksi
Kesalahan Prediksi (%)
Metode Training Testing
dummy variable linear
regression Semua variabel 14,07 6,43
Model terbaik 7,49 2,11
FFNN Semua variabel 24 0,8
Model terbaik 8,67 2,26
Kesalahan Klasifikasi (%)
Training Testing
Regresi Logistik Semua variabel 9,92 2,42
Model terbaik - -
FFNN Semua variabel 8 7,2
Model terbaik - -
Dapat dilihat bahwa model yang memiliki tingkat kesalahan prediksi terkecil
pada testing maupun training adalah model ke-2 yaitu model regresi linier terbaik
dengan variabel dummy pada beberapa variabel prediktornya.
5. Kesimpulan
Dari hasil pembahasan di atas dapat disimpulkan bahwa
1. Pemodelan dengan menggunakan regresi linier berganda dengan memasukkan
semua variabel prediktor menunjukkan bahwa model secara keseluruhan
signifikan meski ada beberapa variabel prediktor yang tidak signifikan dengan
adiw
talks
.word
press
.com
11
memenuhi asumsi bebas autokorelasi, akan tetapi asumsi normalitas dan bebas
multikolinieritas tidak terpenuhi
2. Pemodelan regresi linier terbaik dengan menggunakan stepwise procedure
(eliminasi variabel prediktor yang tidak signifikan secara bertahap)
menunjukkan hasil yang cukup berbeda dengan model 1, yaitu meskipun model
signifikan secara statistik dan bebas dari pelanggaran asumsi (kecuali asumsi
normalitas) akan tetapi model ini memiliki nilai koefisien determinasi yang lebih
kecil dibandingkan model 1 yaitu 40%
3. Model regresi logistik dengan memasukkan semua variabel menghasilkan
kesimpulan yaitu bahwa model klasifikasi rumah tangga miskin dengan regresi
logistik tidak signifikan secara keseluruhan
4. Model dengan pendekatan FFNN pada regresi logistik menghasilkan tingkat
kesalahan prediksi dan nilai MSE yang relatif kecil jika dibandingkan dengan
model dengan pendekatan FFNN pada regresi linier berganda
5. Model terbaik yang menghasilkan tingkat kesalahan prediksi terendah dalam
pengklasifikasian rumah tangga miskin di Provinsi Kalimantan Barat adalah
regresi linier sederhana dengan variabel dummy
Daftar Pustaka
Agresti A. (1990). Categorical Data Analysis. New York: John Wiley & Sons.
Arisanti, Restu (2011), “Model Regresi Spasial Untuk Deteksi Faktor-faktor Kemiskinan di Provinsi
Jawa Timur”, Tesis. Bogor: Institut Pertanian Bogor (IPB).
[BPS] Badan Pusat Statistik, (2010), Berita Resmi Statistik. Kalimantan Barat: Badan Pusat Statistik.
Draper, N. R., Smith, H. (1998), Applied Regression Analysis. New York: John Willey and Sons, Inc.
Gujarati, Damodar (2004), Basic Econometrics 4th
edition. New York: McGraw-Hill
Haykin, S. (1999), Neural Networks: A Comprehensive Foundation. 2nd
Edition. Oxford: Prentice Hall
Hosmer, D.W., Lemeshow, S. (2000). Applied Logistic Regression. New York : Wiley
Iriawan, Nur, Astuti, S.P. (2006). Mengolah Data Statistik dengan Mudah Menggunakan Minitab 14.
Yogyakarta: Penerbit Andi
Kaashoek, J.F., and Van Dijk, H.K. (2002). Neural Network Pruning Applied to Real Exchange Rate
Analysis. Journal of Forecasting, Volume 21
Kippenhan, J.S., Barker, W.W., Pascal,S., Nagel, J. and Duara, R. (1992). Evaluation of a neural
network classifier for PET scans of normal and Alzheimer disease subjects. Journal of
Nuclear Medicine, Volume 33
Nachrowi, D.N., Usman, H. ( 2002). Penggunaan Teknik Ekonometri. Jakarta: Raja Grafindo Persada
Rojas, R. (1996). Neural Networks A Systematic Introduction. Berlin: Springer-Verlag
Suhartono.(2007), Feedforward Neural Networks Untuk pemodelan Runtun Waktu. Disertasi.
Yogyakarta: Universitas Gadjah Mada (UGM)
adiw
talks
.word
press
.com