analisis kemiskinan di provinsi kalimantan barat dengan pendekatan dummy linear regression, logistic...

11
1 ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT DENGAN PENDEKATAN DUMMY LINEAR REGRESSION, LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL NETWORKS Adi Wijaya NRP. 1310201720 Mahasiswa Program Pascasarjana, Jurusan Komputasi Statistika, Fakultas MIPA, Institut Teknologi Sepuluh Nopember, Surabaya email: [email protected] Abstract One of the major problems currently faced by almost all provinces in Indonesia including the province of West Kalimantan is poverty. Poverty is the beginning of the emergence of other social problems are closely associated with the quality of education, crime, hunger, etc. which would indirectly interfere with security or stability of the country. Therefore local governments in each country sought to address the problem of poverty with a variety of policies. Various government policies related to poverty will certainly be effective if the right policies lead to the factors that affect poverty itself. So that will be formulated the alternative poverty alleviation policies more intensive and targeted. In order to obtain the number of poor households as well as the factors that influence it. The method that is often used to answer this question is by multiple linear regression analysis or logistic regression. Sometimes, the researchers encountered a problem in their research, it is the asumption of these methods can not be fulfilled that cause these method can not be used. Over the past few decades developed a method that can overcome this problem by looking at the behavior of the data by feedforward neural networks (FFNN) approach. Results show the best model that produces the lowest error rate in classifying poor households in the province of West Kalimantan is the best model of multiple linear regression with dummy variables. Keywords: Poverty, classification, dummy variable, linear regression, logistic regression model, FFNN. 1. Pendahuluan Salah satu masalah utama saat ini yang dihadapi hampir oleh semua provinsi di Indonesia adalah kemiskinan. Kemiskinan merupakan awal dari timbulnya masalah- masalah sosial lainnya yang terkait erat dengan kualitas pendidikan, kriminalitas, kelaparan dsb yang secara tidak langsung akan mengganggu ketahanan atau stabilitas negara (Arisanti, 2008). Oleh karena itu pemerintah daerah di tiap negara berusaha untuk mengatasi masalah kemiskinan dengan beragam kebijakan-kebijakan, termasuk Provinsi Kalimantan Barat. adiwtalks.wordpress.com

Upload: adi-wijaya

Post on 29-Jul-2015

296 views

Category:

Documents


1 download

DESCRIPTION

One of the major problems currently faced by almost all provinces in Indonesia including the province of West Kalimantan is poverty. Poverty is the beginning of the emergence of other social problems are closely associated with the quality of education, crime, hunger, etc. which would indirectly interfere with security or stability of the country. Therefore local governments in each country sought to address the problem of poverty with a variety of policies. Various government policies related to poverty will certainly be effective if the right policies lead to the factors that affect poverty itself. So that will be formulated the alternative poverty alleviation policies more intensive and targeted. In order to obtain the number of poor households as well as the factors that influence it. The method that is often used to answer this question is by multiple linear regression analysis or logistic regression. Sometimes, the researchers encountered a problem in their research, it is the asumption of these methods can not be fulfilled that cause these method can not be used. Over the past few decades developed a method that can overcome this problem by looking at the behavior of the data by feedforward neural networks (FFNN) approach. Results show the best model that produces the lowest error rate in classifying poor households in the province of West Kalimantan is the best model of multiple linear regression with dummy variables.

TRANSCRIPT

Page 1: ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT DENGAN PENDEKATAN DUMMY LINEAR REGRESSION, LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL NETWORKS

1

ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT

DENGAN PENDEKATAN DUMMY LINEAR REGRESSION,

LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL

NETWORKS

Adi Wijaya

NRP. 1310201720

Mahasiswa Program Pascasarjana, Jurusan Komputasi Statistika, Fakultas MIPA,

Institut Teknologi Sepuluh Nopember, Surabaya

email: [email protected]

Abstract

One of the major problems currently faced by almost all provinces in Indonesia

including the province of West Kalimantan is poverty. Poverty is the beginning of the

emergence of other social problems are closely associated with the quality of education,

crime, hunger, etc. which would indirectly interfere with security or stability of the

country. Therefore local governments in each country sought to address the problem of

poverty with a variety of policies. Various government policies related to poverty will

certainly be effective if the right policies lead to the factors that affect poverty itself. So

that will be formulated the alternative poverty alleviation policies more intensive and

targeted. In order to obtain the number of poor households as well as the factors that

influence it. The method that is often used to answer this question is by multiple linear

regression analysis or logistic regression. Sometimes, the researchers encountered a

problem in their research, it is the asumption of these methods can not be fulfilled that

cause these method can not be used. Over the past few decades developed a method that

can overcome this problem by looking at the behavior of the data by feedforward neural

networks (FFNN) approach. Results show the best model that produces the lowest error

rate in classifying poor households in the province of West Kalimantan is the best

model of multiple linear regression with dummy variables.

Keywords: Poverty, classification, dummy variable, linear regression, logistic

regression model, FFNN.

1. Pendahuluan

Salah satu masalah utama saat ini yang dihadapi hampir oleh semua provinsi di

Indonesia adalah kemiskinan. Kemiskinan merupakan awal dari timbulnya masalah-

masalah sosial lainnya yang terkait erat dengan kualitas pendidikan, kriminalitas,

kelaparan dsb yang secara tidak langsung akan mengganggu ketahanan atau stabilitas

negara (Arisanti, 2008). Oleh karena itu pemerintah daerah di tiap negara berusaha

untuk mengatasi masalah kemiskinan dengan beragam kebijakan-kebijakan, termasuk

Provinsi Kalimantan Barat.

adiw

talks

.word

press

.com

Page 2: ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT DENGAN PENDEKATAN DUMMY LINEAR REGRESSION, LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL NETWORKS

2

Beragam kebijakan pemerintah terkait dengan kemiskinan tentunya akan efektif

jika kebijakan tepat mengarah pada faktor-faktor yang mempengaruhi kemiskinan itu

sendiri. Sehingga akan dapat dirumuskan alternatif kebijakan pengentasan kemiskinan

yang lebih intensif dan tepat sasaran. Salah satunya dengan mengklasifikasikan rumah

tangga menjadi dua kategori yaitu rumah tangga miskin atau bukan rumah tangga

miskin. Sehingga diperoleh jumlah rumah tangga miskin sekaligus faktor-faktor yang

mempengaruhinya. Cara yang sering digunakan untuk menjawab pertanyaan ini adalah

dengan analisis pemodelan regresi linier berganda atau dengan regresi logistik.

Salah satu kendala yang sering dijumpai peneliti adalah tidak terpenuhinya

asumsi metode-metode tersebut sehingga metode tidak dapat digunakan. Selama

beberapa dekade terakhir dikembangkan metode yang dapat mengatasi hal ini dengan

melihat perilaku datanya yaitu dengan pendekatan neural networks.

Dengan diklasifikasikannya rumah tangga miskin secara tepat menurut kriteria-

kriteria kemiskinan di Provinsi Kalimantan Barat, akan dapat dijadikan salah satu

rujukan dalam program pengentasan kemiskinan yang tepat sasaran.

2. Tinjauan Pustaka

2.1. Regresi Linier dengan variabel dummy

Regresi linier merupakan salah satu metode statistika yang membentuk sebuah

model hubungan antara variabel respon (Y) dengan satu atau lebih variabel prediktor (X)

atau dengan kata lain model yang digunakan untuk mengukur kekuatan hubungan,

besarnya pengaruh dan memprediksi pengaruh antar variabel respon dan variabel

prediktornya (Draper dan Smith, 1998). Regresi linier tidak hanya dapat digunakan pada

variabel prediktor dengan tipe skala rasio, akan tetapi juga bisa diterapkan dengan

menggunakan variabel dengan tipe skala nominal yang biasa dikenal dengan variabel

indikator, variabel kategorik, variabel kualitatif atau variabel dummy (Gujarati, 2004).

Regresi linier dengan menggunakan variabel dummy secara umum dapat

dimodelkan seperti ini:

dimana,

yi = variabel respon

0 … z = parameter-parameter regresi

xi1 … xip = variabel prediktor

Diq … Diz = variabel prediktor dummy

i = residual

Metode yang dikenal paling sederhana dan paling umum digunakan untuk

menghasilkan estimator dalam model regresi linier adalah ordinary least square (OLS).

Metode ini memperkecil kesalahan pendugaan yang terkecil (dan merupakan yang

terbaik) dengan memenuhi beberapa asumsi.

Asumsi-asumsi yang perlu dipenuhi dalam regresi linier adalah:

1. Berdistribusi normal

Error menyebar normal dengan rata-rata nol dan suatu ragam (variance) tertentu.

Penulisan matematis dari asumsi normalitas ini adalah:

)

Statistik uji yang paling sering digunakan untuk menguji asumsi kenormalan error

dengan menggunakan data residual adalah Kolmogorov-Smirnov normality test

2. Identik atau homoskedastik

adiw

talks

.word

press

.com

Page 3: ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT DENGAN PENDEKATAN DUMMY LINEAR REGRESSION, LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL NETWORKS

3

Ragam dari error bersifat homogen. Secara matematis ditulis =

=

dimana i, j = 1, ...., n; dan n = banyaknya pengamatan.

3. Independen

Adanya autokorelasi pada error mengindikasikan bahwa ada satu atau beberapa

faktor (variabel) penting yang mempengaruhi variabel respon Y yang tidak dimasukkan

ke dalam model regresi. Statistik uji yang sering dipakai adalah Uji Durbin-Watson

(DW-statistics).

Langkah penting selanjutnya setelah terpenuhi asumsi-asumsi regresi linier

adalah uji terhadap model dan koefisien-koefisien regresi baik secara simultan maupun

parsial dan mengetahui koefisien determinasinya. Koefisien determinasi adalah

besarnya keragaman (informasi) di dalam variabel Y yang dapat diberikan oleh model

regresi yang didapatkan.

Uji simultan (over all test) pada konsep regresi linier adalah pengujian mengenai

apakah variabel-variabel memiliki pengaruh yang signifikan terhadapa variabel respon

secara simultan. Sedangkah langkah berikutnya adalah uji parsial digunakan untuk

menguji apakah sebuah variabel-variabel prediktor benar-benar memberikan kontribusi

terhadap variabel respon secara terpisah.

2.2 Regresi logistik

Metode analisis regresi logistik merupakan metode analisis yang

menggambarkan hubungan antara sebuah variabel respon dengan satu atau beberapa

variabel prediktor. Tujuan menggunakan model ini adalah sama dengan teknik

pembuatan model yang lain, yaitu mencari model terbaik yang menggambarkan

hubungan antara variabel respon dan variabel prediktor (Agresi, 1990).

Model regresi logistik digunakan untuk menganalisis variabel respon yang

bertipe kategorik. Sedangkan variabel prediktor dapat berbentuk kuantitatif atau

kualitatif dengan menggunakan variabel dummy. Model ini juga digunakan untuk

mengetahui besarnya pengaruh variabel prediktor terhadap variabel respon yang

mengikuti sebaran distribusi Bernoulli.

Jika variabel independen yang digunakan berskala kategorik, yaitu ordinal

maupun nominal, maka variabel tersebut harus diubah menjadi variabel dummy. Secara

umum, bila suatu variabel mempunyai p kategori, maka diperlukan p-1 variabel dummy

(Hosmer dan Lemesow, 2000).

Menurut Iriawan dan Astuti (2006) secara umum persamaan dalam regresi

logistik dinyatakan dalam bentuk:

Dalam hal ini π(x) merupakan peluang sukses apabila variabel prediktor bernilai x.

Bentuk lain regresi logistik dapat dinyatakan dalm bentuk persamaan sebagai berikut.

Dari beberapa metode untuk mengestimasi parameter logistik, metode yang

banyak digunakan adalah metode maximum likelihood dengan alasan lebih praktis dan

mudah untuk digunakan (Nachrowi dan Usman, 2002). Langkah selanjutnya adalah

dengan memeriksa ketepatan model dengan menggunakan statistik chi-square (χ2) dan

G2.

adiw

talks

.word

press

.com

Page 4: ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT DENGAN PENDEKATAN DUMMY LINEAR REGRESSION, LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL NETWORKS

4

2.3 Feedforward Neural Networks (FFNN)

Jaringan saraf tiruan atau biasa dikenal dengan artificial neural networks (ANN),

atau juga disebut simulated neural network (SNN) atau umumnya hanya disebut neural

network (NN) merupakan jaringan dari sekelompok unit pemroses kecil yang

dimodelkan berdasarkan jaringan saraf manusia. Menurut Haykin (1999) Sebuah

jaringan saraf adalah sebuah prosessor yang terdistribusi paralel dan mempuyai

kecenderungan untuk menyimpan pengetahuan yang didapatkannya dari pengalaman

dan membuatnya tetap tersedia untuk digunakan. Hal ini menyerupai kerja otak dalam

dua hal yaitu:

1. Pengetahuan diperoleh oleh jaringan melalui suatu proses belajar

2. Kekuatan hubungan antar sel saraf yang dikenal dengan bobot sinapsis

digunakan untuk menyimpan pengetahuan

Jaringan saraf tiruan merupakan sistem adaptif yang dapat mengubah

strukturnya untuk memecahkan masalah berdasarkan informasi eksternal maupun

internal yang mengalir melalui jaringan tersebut. Secara sederhana, jaringan saraf tiruan

adalah sebuah alat pemodelan data statistik non-linier. Jaringan saraf tiruan dapat

digunakan untuk memodelkan hubungan yang kompleks antara input dan output untuk

menemukan pola-pola pada data.

Layer penyusun sebuah arsitektur neural network yaitu input layer, hidden layer

dan output layer. Input layer berfungsi sebagai tempat data di masukkan untuk proses

lebih lanjut, hidden layer merupakan unit proses dari data yang telah dimasukkan,

output layer merupakan tempat keluaran hasil dari proses yang telah dilakukan,

sedangkan weights adalah penimbang yang selalu berubah setiap input dimasukkan

untuk diproses. Bentuk arsitektur neural networks (NN) yang secara umum paling

banyak digunakan dalam aplikasi di bidang teknik atau rekayasa Feedforward Neural

Networks (FFNN).

Feedforward Neural Networks (FFNN) merupakan tipe yang pertama kali dan

paling sederhana dari jaringan syaraf tiruan yang diciiptakan. Data atau informasi

bergerak dalam satu arah kedepan (forward) dari input layer melalui hidden layer lalu

ke output layer. Tidak ada perputaran atau pengulangan pada jaringan (Rojas, 1996).

Secara sederhana dapat dilihat pada gambar berikut.

Gambar 1

Contoh sebuah arsitektur FFNN

adiw

talks

.word

press

.com

Page 5: ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT DENGAN PENDEKATAN DUMMY LINEAR REGRESSION, LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL NETWORKS

5

Metode dengan menggunakan pendekatan feedforward neural network banyak

diterapkan dalam berbagai bidang keilmuan, misalnya penggunaan feedforward neural

network untuk pemodelan data runtun waktu (Suhartono, 2007), analisis nilai tukar uang

riil (Kaashoek dan Van Dijk, 2002) dan pada dunia kedokteran terkait dengan penyakit

alzheimer (Kipennhan dkk,1992).

2.3 Konsep dan Definisi

Penduduk miskin adalah penduduk yang memiliki rata-rata pengeluaran per

kapita perbulan dibawah garis kemiskinan (BPS, 2010). Untuk mengukur kemiskinan,

BPS menggunakan konsep kemampuan memenuhi kebutuhan dasar (basic needs

approach). Dengan pendekatan ini, kemiskinan dipandang sebagai ketidakmampuan

dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan makanan yang

diukur dari sisi pengeluaran. Dengan pendekatan ini, dapat dihitung Head Count Index

(HCI), yaitu persentase penduduk miskin terhadap total penduduk.

Metode yang digunakan adalah menghitung Garis Kemiskinan (GK), yang

terdiri dari dua komponen yaitu Garis Kemiskinan Makanan (GKM) dan Garis

Kemiskinan Bukan-Makanan. Penghitungan Garis Kemiskinan dilakukan secara

terpisah untuk daerah perkotaan dan perdesaan. Garis Kemiskinan Makanan (GKM)

merupakan nilai pengeluaran kebutuhan minimum makanan yang disetarakan dengan

2.100 kilo kalori per kapita perhari. Paket komoditi kebutuhan dasar makanan diwakili

oleh 52 jenis komoditi (padi-padian, umbi-umbian, ikan, daging, telur dan susu, sayuran,

kacang-kacangan, buah-buahan, minyak dan lemak, dll). Garis Kemiskinan Bukan

Makanan (GKBM) adalah kebutuhan minimum untuk perumahan, sandang, pendidikan,

dan kesehatan. Paket komoditi kebutuhan dasar nonmakanan diwakili oleh 51 jenis

komoditi di perkotaan dan 47 jenis komoditi di perdesaan (BPS, 2010).

3. Metodologi

3.1 Sumber Data

Data yang digunakan adalah data sekunder dari Survei Sosial Ekonomi Nasional

(Susenas) tahun 2009 Provinsi Kalimantan Barat dengan 1 variabel respon dan 13

variabel prediktor. Secara keseluruhan data yang digunakan merupakan data cross

section dengan unit observasi sejumlah 500 rumah tangga. Variabel yang digunakan

pada penelitian ini adalah :

a. Variabel respon (Y) yaitu rata-rata pengeluaran perkapita rumah tangga perbulan

b. Variabel prediktor (X) terdiri dari 14 variabel, yaitu :

X1 = jumlah anggota rumah tangga

X2 = jenis kelamin kepala rumah tangga

X3 = umur kepala rumah tangga

X4 = status perkawinan kepala rumah tangga

X5 = ijasah tertinggi yang dimiliki kepala rumah tangga

X6 = kemampuan membaca huruf latin

X7 = status bekerja kepala rumah tangga seminggu terakhir

X8 = waktu terbanyak yang digunakan seminggu terakhir

X9 = jumlah jam kerja kepala rumah tangga

X10 = lapangan pekerjaan kepala rumah tangga

X11 = status rumah tangga terhadap penggunaan air

X12 = status rumah tangga terhadap penggunaan listrik

X13 = bahan bakar yang digunakan rumah tangga

adiw

talks

.word

press

.com

Page 6: ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT DENGAN PENDEKATAN DUMMY LINEAR REGRESSION, LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL NETWORKS

6

Tabel 1.

Jumlah variabel dummy yang dibentuk pada model sesuai dari variabel

prediktornya

3.2 Metode Analisis

Langkah-langkah analisis yang dilakukan pada penelitian ini adalah sebagai

berikut.

1. Menetapkan set data untuk training 75% dan untuk testing 25%

2. Analisis model 1 yaitu model regresi linier berganda (melibatkan semua variabel

prediktor) dengan menggunakan variabel dummy pada beberapa variabel

prediktornya karena merupakan data kategorik

3. Analisis model 2 yaitu model regresi linier terbaik dengan variabel dummy pada

beberapa variabel prediktornya menggunakan Stepwise Procedure (eliminasi

variabel prediktor yang tidak signifikan secara bertahap)

4. Analisis model 3 yaitu regresi logistik (melibatkan semua variabel prediktor)

5. Analisis model 4 yaitu model regresi logistik terbaik

6. Analisis model 5 yaitu pendekatan feedforward neural network pada model 1

7. Analisis model 6 yaitu pendekatan feedforward neural network pada model 2

8. Analisis model 7 yaitu pendekatan feedforward neural network pada model 3

9. Analisis model 8 yaitu pendekatan feedforward neural network pada model 4

10. Melakukan testing model 1 dan 2 dengan 25% data set dengan menggunakan

batas garis kemiskinan untuk Provinsi Kalimantan Barat

11. Analisis perbandingan ketepatan klasifikasi rumah tangga miskin antara model 1,

2, 3 hingga 8 dengan melakukan model testing 25% data set dengan

menggunakan batas garis kemiskinan untuk Provinsi Kalimantan Barat

12. Interpretasi dan kesimpulan model terbaik

4. Hasil dan Pembahasan

Dari hasil pengolahan data dengan menggunakan software MINITAB, SPSS dan

MATLAB dirangkum dalam tabel-tabel berikut:

Model 1 yaitu model regresi linier berganda dengan variabel dummy (melibatkan

semua variabel prediktor), diperoleh model regresinya:

i = 601072 - 28020 ART + 1397 Umur + 163 jam kerja + 76548 JK_1 + 50757

kawin_1 - 64964 kawin_2 + 47941 kawin_3 - 94665 ijasah tertinggi yang dimiliki_0

- 68820 ijasah tertinggi yang dimiliki_1 - 19903 ijasah tertinggi yang dimiliki_2

- 122171 ijasah tertinggi yang dimiliki_3 + 18524 ijasah tertinggi yang dimiliki_4

- 39097 ijasah tertinggi yang dimiliki_5 + 57728 ijasah tertinggi yang dimiliki_6

+ 150403 ijasah tertinggi yang dimiliki_7 + 118045 ijasah tertinggi yang dimiliki_8

variabel X2 X4 X5 X6 X7

jumlah variabel

dummy

1 3 11 1 1

variabel X8 X10 X11 X12 X13 total

jumlah variabel

dummy

3 9 8 3 5 45

adiw

talks

.word

press

.com

Page 7: ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT DENGAN PENDEKATAN DUMMY LINEAR REGRESSION, LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL NETWORKS

7

+ 30994 ijasah tertinggi yang dimiliki_9 + 147923 ijasah tertinggi yang dimiliki_10

- 70469 baca latin_1 + 31777 Seminggu terakhir bekerja?_1

- 133626 lap kerja_0 - 167680 lap kerja_1 - 109941 lap kerja_2 - 167680 lap kerja_3

+ 93803 lap kerja_4 - 240546 lap kerja_5 - 158306 lap kerja_6

- 133849 lap kerja_7 + 620808 lap kerja_8 - 175405 lap kerja_9

- 8377 air_1+ 477501 air_2 - 44112 air_3 - 64034 air_5 - 69758 air_6 + 40808 air_7

- 77797 air_9 - 170300 air_10 - 15164 listrik_1 + 106618 listrik_2 - 149978 listrik_4

- 63463 bahanbakar_1 + 94962 bahanbakar_2 - 86429 bahanbakar_3

- 21829 bahanbakar_4 - 80060 bahanbakar_5

+ 29763 waktu terbanyak seminggu terakh_0

+ 63867 waktu terbanyak seminggu terakh_1

+ 89044 waktu terbanyak seminggu terakh_3

Tabel 2

Hasil pengolahan regresi linier berganda dengan variabel dummy

(melibatkan semua variabel prediktor)

hasil keterangan

Asumsi Normalitas uji kolmogorov-smirnov

tidak signifikan pada

level 5%

residual tidak

berdistribusi normal

Asumsi Non-

Multikolinieritas

terdapat

multikolinieritas (nilai

VIF lebih dari 10)

beberapa variabel bebas

dari multikolinieritas

Asumsi Non-Autokorelasi nilai DW = 1,88102

tidak terdapat

autokorelasi

Overall test (Uji F) model signifikan pada

level 5%

nilai p-value < 0,05

Partial test (Uji t) signifikan beberapa

variabel pada level 5%

variabel yang ditandai

di atas yang signifikan

MSE 24736960235 sangat besar

R2 49,8%

Model 2 yaitu model regresi linier terbaik dengan variabel dummy pada

beberapa variabel prediktornya menggunakan Stepwise Procedure (eliminasi variabel

prediktor yang tidak signifikan secara bertahap) diperoleh model regresi terbaik adalah:

i = 412838 - 28045 ART + 115681 jasah tertinggi yang dimiliki_8 + 349947 lap

kerja_4 + 824178 lap kerja_8 + 480220 air_2 + 184580 bahanbbakar_2

adiw

talks

.word

press

.com

Page 8: ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT DENGAN PENDEKATAN DUMMY LINEAR REGRESSION, LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL NETWORKS

8

Tabel 3

Hasil pengolahan regresi linier terbaik dengan variabel dummy

(menggunakan stepwise procedure)

hasil keterangan

Asumsi Normalitas uji kolmogorov-smirnov

tidak signifikan pada

level 5%

residual tidak

berdistribusi normal

Asumsi Non-

Multikolinieritas

bebas dari

multikolinieritas

nilai VIF sekitar 1 (>10)

Asumsi Non-Autokorelasi nilai DW = 1,88102 tidak terdapat

autokorelasi

Overall test (Uji F) signifikan pada level 5% nilai p-value < 0,05

Partial test (Uji t) signifikan pada level 5% nilai p-value < 0,05

MSE 26146324990 sangat besar

R2 40%

Model 3 yaitu model regresi logistik (melibatkan semua variabel prediktor), dari

hasil pengolahan pada Minitab diperoleh hasil seperti pada tabel berikut:

Tabel 4

Hasil pengolahan model regresi logistik dengan melibatkan semua variabel

Indikator Hasil Keterangan

Ketepatan

model

Log-Likelihood = -75,053

Test that all slopes are zero: G =

58,972, DF = 49, P-Value = 0,156

Secara keseluruhan

parameter tidak

signifikan dalam model,

p-value > 0,05

Goodness of

Fit

Goodness-of-Fit Tests

Method Chi-Square DF P

Pearson 301,616 325 0,820

Deviance 150,105 325 1,000

Hosmer-Lemeshow 6,195 8 0,625

model fit karena nilai p-

value > 0,05

Variabel

yang

signifikan

wktu terbanyak seminggu terakh_1

variabel dummy ke-2

dari variabel waktu

terbanyak yang

digunakan seminggu

terakhir

Model 4 yaitu model regresi logistik terbaik. Dari hasil pengolahan diperoleh

hasil bahwa dengan menggunakan metode eliminasi mundur (backward elimination

procedure) dengan uji Wald maupun Likelihood Ratio (LR) tidak ada satupun variabel

prediktor yang signifikan.

Model 5 yaitu model dengan pendekatan feedforward neural network pada

model 1 yaitu model regresi linier berganda dengan variabel dummy (melibatkan semua

adiw

talks

.word

press

.com

Page 9: ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT DENGAN PENDEKATAN DUMMY LINEAR REGRESSION, LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL NETWORKS

9

variabel prediktor). Setelah dilakukan proses training dan simulasi dengan

menggunakan 1 hidden layer pada tiap neuron (maksimal 5 neuron), maka diperoleh

jaringan yang memiliki MSE paling kecil yaitu 1.6537e+012. Tiap training data akan

memberikan nilai MSE dan hasil prediksi yang berbeda-beda.

Tabel 5

Hasil pengolahan model dengan pendekatan feedforward neural network pada model 1

Neuron MSE

1 5.2012e+011

2 1.6537e+012

3 2.4331e+011

4 2.5397e+011

5 9.3404e+012

Model 6 yaitu model dengan pendekatan feedforward neural network pada

model 2 yaitu model regresi linier terbaik dengan variabel dummy pada beberapa

variabel prediktornya. Setelah dilakukan proses training dan simulasi dengan

menggunakan 1 hidden layer pada tiap neuron (maksimal 5 neuron), maka diperoleh

jaringan yang memiliki MSE paling kecil yaitu 1.3155e+012

Tabel 6

Hasil pengolahan model dengan pendekatan feedforward neural network pada model 2

Neuron MSE

1 8.8462e+011

2 3.6721e+012

3 1.3155e+012

4 3.9548e+011

5 2.1239e+011

Model 7 yaitu model dengan pendekatan feedforward neural network pada

model 3 yaitu model regresi logistik (melibatkan semua variabel prediktor). Setelah

dilakukan proses training dan simulasi dengan menggunakan 1 hidden layer pada tiap

neuron (maksimal 5 neuron), maka diperoleh jaringan yang memiliki MSE paling kecil

yaitu 0.0965.

adiw

talks

.word

press

.com

Page 10: ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT DENGAN PENDEKATAN DUMMY LINEAR REGRESSION, LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL NETWORKS

10

Tabel 7

Hasil pengolahan model dengan pendekatan feedforward neural network pada model 3

Neuron MSE

1 0.1851

2 0.6420

3 1.1330

4 0.0965

5 0.9113

Model 8 yaitu model dengan pendekatan feedforward neural network pada

model 4 tidak dapat dilakukan karena pada model 4 tidak diperoleh model loistik

terbaik.

Untuk melihat seberapa efektif sebuah model, maka dapat dilihat dari seberapa

kecil tingkat kesalahan prediksi atau klasifikasi terhadap rumah tangga miskin itu

sendiri. Hasil prediksi dengan tingkat kesalahan prediksi dan klasifikasi antar model sbb

Tabel 4

Hasil pengolahan semua model penelitian dengan tingkat kesalahan prediksi

Kesalahan Prediksi (%)

Metode Training Testing

dummy variable linear

regression Semua variabel 14,07 6,43

Model terbaik 7,49 2,11

FFNN Semua variabel 24 0,8

Model terbaik 8,67 2,26

Kesalahan Klasifikasi (%)

Training Testing

Regresi Logistik Semua variabel 9,92 2,42

Model terbaik - -

FFNN Semua variabel 8 7,2

Model terbaik - -

Dapat dilihat bahwa model yang memiliki tingkat kesalahan prediksi terkecil

pada testing maupun training adalah model ke-2 yaitu model regresi linier terbaik

dengan variabel dummy pada beberapa variabel prediktornya.

5. Kesimpulan

Dari hasil pembahasan di atas dapat disimpulkan bahwa

1. Pemodelan dengan menggunakan regresi linier berganda dengan memasukkan

semua variabel prediktor menunjukkan bahwa model secara keseluruhan

signifikan meski ada beberapa variabel prediktor yang tidak signifikan dengan

adiw

talks

.word

press

.com

Page 11: ANALISIS KEMISKINAN DI PROVINSI KALIMANTAN BARAT DENGAN PENDEKATAN DUMMY LINEAR REGRESSION, LOGISTIC REGRESSION DAN FEEDFORWARD NEURAL NETWORKS

11

memenuhi asumsi bebas autokorelasi, akan tetapi asumsi normalitas dan bebas

multikolinieritas tidak terpenuhi

2. Pemodelan regresi linier terbaik dengan menggunakan stepwise procedure

(eliminasi variabel prediktor yang tidak signifikan secara bertahap)

menunjukkan hasil yang cukup berbeda dengan model 1, yaitu meskipun model

signifikan secara statistik dan bebas dari pelanggaran asumsi (kecuali asumsi

normalitas) akan tetapi model ini memiliki nilai koefisien determinasi yang lebih

kecil dibandingkan model 1 yaitu 40%

3. Model regresi logistik dengan memasukkan semua variabel menghasilkan

kesimpulan yaitu bahwa model klasifikasi rumah tangga miskin dengan regresi

logistik tidak signifikan secara keseluruhan

4. Model dengan pendekatan FFNN pada regresi logistik menghasilkan tingkat

kesalahan prediksi dan nilai MSE yang relatif kecil jika dibandingkan dengan

model dengan pendekatan FFNN pada regresi linier berganda

5. Model terbaik yang menghasilkan tingkat kesalahan prediksi terendah dalam

pengklasifikasian rumah tangga miskin di Provinsi Kalimantan Barat adalah

regresi linier sederhana dengan variabel dummy

Daftar Pustaka

Agresti A. (1990). Categorical Data Analysis. New York: John Wiley & Sons.

Arisanti, Restu (2011), “Model Regresi Spasial Untuk Deteksi Faktor-faktor Kemiskinan di Provinsi

Jawa Timur”, Tesis. Bogor: Institut Pertanian Bogor (IPB).

[BPS] Badan Pusat Statistik, (2010), Berita Resmi Statistik. Kalimantan Barat: Badan Pusat Statistik.

Draper, N. R., Smith, H. (1998), Applied Regression Analysis. New York: John Willey and Sons, Inc.

Gujarati, Damodar (2004), Basic Econometrics 4th

edition. New York: McGraw-Hill

Haykin, S. (1999), Neural Networks: A Comprehensive Foundation. 2nd

Edition. Oxford: Prentice Hall

Hosmer, D.W., Lemeshow, S. (2000). Applied Logistic Regression. New York : Wiley

Iriawan, Nur, Astuti, S.P. (2006). Mengolah Data Statistik dengan Mudah Menggunakan Minitab 14.

Yogyakarta: Penerbit Andi

Kaashoek, J.F., and Van Dijk, H.K. (2002). Neural Network Pruning Applied to Real Exchange Rate

Analysis. Journal of Forecasting, Volume 21

Kippenhan, J.S., Barker, W.W., Pascal,S., Nagel, J. and Duara, R. (1992). Evaluation of a neural

network classifier for PET scans of normal and Alzheimer disease subjects. Journal of

Nuclear Medicine, Volume 33

Nachrowi, D.N., Usman, H. ( 2002). Penggunaan Teknik Ekonometri. Jakarta: Raja Grafindo Persada

Rojas, R. (1996). Neural Networks A Systematic Introduction. Berlin: Springer-Verlag

Suhartono.(2007), Feedforward Neural Networks Untuk pemodelan Runtun Waktu. Disertasi.

Yogyakarta: Universitas Gadjah Mada (UGM)

adiw

talks

.word

press

.com