analisis pengelompokan desa tertinggal di kabupaten kutai timur dengan pendekatan metode k-means dan...

1

ANALISIS PENGELOMPOKAN DESA TERTINGGAL

DI KABUPATEN KUTAI TIMUR DENGAN

PENDEKATAN METODE K-MEANS DAN WARD

(Squared Euclidean Distance Measure)

Adi Wijaya

NRP. 1310201720

Program Pascasarjana, Jurusan Statistika, Fakultas MIPA,

Institut Teknologi Sepuluh Nopember, Surabaya

Abstract

Poverty is one of the complicated problems in Indonesia and many countries.

In Indonesia especially in East Kutai (Kutai Timur), the government has published

many policies to press the poverty rate. However, poverty is not only about people but

also about related to surrounding areas like village. Therefore, this research uses

culstering analysis method to find how many clusters will be produced by this method

and how many villages that be included in each cluster. The different methods used in

this research are non-hierarchical method with k-means clustering analysis and

hierarchical method with Ward’s method using squared euclidean distance measure .

The results show that the number of clusters of villages in East Kutai is two clusters

with different member of each cluster of each method.

Keywords: poverty, villages, k-means clustering, Ward’s method, squared euclidean

distance

1. Pendahuluan

Salah satu masalah utama saat ini baik di negara-negara miskin, berkembang

maupun di negara-negara maju adalah kemiskinan. Kemiskinan merupakan awal dari

timbulnya masalah-masalah sosial lainnya yang terkait erat dengan kualitas

pendidikan, kriminalitas, kelaparan dsb yang secara tidak langsung akan mengganggu

ketahanan atau stabilitas negara (Arisanti, 2008). Oleh karena itu pemerintah daerah

di tiap negara berjuang keras untuk mengatasi masalah kemiskinan dengan beragam

kebijakan-kebijakan, termasuk daerah-daerah di Indonesia.

Kutai Timur sebagai salah satu kabupaten di Propinsi Kalimantan Timur juga

berjuang untuk mengatasi kemiskinan di daerahnya dengan beragam kebijakan baik

nasional maupun lokal antara lain bantuan langsung tunai (BLT), pelayanan kesehatan

gratis (JAMKESMAS), pendidikan gratis dsb. Selain itu pembangunan sarana-sarana

2

penunjang kebijakan-kebijakan tersebut juga ditingkatkan baik dari segi jumlah

maupun kualitas di berbagai lini dari desa, kecamatan hingga tingkat kabupaten (BPS,

2009).

Salah satu langkah awal memerangi kemiskinan adalah dengan mengetahui

kantong-kantong kemiskinan di Kabupaten Kutai Timur. Kantong-kantong

kemiskinan ini merupakan kelompok desa-desa yang memiliki kedekatan karakteristik

sarana dan kemiripan dalam nilai-nilai sejumlah variabel sehingga didefinisikan

sebagai desa tertinggal. Dengan mengetahui secara geografis desa-desa yang

mengalami ketertinggalan, diharapkan akan lahir kebiijakan-kebijakan yang tepat

sasaran dan efektif dalam memerangi kemiskinan di Kutai Timur.

Badan Pusat Statistik telah melakukan perhitungan skor desa tertinggal sejak

1993 sebagai penentu identifikasi daerah kantong-kantong kemiskinan melalui data

Potensi Desa. Akan tetapi untuk mengklasifikasian tertinggal tidaknya suatu desa,

dilakukan oleh Kementerian Pembangunan Daerah Tertinggal berdasarkan pada nilai

skor yang diperoleh setiap desa. Metode yang digunakan BPS dalam menentukan

skor desa adalah dengan nilai indeks komposit ketertinggalan desa yang merupakan

rata-rata dari jumlah skor kondisi desa berdasarkan faktor alam/lingkungan, faktor

kelembagaan, keterbatasan sarana prasarana dan akses serta faktor sosial ekonomi

penduduk. Kemudian Kementerian Pembangunan Daerah Tertinggal menetapkan

desa-desa yang memiliki skor terkecil sebagai desa tertinggal dalam suatu kabupaten.

Supaya penetapan desa tertinggal lebih valid, maka dilakukanlah proses klarifikasi

ulang kepada pihak kabupaten yang bersangkutan.

Metode scoring dengan tanpa memperhitungkan faktor jarak atau kedekatan

karakteristik antar wilayah memiliki beberapa kelemahan yaitu tidak tertangkapnya

perbedaan kondisi geografis dan sosilogis antar wilayah, sehingga menghasilkan

pengklasifikasian yang tidak tepat (Widyasthika, 2005).

Oleh karena itu perlu dilakukan sebuah penelitian yang menggunakan metode

dengan memperhitungkan faktor jarak kedekatan antar desa. Sehingga diperoleh

pengelompokan desa tertinggal yang tepat dan akurat. Salah satu metode yang cukup

populer untuk menjawab permasalahan ini adalah clustering atau penggerombolan.

Metode clustering merupakan suatu metode untuk mengelompokkan individu

atau unit penelitian ke dalam beberapa kelompok dimana setiap unit penelitian dalam

suatu kelompok akan mempunyai ciri yang relatif sama sedangkan antar kelompok

unit pengamatan memiliki sifat yang berbeda. Pada penelitian ini, akan digunakan

3

pendekatan hierarchical method yaitu metode Ward dengan menggunakan ukuran

jarak squared Euclidean. Selain itu, untuk mendapatkan keterbandingan dengan

metode yang lain akan digunakan non-hierarchical method yaitu metode k-means

cluster analysis.

Diharapkan penggunaan metode cluster ini mampu mengklasifikasikan desa-

desa tertinggal dengan baik, sehingga diperoleh suatu kesimpulan dan keputusan yang

dapat dijadikan salah satu rujukan dalam program pengentasan kemiskinan yang tepat

sasaran melalui program di desa-desa tertinggal di Kabupaten Kutai Timur.

2. Tinjauan Pustaka

2.1. Metode Cluster

. Analisis cluster merupakan analisis yang bertujuan untuk

mengelompokkan unit penelitian ke dalam beberapa kelompok dimana setiap unit

penelitian dalam suatu kelompok akan mempunyai ciri yang relatif sama sedangkan

antar kelompok unit pengamatan memiliki sifat yang berbeda (Rencher, 2002).

Metode cluster yang akan digunakan dalam penelitian ini adalah sebagai berikut:

1) Hierarchical Method (Ward’s method)

Tujuan utama penggunaan metode ini adalah apabila jumlah kelompok

yang diinginkan tidak diketahui. Pengelompokan disajikan secara visual berbentuk

dendogram yang menyajikan gambaran jumlah kelompok terbesar hingga

terkecil. Metode ini memulai pengelompokkan pada unit penelitian yang

mempunyai kesamaan karakteristik terdekat yang dianalogikan dengan jarak.

Proses dilanjutkan dengan unit penelitian lainnya dengan pertimbangan

sama sepert i proses sebelumnya yaitu unit penelit ian yang memiliki

kesamaan karakteristik terdekat berikutnya, proses yang sama dilakukan hingga

ada tingkatan c u k u p jelas antar unit penelitian dari yang paling mirip sampai

yang paling tidak mirip, sehingga pada akhirnya akan membentuk hanya satu

kelompok. Pada pengelompokan Hierarki terdapat beberapa jenis metode antara

lain between-groups linkage, within-groups linkage, nearest neighbor, furthest

neighbor, centroid clustering, median clustering dan Ward's method. Metode

clustering yang digunakan dalam penelitian ini adalah metode Ward.

Penentuan ukuran interval yang digunakan dalam penelitian ini adalah

squared Euclidean distance yaitu penjumlahan kuadrat dari selisih antara nilai-

nilai variabel dari dua unit penelitian yang berbeda. Squared Euclidean distance

4

antara dua unit penelitian misalkan X dan Y dapat dirumuskan sebagai berikut:

, dimana p adalah jumlah variabel.

Pembentukan kelompok berdasarkan pada informasi yang hilang sebagai

akibat dari penggabungan-penggabungan individu-individu menjadi kelompok

yang diukur dengan jumlah total kuadrat deviasi tiap observasi dan rata-rata tiap

kelompok. Informasi yang hilang ini dinamakan dengan Error Sum Square (ESS).

Unit penelitian yang mempunyai ESS yang terkecil tergabung menjadi sebuah

kelompok. Begitu seterusnya sampai terbentuk satu kelompok yang

mencakup semua unit penelitian (Ward, 1963) .

2) Non Hierarchical Method (K-means clustering)

Menurut MacQueen (1967), metode ini dimulai dengan menentukan jumlah

cluster terlebih dahulu yang diinginkan misalkan c cluster. Langkah berikutnya

adalah K-Means, dengan langkah-langkah sebagai berikut:

a. Mempartisi objek menjadi sejumlah c initial cluster, kemudian dihitung nilai

rata-rata (centroid) untuk masing-masing kelompok cluster yang ada

b. Memasukkan unit-unit penelitian pada cluster yang memiliki centroid

terdekat (dihitung dari jaraknya). Kemudian hitung kembali centroid untuk

masing-masing cluster yang mengalami perubahan anggotanya (unit

penelitian)

c. Ulangi langkah (b ) sampai diperoleh cluster yang tidak berubah-ubah lagi

atau stabil

2.2 Konsep dan Definisi

Desa tertinggal adalah desa-desa yang kondisinya relatif tertinggal dari desa-

desa lainnya. Kemajuan atau ketertinggalan suatu desa dicerminkan oleh indikator

utama, yaitu tinggi rendahnya rata-rata pengeluaran perkapita penduduk desa (BPS,

2003).

Menurut Sumaryadi dalam Widhyast ika (1997), desa tertinggal dicirikan

sebagai desa dengan potensi sumber daya alam yang terbatas, prasarana dan sarana

pelayanan dasar yang tidak lengkap, serta kelembagaan sosial ekonomi yang

belum berkembang. Desa miskin tidak memberikan sumber penghidupan yang

memadai kepada penduduk yang tinggal di dalamnya.

5

3. Metodologi

3.1 Sumber Data

Data yang digunakan dalam penelitian ini adalah data Potensi Desa Kabupaten

Kutai Timur, Propinsi Kalimantan Timur tahun 2008. Secara keseluruhan data yang

digunakan merupakan data cross section dengan unit observasi sejumlah 135 desa

tanpa dibedakan antara rural dan urban. Sedangkan variabel yang digunakan sebagai

dasar clustering pada penelitian ini adalah karakteristik dari desa yaitu: kepadatan

penduduk/km2, persentase keluarga yang memiliki listrik (PLN), persentase keluarga

yang tinggal di bantaran sungai, persentase keluarga yang tinggal di pemukiman

kumuh, persentase keluarga penerima askeskin, persentase keluarga yang

berlangganan telepon kabel, jumlah SD negeri, jumlah posyandu, jumlah bidan,

jumlah industri makanan, jumlah pasar tanpa bangunan, jumlah restoran, jumlah toko,

jumlah penginapan dan jumlah rumah permanen.

3.2 Metode Analisis

Langkah-langkah analisis yang dilakukan pada penelitian ini adalah sebagai berikut.

1. Menentukan jumlah cluster yang ingin dibentuk yaitu dua cluster

2. Analisis cluster dengan menggunakan Hierarchical Method (Ward’s method)

3. Analisis cluster dengan menggunakan non-Hierarchical Method (K-menas)

4. Analisis perbandingan antara metode (1) dan (2)

5. Interpretasi dan kesimpulan

4. Hasil dan Pembahasan

4.1 Analisis cluster dengan menggunakan Hierarchical Method (Ward’s method)

Dari hasil pengolahan data dengan menggunakan software SPSS, terlihat dari

dendogram bahwa desa di Kabupaten Kutai Timur terbagi menjadi dua kelompok

desa yaitu desa dengan kategori tertinggal dan tidak.

Jumlah desa Keterangan

Desa tertinggal (cluster ke-1) 132 Selain desa no

26, 63 dan 59

Desa tidak tertinggal (cluster ke-2) 3 Desa no 26, 63 dan 59

Hal ini menunjukkan bahwa di Kabupaten Kutai Timur diperoleh klasifikasi desa

6

dengan dua kategori dengan mempertimbangkan variabel-variabel sebagai dasar

pembeda atau jarak.

4.2. Analisis cluster dengan menggunakan non-Hierarchical Method (K-means)

Dari hasil pengolahan data dengan menggunakan software SPSS, terlihat

bahwa desa terbagi menjadi dua kelompok yaitu desa dengan kategori tertinggal dan

tidak.

Jumlah desa

Desa tertinggal 134 Selain desa no 59

Desa tidak tertinggal 1 Desa no 59

Pada tabel ANOVA (terlampir), dapat diketahui variabel-variabel yang signifikan

secara statistik sebagai faktor yang mempengaruhi pengelompokan desa tertinggal

atau tidak adalah: kepadatan penduduk/km2, persentase keluarga yang memiliki listrik

(PLN), persentase keluarga yang berlangganan telepon kabel, jumlah posyandu,

jumlah bidan, jumlah restoran, jumlah toko dan jumlah penginapan

Perbedaan hasil pengelompokan desa antar kedua metode ini adalah pada

penentuan jumlah cluster. Pada metode hierarki, penentuan atau pemilihan jumlah

cluster dilakukan proses clustering selesai dengan kata lain jumlah cluster tidak dapat

diketahui sebelumnya, yang hasilnya diserahkan sepenuhnya pada peneliti dengan

mengedepankan subyektifitas sesuai dengan tujuan penelitian. Hal ini mengakibatkan

cluster yang terbentuk bisa saja sejumlah 4, 5, 3 atau 2 terkait subyektifitas peneliti.

Sedangkan pada metode non-hierarki, penentuan atau pemilihan jumlah cluster sudah

harus ditentukan di awal sebelum proses clustering berjalan, sehingga hasil

akhirnyapun akan terbentuk jumlah cluster yang sama. Penentuan ini menuntut

kehati-hatian, pengetahuan, informasi memadai dan intuisi yang cukup tinggi dari

peneliti.

5. Kesimpulan

Dari hasil pembahasan di atas dapat disimpulkan bahwa

1. Pengelompokan dengan menggunakan metode Ward dapat diketahui bahwa di

Kabupaten Kutai Timur terdapat dua kelompok desa yaitu desa tertinggal dan

7

tidak tertinggal dengan mempertimbangkan beberapa informasi yang

merupakan karakteristik dari masing-masing desa dengan komposisi desa

tidak tertinggal sejumlah 1 desa dan desa tertinggal sejumlah 134 desa

2. Pengelompokan dengan menggunakan metode K-means clustering dapat

diketahui bahwa di Kabupaten Kutai Timur terdapat dua kelompok desa yaitu

desa tertinggal dan tidak tertinggal dengan komposisi desa tidak tertinggal

sejumlah 3 desa dan desa tertinggal sejumlah 132 desa

3. Perbedaan antar metode hierarki dan non-hierarki terletak pada penentuan

jumlah cluster yang terbentuk, metode hierarki setelah proses clustering

sedangkan pada metode non-hierarki sebelum proses clustering

4. Variabel-variabel yang signifikan secara statistik sebagai faktor jarak yang

mempengaruhi pengelompokan desa tertinggal atau tidak adalah: kepadatan

penduduk/km2, persentase keluarga yang memiliki listrik (PLN), persentase

keluarga yang berlangganan telepon kabel, jumlah posyandu, jumlah bidan,

jumlah restoran, jumlah toko dan jumlah penginapan

Daftar Pustaka

Arisanti, Restu. (2011), “Model Regresi Spasial Untuk Deteksi Faktor-faktor

Kemiskinan di Provinsi Jawa Timur”. Tesis. Bogor: Institut Pertanian Bogor

(IPB).

[BPS] Badan Pusat Statistik. 2009. Kutai Timur Dalam Angka. Kutai Timur: Badan

Pusat Statistik.

MacQueen, J.B. 1967. Some Methods for Classification and Analysis of Multivariate

Observations Hierarchical Grouping to Optimize an Objective Function.

Berkeley: University of California Press A967

Rencher, Alvin C. 2000. Methods of Multivariate Analysis:2nd

edition. England: Jhon

Willey & Sons Ltd

Widyasthika, Hayu Fadlun (2005), “Evaluasi Pengklasifikasian Desa Tertinggal

Kabupaten Purworejo Tahun 2005”. Skripsi. Jakarta: Sekolah Tinggi Ilmu

Statistik (STIS).

Ward, J.H. 1963. Hierarchical Grouping to Optimize an Objective Function. Journal

of the American Statistical Association. Vol. 58, 236-244.

8

Lampiran

* * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * *

Dendrogram using Ward Method

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25

Label Num +---------+---------+---------+---------+---------+

54 -+

56 -+

126 -+

… 14 -+

78 -+

36 -+-----+

83 -+ |

37 -+ |

79 -+ |

10 -+ |

25 -+ |

74 -+ |

…

24 -+ |

22 -+ |

31 -+ |

93 -+ |

43 -+ |

57 -+ |

49 -+ |

39 -+ +---------------+

76 -+ | |

55 -+ | |

133 -+ | |

41 -+ | |

19 -+ | |

68 -+ | |

48 -+ | |

102 -+ | |

42 -+ | |

44 -+ | |

35 -+ | |

80 -+ | |

29 -+ | |

4 -+ | |

70 -+ | +-------------------------+

51 -+ | | |

11 -+ | | |

2 -+-----+ | |

5 -+ | |

69 -+ | |

1 -+ | |

3 -+ | |

27 -+ | |

28 -+ | |

61 -+ | |

30 -+ | |

82 -+ | |

60 -+ | |

81 -+ | |

62 -+ | |

73 -+---------------------+ |

26 -+ |

63 -+ |

59 -------------------------------------------------+

9

* * * * N O N - H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * *

ANOVA

Cluster Error

F Sig. Mean Square df Mean Square df

kepadatan pddk/km2 1.057E7 1 4041.923 133 2614.686 .000

persen klg dgn pln 5682.462 1 1216.987 133 4.669 .032

persen klg bantaran sungai 159.298 1 316.872 133 .503 .480

persen klg pemukiman

kumuh

9.727 1 111.282 133 .087 .768

persen klg terima askeskin 24.980 1 312.591 133 .080 .778

persen klg berlang telpon

kabel

77.622 1 17.841 133 4.351 .039

jml sd negeri .836 1 .301 133 2.774 .098

jml posyandu 32.098 1 1.059 133 30.312 .000

jml bidan 238.241 1 1.154 133 206.434 .000

jml industri makanan .488 1 75.444 133 .006 .936

jml pasar tanpa bangunan .029 1 .158 133 .185 .668

jml restoran 384.982 1 1.297 133 296.904 .000

jml toko 129099.076 1 1208.984 133 106.783 .000

jml pengnpn 20.368 1 1.289 133 15.806 .000

jml rumah permanen 191039.877 1 57937.937 133 3.297 .072

The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the

differences among cases in different clusters. The observed significance levels are not corrected for this and thus

cannot be interpreted as tests of the hypothesis that the cluster means are equal.

[email protected]

analisis pengelompokan desa tertinggal di kabupaten kutai timur dengan pendekatan metode k-means dan...

Documents