Download - Bagian Inti+Akhir
Analisis Multivariat II
BAB I
PENDAHULUAN
1.1 Latar Belakang
Indonesia memiliki penduduk yang sangat beragam. Berbagai macam ras,
kebudayaan dan adat istiadat ada dalam negara Indonesia. Akan tetapi hal yang terpenting
adalah Indonesia memiliki penduduk yang beragam dari berbagai macam suku yang
tentunya memiliki berbagai macam perbedaan. Kebiasaan penduduk Indonesia pun sangat
beragam sehingga pemerintah tentu saja harus memahami bagaimana kebiasaan dari setiap
penduduk. Menurut Badan Pusat Statistik, penduduk di Indonesai mencapai 245 juta jiwa.
Semakin lama, penduduk di Indonesia semakin meningkat. Pertumbuhan penduduk
di Indonesia ini disebabakan oleh banyaknya kelahiran dan sedikitnya angka kematian.
Menurut Badan Pusat Statistik, setiap tahun penduduk di Indonesia memiliki pertumbuhan
sebesar 4 juta jiwa setiap tahunnya. Angka yang cukup banyak untuk pertumbuhan di
negara berkembang.
Dari 245 juta penduduk Indonesia tahun 2010, 24 juta diantaranya adalah
penduduk lanjut usia. Dari jumlah penduduk di Indonesia, terdapat pengelompokan
menurut usia. Hal ini diperlukan karena setiap kelompok usia memilki kebutuhan dan
kebiasaan yang berbeda-beda. Misalnya saja untuk kelompok lanjut usia yang harus
diperhatikan lebih oleh pemerintah.
Penduduk yang termasuk lanjut usia adalah penduduk yang telah berumur 60
tahun. Mengingat penduduk lansia semakin lama semakin banyak, didasarkan perkiraan
BPS pada tahun 2005 penduduk lansia cenderung bertambah atau ada perubahan struktur
dari struktur penduduk muda ke struktur penduduk tua. Indonesia sendiri menduduki
ranking keempat di dunia dengan jumlah lansia 24 tahun jiwa yang belum terlalu
mendapat perhatian. Tidak hanya menghadapi angka kelahiran yang semakin meningkat,
Indonesia juga menghadapi beban ganda dengan kenaikan jumlah penduduk lanjut usia
(60 tahun keatas) karena usia harapan hidup yang makin panjang bisa mencapai 77 tahun.
Dengan jumlah penduduk lanjut usia yang semakin besar, perlu adanya perhatian
ekstra dari pihak pemerintah untuk permasalahan ini. Masalah penduduk lanjut usia ini
dapat menjadi masalah besar atau peluang yang tidak kalah besarnya. Pertambahan jumlah
penduduk lanjut usia akan menyebabkan perubahan berbagai sendi kehidupan, ekonomi,
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 1
Analisis Multivariat II
sosial kemasyarakatan, seperti kebutuhan hidup, makanan dan minuman. Untuk itu, perlu
adanya stategi persiapan dan pemberdayaan atau pembinaan bagi penduduk lanjut usia
agar dapat tetap aktif dan berkarya. Diperkirakan sekarang hanya ada 20% lansia yang
sakit-sakitan, sedangkan sisanya 80% adalah lansia potensial yang masih bisa
diberdayakan.
Untuk dapat mengatasi hal tersebut dan agar lansia tetap produktif, pemerintah
harus melakukan pembinaan terhadap provinsi-provinsi di Indonesia yang memiliki cukup
banyak lansia. Pembentukan wilayah pembinaan untuk permasalahan lansia perlu
dilakukan agar pemerintah dapat mengetahui wilayah mana saja yang harus mendapatkan
pembinaan terdahulu berdasarkan karakteristik dari keterlantaran penduduk lanjut usia.
Hal ini dilakukan agar penduduk lanjut usia tetap produktif.
1.2 Identifikasi Masalah
Berdasarkan latar belakang penelitian di atas, maka masalah-masalah yang ingin
diteliti dalam penelitian ini adalah sebagai berikut:
1. Provinsi mana sajakah yang memiliki kesamaan karakteristik dalam penanganan
masalah penduduk lanjut usia?
2. Provinsi mana sajakah yang harus lebih diperhatikan oleh pemerintah?
3. Bagaimana karakteristik objek pada setiap kelompok ?
1.3 Tujuan Penelitian
Tujuan dari pembuatan makalah ini adalah sebagai berikut:
1. Membagi atau mempartisi provinsi-provinsi di Indonesia menjadi dua kelompok yaitu
kelompok lanjut usia yang diperhatikan dan kelompok lanjut usia yang tidak
diperhatikan.
2. Mengidentifikasi provinsi-provinsi mana saja yang memiliki kesamaan karakteristik
dalam hal ini mengenai kelompok penduduk lanjut usia
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 2
Analisis Multivariat II
1.4 Manfaat Penelitian
Manfaat yang dapat di ambil dari penelitian ini adalah sebagai berikut :
Untuk Pemerintah
1. Dapat mengetahui provinsi-provinsi mana saja yang perlu mendapat perhatian ekstra
dari pemerintah.
2. Pemerintah dapat memilih langkah yang lebih baik untuk penanganan penduduk lanjut
usia.
Untuk penulis
1. Penulis dapat mengaplikasikan ilmu-ilmu yang telah dipelajari ke dalam kasus nyata.
2. Penulis dapat ikut serta dalam menangani masalah penduduk lanjut usia.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 3
Analisis Multivariat II
BAB II
TINJAUAN PUSTAKA
2.1 Sejarah Analisa Multivariat
Analisis data multivariat telah berkembang pesat sejak munculnya komputer
modern. Langkah pertama dimulai pada sekitar tahun 1870 dalam paper berjudul Singular
Value Decomposition oleh Eugenio Beltrami dan regresi linear oleh Sir Francis Galton.
Selanjutnya, Karl Pearson, yang dikenal sebagai kontributor yang cukup besar untuk
analisis statistik, menemukan Principal Component Analysis.
Sejak saat itu, banyak penemuan penting yang mendukung penemuan analisa
multivariat, salah satunya adalah Hotelling Transform oleh Harold Hotelling pada tahun
1933. Pada tahun 196,, ekonom dan statistik Herman Wold menemukan Nonlinear
Iterative Partial Least Squares algorithm, atau NIPALS. Konsep ini tidak sepenuhnya
baru, sebab temuan serupa telah diterbitkan pada tahun 1923 oleh Fischer et al. Akan
tetapi, orisinalitas dalam karya Wold ’s H merupakan interpretasi dari partial least squares
dan memiliki kemampuan untuk mencari nilai yang hilang. Selama tahun-tahun
berikutnya, Wold mengembangkan algoritma NIPALS ke metode Partial Least Squares
regression (PLS) yang menjadi bagian inti dari software Umetric saat ini. Svante Wold
menyederhanakan algoritma PLS dan ditambah ke dalam interpretasi diagnostik pada
tahun 1980. Pekerjaan ini kemudian telah mengalami perubahan metode ke dalam alat
analisis data umum ilmiah.
Banyak sekali tokoh-tokoh statistik yang berperan dalam perkembangan ilmu
analisa multivariat. Diantaranya adalah pada awal abad 19, Robert Adrian mulai
mempertimbangkan distribusi normal bivariat dan Karl Pearson menemukan korelasi
berganda, dan analisis regresi. Terdapat pula Francis Galton yang memahami sifat korelasi
dan kedekatan pada akhir abad 19. Kemudian, GU Natal dan lain-lain mempertimbangkan
ukuran dari asosiasi dalam tabel kontingensi, dan dari sinilah data multivariate mulai
dihitung. J. Wishart menurunkan distribusi gabungan dari sampel varians dan covariances
untuk sampel kecil yang bersifat normal multivariat.
Harold Hotelling mengeneralisasi tabel t-statistik dan t-distribusi untuk masalah
multivariat. SS Wilks menemukan prosedur untuk tes hipotesis tambahan pada rata-rata,
variasi, dan covariances. Hotelling dan Maurice Bartlett membuat studi awal korelasi
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 4
Analisis Multivariat II
kanonik, intercorrelations antara dua kelompok variat. Penelitian lebih baru oleh SN Roy,
PL Hsu, Meyer Girshick, DN Nanda, dan lain-lain menangani root distribution dan
karakteristik tertentu yang berkaitan dengan masalah multivariat, terutama untuk korelasi
kanonik dan analisis varians multivariat. Banyak perhatian juga telah diberikan kepada
pengurangan data multivariat dan interpretasi melalui studi tentang analisis faktor dan
komponen utama.
Analisis multivariat dalam statistik dikhususkan untuk summarization,
representasi, dan interpretasi data ketika lebih dari satu karakteristik dari setiap unit
sampel diukur. Hampir semua proses pengumpulan data menghasilkan data multivariat.
Suatu masalah menggunakan analisa multivariat ketika terdapat banyak data, dimana data-
data tersebut saling berhubungan dan memepengaruhi satu sama lain. Sifat keterkaitan
tersebut dapat digunakan dalam prediksi, estimasi, dan metode klasifikasi.
2.2 Analisis Multivariat
Tahap analisis data pada umumnya dapat dibagi menjadi tiga tahap. Ketiga tahap
tersebut adalah deskriptif, analisis bivariat, dan analisis multivariat. Deskriftif berbicara
mengenai gambaran suatu variabel, analisis bivariat berbicara tentang hubungan antara
dua variabel, sementara multivariat berbicara tentang hubungan antara banyak variabel
bebas dengan suatu variabel terikat. Disini kita akan lebih jauh berbicara mengenai apa itu
analisis multivariate.
Analisis multivariat merupakan salah satu teknik statistik yang digunakan untuk
memahami struktur data dalam dimensi tinggi. Disebut dimensi tinggi karena melibatkan
lebih dari satu variabel. Variabel-variabel itu saling terkait (berkorelasi) satu sama lain.
Disinilah letak perbedaan antara multivariabel dan multivariat. Multivariat pasti
melibatkan multivariabel tetapi tidak sebaliknya. Multivariabel yang saling berkorelasilah
yang dikatakan multivariat.
Pendapat lain mengatakan multivariat merupakan objek kajian pada statistika yang
mempelajari perilaku dan hubungan antara dua atau lebih variabel. Dasar dari kajian ini
adalah analisis korelasi dan analisis regresi untuk dua variabel. Prinsip yang sama
kemudian dikembangkan untuk lebih dari dua variabel. Kompleksitas yang muncul akibat
penambahan variabel dan tipenya (nominal, ordinal, atau rasional), serta teknik
penyaringan informasi yang bisa diambil menjadi kajian pembahasannya.(Wikipedia)
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 5
Analisis Multivariat II
Dari kedua pendapat diatas, dan digabungkan dengan apa yang telah kami pelajari
maka kami simpulkan bahwa Analisis statistik multivariat merupakan metode statistik
yang memungkinkan kita melakukan penelitian terhadap lebih dari dua variable secara
bersamaan dengan banyak variable bebas dan suatu variable terikat. Dengan menggunakan
teknik analisis ini maka kita dapat menganalisis pengaruh beberapa variable terhadap
variable-variabel lainnya dalam waktu yang bersamaan. Contoh kita dapat menganalisis
pengaruh variable kualitas produk, harga dan saluran distribusi terhadap kepuasan
pelanggan. Contoh yang lain, misalnya pengaruh kecepatan layanan, keramahan petugas
dan kejelasan memberikan informasi terhadap kepuasan dan loyalitas pelanggan. Analisis
multivariat digunakan karena pada kenyataannnya masalah yang terjadi tidak dapat
diselesaikan dengan hanya menghubung-hubungkan dua variable atau melihat pengaruh
satu variable terhadap variable lainnya. Sebagaimana contoh di atas, variable kepuasan
pelanggan dipengaruhi tidak hanya oleh kualitas produk tetapi juga oleh harga dan saluran
distribusi produk tersebut.
Teknik analisis multivariat secara dasar diklasifikasi menjadi dua, yaitu analisis
dependensi dan analisis interdependensi. Analisis dependensi berfungsi untuk
menerangkan atau memprediski variable – variable tergantung dengan menggunakan dua
atau lebih variable bebas. Yang termasuk dalam klasifikasi ini ialah analisis regresi linear
berganda, analisis diskriminan, analisis varian multivariate (MANOVA), dan analisis
korelasi kanonik.
2.3 Analisis Cluster
2.3.1 Definisi Analisis Cluster
Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama
untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya.
Analisis cluster mengklasifikasi objek sehingga setiap objek yang paling dekat
kesamaannya dengan objek lain berada dalam cluster yang sama. Cluster-cluster
yang terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas
eksternal yang tinggi. Berbeda dengan teknik multivariat lainnya, analisis ini tidak
mengestimasi set vaiabel secara empiris sebaliknya menggunakan setvariabel yang
ditentukan oleh peneliti itu sendiri. Fokus dari analisis cluster adlah
membandingkan objek berdasarkan set variabel, hal inilah yang menyebabkan para
ahli mendefinisikan set variabel sebagai tahap kritis dalam analisis cluster. Set
variabel cluster adalah suatu set variabel yang merpresentasikan karakteristik yang
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 6
Analisis Multivariat II
dipakai objek-objek. Bedanya dengan analisis faktor adalah bahwa analisis cluster
terfokus pada pengelompokan objek sedangkan analisis faktor terfokus pada
kelompok variabel.
Solusi analisis cluster bersifat tidak unik, anggota cluster untuk tiap
penyelesaian/solusi tergantung pada beberapa elemen prosedur dan beberapa solusi
yang berbeda dapat diperoleh dengan mengubah satu elemen atau lebih. Solusi
cluster secara keseluruhan bergantung pada variabel-variaabel yang digunakan
sebagai dasar untuk menilai kesamaan. Penambahan atau pengurangan variabel-
variabel yang relevan dapat mempengaruhi substansi hasi analisisi cluster.
2.3.2 Cara Kerja Analisis Cluster
Secara garis besar ada tiga hal yang harus terjawab dalam proses kerja analisis
cluster, yaitu :
1. Bagaimana mengukur kesamaan ?
Ada tiga ukuran untuk mengukur kesamaaan antar objek, yaitu ukuran korelasi,
ukuran jarak, dan ukuran asosiasi.
2. Bagaimana membentuk cluster ?
Prosedur yang diterapkan harus dapat mengelompokkan objek-objek yang
memiliki kesamaan yang tinggi ke dalam sutau cluster yang sama.
3. Berapa banyak cluster/kelompok yang akan dibentuk ?
Pada prinsipnya jika jumlah cluster berkurang maka homogenitas alam cluster
secra otomatis akan menurun.
2.3.3 Proses Analisis Cluster
Sebagaimana teknik multivariat lain proses analisis cluster dapat dijelaskan
dalam enam tahap sebagai berikut :
Tahap Pertama : Tujuan Analisis Cluster
Tujuan utama analisis cluster adalah mempartisi suatu set objek menjadi dua
kelompok atau lebih berdasarkan kesamaan karakteristik khusus yang dimilikinya.
Dalam pembentukan kelompok/cluster dapat dicapai tiga tujuan, yaitu :
A. Deskripsi klasifikasi (taxonomy description)
Penerapan anallisis cluster secara tradisisonal bertujuan mengeksplorasi dan
membentuk suatu klasisfikasi/taksonomi secara empiris. Karena kemampuan
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 7
Analisis Multivariat II
partisinya analisis cluster dapat diterapkan secara luas. Meskipun secara empiris
merupakan teknik eksplorasi analisis cluster dapat pula digunakan untuk tujuan
konfirmasi.
a. Penyederhanaan Data
Penyederhanaan data merupakan bagian dari suatu taksonomi. Dengan struktur
yang terbatas observasi/objek dapat dikelompokkan untuk analisis selanjutnya.
b. Identifikasi Hubungan (Relationship Identification)
Hubungan antar objek diidentifikasi secara empiris. Struktur analisis cluster
yang sederhana dapat menggambarkan adanya hubungan atau kesamaan dan
perbedaan yang tidak dinyatakan sebelumnya.
B. Pemilihan pada Pengelompokan Variabel
Tujuan analisis cluster tidak dapat dipisahkan dengan pemilihan variabel yang
digunakan untuk menggolongkan objek ke dalam clucter-cluster. Cluster yang
terbentuk merefleksikan struktur yang melekat pada data seperti yang didefinisikan
oleh variabel-variabel. Pemilihan variabel harus sesuai dengan teori dan konsep
yang umum digunakan dan harus rasional. Rasionalitas ini didasarkan pada teori-
teori eksplisit atau penelitian sebelumnya. Variabel-variabel yang dipilih hanyalah
variabel yang dapat mencirikan objek yang akan dikelompokkan dan secara
spesifik harus sesuai dengan tujuan analisis cluster.
Tahap Kedua : Desain Penelitian dalam Analisis Cluster
Tiga hal penting dalam tahap ini adalah pendeteksian outlier, mengukur kesamaan,
dan standarisasi data.
A. Pendeteksian Outlier
Outlier adalah suatu objek yang sangat berbeda dengan objek lainnya. Outlier
dapat digambarkan sebagai observasi yang secara nyata kebiasaan, tidak mewakili
populasi umum, dan adanya undersampling dapat pula memunculkan outlier.
Outlier menyebabkan menyebabkan struktur yang tidak benar dan cluster yang
terbentuk menjadi tidak representatif.
B. Mengukur Kesamaan antar Objek
Konsep kesamaan adalah hal yang fundamental dalam analisis cluster. Kesamaan
antar objek merupakan ukuran korespondensi antar objek. Ada tiga metode yang
dapat diterapkan, yaitu ukuran korelasi, ukuran jarak, dan ukuran asosiasi.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 8
Analisis Multivariat II
a. Ukuran Korelasi
Ukuran ini dapat diterapkan pada data dengan skala metrik, namun jarang
digunakan karena titik bertnya pada nilai suatu pola tertentu, padahal tisik
berat analisis cluster adalah besarnya objek. Kesamaan antar objek dapat
dilihat dari koefisien korelasi antar pasangan objek yang diukur dengan
beberapa variabel.
b. Ukuran Jarak
Merupakan ukuran yang paling sering digunakan. Diterapkan untuk data
berskala metrik. Sebenarnya merupakan ukuran ketidakmiripan, dimana jarak
yang besar menunjukkan sedikit kesamaan sebaliknya jarak yang pendek/kesil
menunjukkan bahwa suatu objek makin mirip dengan objek lain. Bedanya
dengan ukuran korelasi adalah bnahwa ukuran jarak fokusnya pada besarnya
nilai. Cluster berdasarkan ukuran korelasi bisa saja tidak memiliki kesamaan
nilai tapi memiliki kesamaan pola, sedangkan cluster dberdasrkan ukuran jarak
lebih memiliki kesamaan nilai meskipun polanya berbeda.
Ada beberapa tipe ukuran jarak antara lain jarak Euklidian, jarak city-Box, dan
jarak Mahalanobis. Ukuran yang paling sering digunakan adalah jarak
Euklidian. Jarak Euklidian adalah besarnya jarak suatu garis lurus yang
menghubungkan antar objek.
c. Ukuran Asosiasi
Ukuran asosiasi dipakai untuk mengukur data berskala nonmetrik (nominal
atau ordinal).
C. Standarisasi Data
a. Standarisasi Variabel
Bentuk paling umum dalam standarisasi variabel adalah konversi setiap variabel
terhadap skor atandar ( dikenal dengan Z score) dengan melakukan substraksi
nilai tengan dan membaginyadengan standar deviasi tiap variabel.
b. Standarisasi Data
Berbeda dengan standarisasi variabel, standarisasi ndata dilakukan terhadap
observasi/objek yang akan dikelompokkan.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 9
Analisis Multivariat II
Tahap Ketiga : Asumsi-asumsi dalam Analisis Cluster
Seperti hal teknik analisis lain,analisis cluster juga menetapkan adanya suatu
asumsi. Ada dua asumsi dalam analisis cluster, yaitu :
A. Kecukupan Sampel untuk merepresentasikan/mewakili Populasi
Biasanya suatu penelitian dilakukan terhadap populasi diwakili oleh
sekelompok sampel. Sampel yang digunakan dalam analisis ckuster harus
dapat mewakili populasi yang ingin dijelaskan, karena analisis ini baik jika
sampel representatif. Jumlah sampel yang diambil tergantung penelitinya,
seorang peneliti harus yakin bahwa sampil yang diambil representatif terhadap
populasi.
B Pengaruh Multukolinieritas
Ada atau tidaknya multikolinieritas antar variabel sangat diperhatikan
dalam analisis cluster karena hal itu berpengaruh, sehingga variabel-variabel
yang bersifat multikolinieritas secara eksplisit dipertimbangkan dengan lebih
seksama.
Multikolinieritas adalah adanya korelasi antara variabel bebas dengan
variabel bebas lainnya. Jika sebuah model terdapat multikolinieritas apabila R2
nya tinggi namun hanya sedikit atau bahkan tidak ada variabel bebasnya yang
signifikasn pada pengujian t-statistik.
Multikolinieritas juga dapat dilihat melalui matriks korelasi antar
variabelnya. Menurut gujarati, multikolinieritas terjadi jika korelasi antar
variabelnya lebih besar dari 0,8.
Tahap Keempat : Proses Mendapatkan Cluster dan Menilai kelayakan secara
keseluruhan
Ada dua proses penting yaitu algoritma cluster dalam pembentukan cluster dan
menentukan jumlah cluster yang akan dibentuk. Keduanya mempunyai implikasi
substansial tidak hanya pada hasil yang diperoleh tetapi juga pada interpretasi yang
akan dilakukan terhadap hasil tersebut.
Algoritma Cluster
Algoritma cluster harus dapat memaksimalkan perbedaan relatif cluster
terhadap variasi dalam cluster. Dua metode paling umum dalam algoritma cluster
adalahmetode hirarkhi dan metode non hirarkhi. Penentuan metode mana yag akan
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 10
Analisis Multivariat II
dipakai tergantung kepada peneliti dan konteks penelitian dengan tidak
mengabaikan substansi, teori dan konsep yang berlaku. Keduanya memiliki
kelebihan sendiri-sendiri. Keuntungan metode hirarkhi adalah cepat dalam proses
pengolahan sehingga menghemat waktu, namun kelemahannya metode ini dapat
menimbulkan kesalahan. Selain itu tidak baik diterapkan untuk menganalisis
sampel dengan ukuran besar. Metode Non Hirarkhi memiliki keuntungan lebih
daripada metode hirarkhi. Hasilnya memiliki sedikit kelemahan pada data outlier,
ukuran jarak yang digunakan, dan termasuk variabel tak relevan atau variabel yang
tidak tepat. Keuntungannya hanya dengan menggunakan titik bakal nonrandom,
penggunaan metode non hirarkhi untuk titik bakal random secara nyata lebih
buruk dari pada metode hirarkhi.
Alternatif lain adalah dengan mengkombinasikan kedua metode ini.
Pertama gunakan metode hirarkhi kemudian dilanjutkan dengan metode non
hirarkhi.
A. Metode Hirarkhi
Tipe dasar dalam metode ni adalah aglomerasi dan pemecahan. Dalam
metode aglomerasi tiap observasi pada mulanya dianggap sebagai cluster
tersendiri sehingga terdapat cluster sebyak jumlah observasi. Kemudian dua
cluster yang terdekat kesamaannya digabung menjadi suatu cluster babru,
sehingga jumlah cluster berkurang satu pada tiap tahap. Sebaliknya pada
metode pemecahan dimulai dari satu cluster besar yang mengandung seluruh
observasi, selanjutnya observasi-observasi yang paling tidak sama dipisah dan
dibentuk cluster-cluster yang lebih kecil. Proses ini dilakukan hingga tiap
observasi menjadi cluster sendiri-sendiri.
Hal penting dalam metode hirarkhi adalah bahwa hasil pada tahap sebelumnya
selalu bersarang di dalam hasil pada tahap berikutnya, membentuk sebuah
pohon.
Ada lima metode aglomerasi dalam pembentukan cluster, yatiu :
a. Pautan Tunggal (Single Linkage)
Metode ini didasarkan pada jarak minimum. Dimulai dengan dua
objek yang dipisahkan dengan jarak paling pendek maka keduanya akan
ditempatkan pada cluster pertama, dan seterusnya. Metode ini dikenal
pula dengan nama pendekatan tetangga terdekat.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 11
Analisis Multivariat II
b. Pautan Lengkap (Complete Linkage)
Disebut juga pendekatan tetangga terjauh. Dasarnya adalah jarak
maksimum. Dalam metode ini seluruh objek dalam suatu cluster
dikaitkan satu sama lain pada suatu jarak maksimuma atau dengan
kesamaan minimum.
c. Pautan Rata-rata (Average Linkage)
Dasarnya adalah jarak rata-rata antar observasi. pengelompokan
dimulai dari tengan atau pasangan observasi dengan jarak paling
mendekati jarak rata-rata.
d. Metode Ward (Ward’s Method)
Dalam metode ini jarak antara dua cluster adalah jumlah kuadrat
antara dua cluster untuk seluruh variabel. Metode ini cenderung
digunakan untuk mengkombinasi cluster-cluster dengan jumlah kecil.
e. Metode Centroid
Jarak antara dua cluster adalah jarak antar centroid cluster
tersebut. Centroid cluster adalah nilai tengah observasi pada variabel
dalam suatu set variabel cluster. Keuntungannya adalah outlier hanya
sedikit berpengaruh jika dibandingkan dengan metode lain.
B. Metode Non Hirarkhi
Masalah utama dalam metoda non hirarkhi adalah bagaimana
memilih bakal cluster. Harus disadari pengaruh pemilihan bakal cluster
terhadap hasil akhir analisis cluster. Bakal cluster pertama adalah observasi
pertama dalam set data tanpa missing value. Bakal kedua adalah observasi
lengkap berikutnya (tanpa missing data) yang dipisahkan dari bakal pertama
oleh jarak minimum khusus.
Ada tiga prosedur dalam metode non hirarkhi, yaitu :
a. Sequential threshold
Metode ini dimulai dengan memilih bakal cluster dan menyertakan
seluruh objek dalam jarak tertentu. Jika seluruh objek dalam jarak
tersebut disertakan, bakal cluster kedua terpilih, kemudian proses terus
berlangsung seperti sebelumnya.
b. Parallel Threshold
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 12
Analisis Multivariat II
Metode ini memilih beberapa bakal cluster secara simultan pada
permulaannya dan menandai objek-objek dengan jarak permulaan ke
bakal terdekat.
c. Optimalisasi
Metode ketiga ini mirip dengan kedua metode sebelumnya kecuali pada
penandaan ulang terhadap objek-objek.
Hal penting lain dalam tahap keempat adalah menentukan jumlah cluster yang akan
dibentuk.Sebenarnya tidak ada standar,prosedur pemilihan tujuan eksis. Karena
tidak ada kriteria statistik internal digunakan untuk inferensia, seperti tes
signifikansipada teknik multivariat lainnya, para peneliti telah mengembangkan
beberapa kriteria dan petunjuk sebagai pendekatan terhadap permasalahan ini
dengan memperhatikan substansi dan aspek konseptual.
Tahap Kelima : Interpretasi terhadap Cluster
Tahap interpretasi meliputi pengujian tiap cluster dalam term untuk menamai
dan menandai dengan suatu label yang secara akurat dapat menjelaskan kealamian
cluster. Proes ini dimulai dengan suatu ukuran yang sering digunakan yaitu
centroid cluster.
Membuat profil dan interpretasi cluster tidak hanya tidak hanya untuk memoeroleh
suatu gambaran saja melainkan pertama, menyediakan suatu rata-rata untuk
menilai korespondensi pada cluster yang terbentuk, kedua, profil cluster
memberikan araha bagi penilainan terhadap signifikansi praktis.
Tahap Keenam: Proses Validasi dan Pembuatan Profil (PROFILING) Cluster
A. Proses validasi solusi cluster
Proses validasi bertujuan menjamin bahwa solusi yang dihasilkan dari
analisis cluster dapat mewakili populasi dan dapat digeneralisasi untuk objek
lain. Pendekatan ini membandingkan solusi cluster dan menilai korespondensi
hasil. Terkadang tidak dapat dipraktekkan karena adanya kendala waktu dan
biaya atau ketidaktersediaan ibjek untuk analisis cluster ganda.
B. Pembuatan Profil ( PROFILING)Solusi Cluster
Tahap ini menggambarkan karakteristik tiap cluster untuk menjelaskan
cluster-cluster tersebut dapat dapat berbeda pada dimensi yang relevan. Titik
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 13
Analisis Multivariat II
beratnta pada karakteristik yang secara signifikan berbeda antar clustre dan
memprediksi anggota dalam suatu cluster khusus.
Secara keseluruhan proses analisis cluster berakhir setelah keenam tahap
ini dilalui. Hasil analisis cluster dapat digunakan untuk berbagai kepentingan
sesuai dengan materi yang dianalisis.
2.4 Penduduk Lanjut Usia (Lansia)
2.4.1 Definisi Lansia
Menua atau menjadi tua adalah suatu keadaaan yang terjadi didalam
kehidupan manusia. Proses menua merupakan proses sepanjang hidup, tidak
hanya dimulai dari suatu waktu tertentu, tetapi dimulai sejak permulaan
kehidupan. Menjadi tua merupakan proses alamiah, yang berarti seseorang
telah melalui tiga tahap kehidupannya, yaitu anak, dewasa dan tua. Tiga tahap
ini berbeda, baik secara biologis maupun psikologis. Memasuki usia tua
berarti mengalami kemunduran, misalnya kemunduran fisik yang ditandai dengan
kulit yang mengendur, rambut memutih, gigi mulai ompong, pendengaran kurang
jelas, pengelihatan semakin memburuk, gerakan lambat dan figur tubuh yang tidak
proporsional (Nugroho, 2006).
WHO dan Undang-Undang Nomor 13 Tahun 1998 tentang kesejahteraan
lanjut usia pada Bab 1 Pasal 1 Ayat 2 menyebutkan bahwa usia 60 tahun
adalah usia permulaan tua. Menua bukanlah suatu penyakit, tetapi
merupakan proses yang berangsur-angsur mengakibatkan perubahan
kumulatif, merupakan proses menurunnya daya tahan tubuh dalam menghadapi
rangsangan dari dalam dan luar tubuh.
2.4.2 Fisiologi Lansia
Proses penuaan adalah normal, berlangsung secara terus
menerus secara alamiah. Dimulai sejak manusia lahir bahkan sebelumnya dan
umunya dialami seluruh makhluk hidup. Menua merupakan proses penurunan
fungsi struktural tubuh yang diikuti penurunan daya tahan tubuh. Setiap orang
akan mengalami masa tua, akan tetapi penuaan pada tiap seseorang berbeda-
beda tergantung pada berbagai faktor yang mempengaruhinya. Faktor-faktor
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 14
Analisis Multivariat II
tersebut dapat berupa faktor herediter, nutrisi, stress, status kesehatan dan lain-
lain (Stanley, 2006)
2.4.3 Batasan Lansia
WHO (1999) menggolongkan lanjut usia berdasarkan usia
kronologis/biologis menjadi 4 kelompok yaitu usia pertengahan
(middle age) antara usia 45 sampai 59, lanjut usia (elderly) berusia antara
60 dan 74 tahun, lanjut usia tua (old) 75 – 90 tahun, dan usia sangat tua (Very
old) di atas 90 tahun. Sedangkan Nugroho (2000) menyimpulkan
pembagian umur berdasarkan pendapat beberapa ahli, bahwa yang disebut
lanjut usia adalah orang yang telah berumur 65 tahun ke atas.
Menurut Prof. Dr. Koesmanto Setyonegoro, lanjut usia dikelompokkan
menjadi usia dewasa muda (elderly adulthood), 18 atau 29 – 25 tahun,
usia dewasa penuh (middle years) atau maturitas,25 – 60 tahun atau 65 tahun,
lanjut usia (geriatric age) lebih dari 65 tahun atau 70 tahun yang dibagi lagi
dengan 70 – 75 tahun (young old), 75 – 80 tahun (old), lebih dari 80 (very
old).
Menurut Undang-Undang No. 4 Tahun 1965 Pasal 1 seseorang dapat
dinyatakan sebagai seorang jompo atau lanjut usia setelah bersangkutan
mencapai umur 55 tahun, tidak mempunyai atau tidak berdaya mencari nafkah
sendiri untuk keperluan hidupnya sehari-hari dan menerima nafkah dari orang
lain. Undang-Undang No. 13 Tahun1998 tentang kesejahteraan lansia bahwa
lansia adalah seseorang yang mencapai usia 60 tahun keatas.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 15
Analisis Multivariat II
BAB III
METODOLOGI PENELITIAN
3.1 Populasi
Populasi pada penelitian ini yaitu semua lansia yang terdapat pada masing-masing provinsi
di Indonesia.
3.2 Sumber Data
Data yang kami gunakan pada penelitian ini bersumber dari BPS pada laporan Sosial
Indonesia dari Supas dan Sakernas 1995.
3.3 Variabel Penelitian
Variabel-variabel yang digunakan dalam penelitian ini adalah sebagai berikut:
X1 : Persentase lansia yang tidak pernah sekolah/tamat SD di masing-masing provinsi
X2 : Persentase lansia yang makan makanan pokok kurang dari 21 kali dalam seminggu di
masing-masing provinsi
X3 : Persentase lansia yang makan lauk pauk berprotein tinggi kurang dari 4 kali dalam
seminggu di masing-masing provinsi
X4 : Persentase lansia yang memiliki pakaian kurang dari 4 pasang di masing-masing
provinsi
X5 : Persentase lansia yang tidak mempunyai tempat tetap untuk tidur di masing-masing
provinsi
X6 : Persentase lansia yang bila sakit tidak siabati di masing-masing provinsi
3.4 Langkah-Langkah Penyelesaian Masalah
Analisis data dibutuhkan untuk menjawab permasalahan dalam penelitian ini.
Langkah-langkah yang dilakukan adalah sebagai berikut:
1. Standarisasi Data
2. Uji asumsi : seberapa besar sampel mewakili populasi (representativeness) dan
ada tidaknya multicollinearity.
3. Uji K-Means Cluster
a. Tentukan jumlah K cluster
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 16
Analisis Multivariat II
b. Inisialisasi K pusat cluster, dapat diperoleh secara acak.
c. Cari data yang lebih dekat dengan pusat cluster dan tandai titik data tersebut
di pusat cluster yang terdekat dan posisi pusat cluster dihitung kembali
dengan rata-rata anggota dari setiap cluster.
d. Cek semua data sekali lagi dan taruh setiap data yang terdekat dengan pusat
cluster (pusat cluster tidak dihitung lagi). Jika anggota dari tiap pusat cluster
tidak berubah, berhenti dan jika masih berubah kembali ke langkah c.
4. Interpretasi output
5. Kesimpulan
Pada kasus ini, langkah-langkah analisis di atas akan dilakukan dengan bantuan
software SPSS. Selengkapnya akan disajikan di bab IV.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 17
Analisis Multivariat II
BAB IV
HASIL DAN PEMBAHASAN
4.1 Data
Berikut ini adalah data yang akan diolah menjadi cluster-cluster.
PROVINSI X1 X2 X3 X4 X5 X6SUMATERA UTARA 63.13 38.67 35.7 16.79 2.48 3.33SUMATERA BARAT 57.48 48.23 17.48 20.6 0.9 4.05
RIAU 67.72 50.59 18.43 9.95 1.58 3.34JAMBI 75.99 44.1 29.77 27.94 1.76 2.55
SUMATERA SELATAN 65.69 58.39 27.9 24.67 5.57 5.18BENGKULU 71.37 52.02 35.6 30.64 2.17 4.29LAMPUNG 80.64 35.59 41.56 34.15 1.48 2.78DKI JAKARTA 37.8 56.38 12.28 87.24 1.45 6.78JAWA BARAT 70.84 70.48 31.37 17.17 1.82 5.32
JAWA TENGAH 79.3 35.99 16.25 19.36 1.89 3.97D.I. YOGYAKARTA 76.05 46.27 11.35 17.45 1.17 4.72JAWA TIMUR 82.76 30.86 15.13 30.77 2.01 3.55
BALI 77.96 42.28 6.28 25.74 0.34 4.87NUSA TENGGARA BARAT 86.92 33.09 23.48 48.28 3.2 4.64NUSA TENGGARA TIMUR 87.36 56.75 58.67 49.77 1.42 9.31
KALIMANTAN BARAT 83.48 54.34 38.6 29.46 3.87 7.51KALIMANTAN TIMUR 60.37 50.29 18.78 28.13 6.69 2.68
KALIMANTAN SELATAN 76.93 38.72 16.65 29.37 2.77 7.07KALIMANTAN TENGAH 73.43 52.45 18.18 12.72 1.11 1.01
SULAWESI UTARA 51.3 58.14 25.58 11.08 1.84 2.89SULAWESI TENGAH 66.01 54.47 16.29 32.81 2.47 8.66SULAWESI SELATAN 77.62 58.74 10.93 24.03 3.7 6.89
SULAWESI TENGGARA 74.65 72.91 3.19 17.78 1.07 8.78
Sumber : BPS pada laporan Sosial Indonesia dari Supas dan Sakernas 1995.
4.2 Asumsi Analisis Cluster
4.2.1 Sample Representativ
Dalam kasus ini, yang digunakan adalah populasi. Sehingga dapat dikatakan
bahwa sample representatif.
4.2.2 Multikolinieritas
Untuk melihat ada atau tidaknya multikolinieritas antar variabel, digunakan
korelasi antar variabel. Berikut in adalah korelasi antar variabel menggunakan
software SPSS.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 18
Analisis Multivariat II
Correlations
x1 x2 x3 x4 x5 x6x1 Pearson Correlation 1 -,401 ,192 -,138 -,207 -,169
Sig. (2-tailed) ,052 ,368 ,520 ,332 ,430N 24 24 24 24 24 24
x2 Pearson Correlation -,401 1 ,023 -,126 ,222 ,538(**)Sig. (2-tailed) ,052 ,915 ,557 ,296 ,007N 24 24 24 24 24 24
x3 Pearson Correlation ,192 ,023 1 ,116 ,156 ,106Sig. (2-tailed) ,368 ,915 ,589 ,466 ,622N 24 24 24 24 24 24
x4 Pearson Correlation -,138 -,126 ,116 1 -,048 ,124Sig. (2-tailed) ,520 ,557 ,589 ,823 ,565N 24 24 24 24 24 24
x5 Pearson Correlation -,207 ,222 ,156 -,048 1 ,409(*)Sig. (2-tailed) ,332 ,296 ,466 ,823 ,047N 24 24 24 24 24 24
x6 Pearson Correlation -,169 ,538(**) ,106 ,124 ,409(*) 1
Sig. (2-tailed) ,430 ,007 ,622 ,565 ,047N 24 24 24 24 24 24
** Correlation is significant at the 0.01 level (2-tailed).* Correlation is significant at the 0.05 level (2-tailed).
Menurut gujarati, multikolinieritas terjadi jika korelasi antar variabelnya lebih
besar dari 0,8. Dari tabel diatas, dapat dilihat bahwa nilai korelasi di bawah 0.8,
artinya tidak ada multikolinieritas.
Kedua asumsi analisis cluster telah dipenuhi, artinya untuk pengujian selanjutnya dapat
digunakan analisis Cluster. Untuk pengujian analisis Cluster ini, digunakan software SPSS
yang bertujuan untuk mempermudah melakukan analisis.
4.3 Analisis Cluster
Analisis Cluster digunakan untuk mengelompokkan objek-objek yang memiliki
kesamaan karakteristik. Dalam kasus ini, provinsi di Indonesia akan dikelompokkan
berdasarkan 6 kriteria keterlantaran lansia. Dalam kasus ini, akan digunakan analisis cluster
non-hierarki. Berikut ini adalah langkah-langkah untuk analisis cluster dalam software
SPSS.
Setelah data distandardisasi, proses dilanjutkan dengan memilih metode pembentukan
klaster, yakni metode Non-Hierarchical Cluster
LANGKAH
- Analyze Classify K-Means Cluster
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 19
Analisis Multivariat II
Pengisian:
a. Variables. Sesuai kasus, masukkan semua variable dengan awalan z, yakni zX1, zX2,
zX3, zX4, zX5, dan zX6.
b. Label Cases By, masukkan variabel provinsi
c. Number of cluster atau jumlah cluster yang akan dibentuk adalah 2.
d. Kemudian klik mouse pada kotak saves
Kotak dialog saves memungkinkan hasil cluster disimpan dalam bentukvariabel baru
di SPSS Data Editor. Hal ini berguna untuk proses profiling cluster, yang akan
dilakukan pada tahapan akhir analisis cluster.
Untuk itu, aktifkan kotak cluster membership dan distance from cluster center,
kemudian tekan tombol continue untuk kembali ke menu utama.
e. Klik mouse pada kotak Options
Kotak dialog Options berisi berbagai pilihan (option) untuk proses analisis cluster
yang bukan merupakan proses inti clustering. Ada dua option, yakni statistic yang
berhubungan dengan hasil cluster, dan perlakuan terhadap data yang missing (tidak
lengkap).
Pengisian options:
• Untuk Statistics, biarkan kotak initial cluster center tetap aktif, dan aktifkan kotak
Anova Table.
• Untuk Missing Values, karena semua data lengkap terisi, abaikan pilihan tersebut.
f. Lalu tekan tombol Continue untuk kembali ke menu utama.
Dari tampilan menu utama cluster, abaikan juga bagian yang lain, dan tekan OK untuk
proses data.
OUTPUT
Dari proses clustering, karena pengaktifan pilihan cluster membership, maka ada
dua output yang dihasilkan:
a. Output berupa tambahan dua variabel, yakni variabel qcl_1, yang berisis nomor
cluster untuk setiap kasus, dan variabel qcl_2 yang berisi jarak antara kasus
tertentu dengan pusat cluster (cluster center)
Variabel QCL_1 dan QCL_2 akan digunakan untuk pembuatan tabulasi silang
(crosstab) dan grafik yang relevan.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 20
Analisis Multivariat II
Provinsi QCL_1 QCL_2SUMATERA UTARA 1 1.59339SUMATERA BARAT 1 1.35413
RIAU 1 1.30903JAMBI 1 0.87971
SUMATERA SELATAN 2 1.46873BENGKULU 1 1.32573LAMPUNG 1 1.99123DKI JAKARTA 1 4.76754JAWA BARAT 2 1.74154
JAWA TENGAH 1 1.21852D.I. YOGYAKARTA 1 1.21046JAWA TIMUR 1 1.62329
BALI 1 1.61146NUSA TENGGARA BARAT 1 2.24267NUSA TENGGARA TIMUR 2 3.50827
KALIMANTAN BARAT 2 1.53812KALIMANTAN TIMUR 2 2.7096
KALIMANTAN SELATAN 1 1.32904KALIMANTAN TENGAH 1 1.53975
SULAWESI UTARA 1 2.2856SULAWESI TENGAH 2 1.31682SULAWESI SELATAN 2 1.3847
SULAWESI TENGGARA 2 2.67673
Hasil Output akan ditampilkan satu per satu dengan dilengkapi analisis pada
pembahasan berikut ini.
ANALISIS OUTPUT CLUSTER
Proses awal clustering
Quick Cluster
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 21
Analisis Multivariat II
Output ini adalah tampilan pertama (initial) proses clustering data sebelum
dilakukan iterasi. Karena nanti akan dihasilkan proses clustering sesudah iterasi yang
justru adalah hasil akhir cluster, maka output ini tidak dianalisis.
PROSES ITERASI
Tampilan ini adalah proses iterasi yang mencoba mengubah-ubah cluster yang
ada sebelumnya (initial) sehingga menjadi lebih tepat dalam mengelompokkan 24
kasus tersebut. Setelah terjadi tiga tahapan iterasi (proses pengulangan dengan
ketepatan lebih tinggi dari sebelumnya), didapat hasil final cluster berikut ini.
Hasil akhir proses clustering
Output ini adalah akhir dari proses clustering, dengan analisis:
ARTI ANGKA:
Angka di atas terkait dengan proses standardisasi data sebelumnya, yang mengacu pada
angka z, dengan ketentuan:
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 22
Analisis Multivariat II
- Angka negative berarti data di bawah rata-rata total
- Angka positif berarti data di atas rata-rata total
Sebagai contoh, angka -0,01048 pada variabel Z(X1) menyatakan rata-rata banyaknya
lansia yang tidak pernah sekolah/tamat SD pada cluster 1 adalah:
Dengan :
X= rata-rata sampel (dalam hal ini rata-rata variabel pada cluster tertentu)
= rata-rata populasi
= standar deviasi
Z = nilai standardisasi yang didapat pada SPSS
Jika diterapkan pada variabel tidak pernah sekolah/tamat SD:
Rata-rata banyaknya lansia yang tidak pernah sekolah/tamat SD pada provinsi-
provinsi di Cluster 1:
(rata-rata banyaknya lansia tidak pernah sekolah/tamat SD pada seluruh
provinsi) + (-0,01048 x standar deviasi rata-rata banyaknya lansia tidak pernah
sekolah/tamat SD pada seluruh provinsi).
Sedangkan angka 0,01746 pada variabel Z(X1) menyatakan rata-rata
banyaknya lansia yang tidak pernah sekolah/tamat SD pada cluster 2, adalah:
(rata-rata banyaknya lansia yang tidak pernah sekolah/tamat SD pada seluruh
provinsi) +( 0,01746 x standar deviasi rata-rata banyaknya lansia yang tidak
pernah sekolah/tamat SD pada seluruh provinsi).
Dengan demikian seterusnya untuk tafsiran data yang lain, tentunya
dengan mengacu rata-rata dan standar deviasi variabel yang bersangkutan,
seperti angka untuk variabel Z(X2) dikaitkan dengan rata-rata banyaknya lansia
yang makan makanan pokok < 21X dalam seminggu dan standar deviasinya.
Contoh Tafsiran Angka Pada Cluster:
Dari proses cluster, terjadi 2 cluster atau 2 kelompok provinsi yang masing-masing
kelompok tentunya mempunyai ciri yang berbeda satu dengan yang lain. Perbedaan
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 23
Analisis Multivariat II
bisa ditelusuri per variabel, dengan dasar interpretasi berdasarkan tanda + dan – serta
besaran angka itu sendiri.
Sebelum menafsir isi setiap cluster, terlebih dahulu diperlihatkan contoh penafsiran
sebuah variabel, yakni variabel Z(X1) atau variable tidak pernah sekolah/tamat SD .
Karena pada cluster 1, angka adalah negatif, sedangkan di cluster 2 angka positif, maka
bisa dikatakan:
Rata-rata banyaknya lansia yang tidak pernah sekolah/tamat SD pada cluster 1
lebih rendah dibandingkan rata-rata banyaknya lansia yang tidak pernah sekolah/tamat
SD keseluruhan.
Untuk menghitung rata-rata banyaknya lansia yang tidak pernah sekolah/tamat SD
pada setiap cluster, bisa dilakukan dengan rumus di atas dan berdasar pada output
Descriptives Statistics, di mana terlihat:
- Mean (Rata-rata) banyaknya lansia yang tidak pernah sekolah/tamat SD pada
seluruh provinsi adalah 70,7133
- Standar Deviasi banyaknya lansia yang tidak pernah sekolah/tamat SD pada
seluruh provinsi adalah 12,217
Dengan demikian:
- Rata-rata banyaknya lansia yang tidak pernah sekolah/tamat SD pada cluster 1 =
70,7133+(-0,01048 x 12,217) = 70,585
- Rata-rata banyaknya lansia yang tidak pernah sekolah/tamat SD pada cluster 2 =
70,7133+(0,01746 x 12,217) = 70,926
Demikian seterusnya bisa dilanjutkan dengan variabel Z(X2) untuk mengetahui
rata-rata banyaknya lansia yang memakan makan-makanan pokok < 21X dalam seminggu
di setiap cluster, kemudian rata-rata banyaknya lansia yang makan lauk pauk berprotein
tinggi<4X dalam seminggu di setiap cluster, dan variabel yang lainnya.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 24
Analisis Multivariat II
Walaupun bisa diuraikan secara rinci satu demi satu variabel, namun untuk
penafsiran umum, sudah memadai jika dikatakan ‘lebih dari rata-rata’ atau ‘kurang dari
rata-rata’, seperti yang akan dilakukan pada bagian berikut untuk menggambarkan isi
setiap cluster yang terbentuk.
4.3.1 Karakteristik Setiap Cluster
a. Cluster 1
Cluster 1 berisi provinsi yang memiliki karakteristik sebagai berikut:
Banyaknya lansia yang tidak pernah sekolah/tamat SD lebih sedikit
dibandingkan dengan provinsi lain.
Banyaknya lansia yang memakan makanan pokok <21 kali dalam seminggu
lebih sedikit dibandingkan dengan provinsi lain.
Banyaknya lansia yang makan lauk-pauk berprotein tinggi <4 kali dalam
seminggu lebih sedikit dibandingkan dengan provinsi lain.
Banyaknya lansia yang memiliki pakaian <4 stel lebih banyak
dibandingkan dengan provinsi lain.
Banyaknya lansia yang tidak mempunyai tempat tetap untuk tidur lebih
sedikit dibandingkan dengan provinsi lain.
Banyaknya lansia yang bila sakit tidak lebih sedikit dibandingkan dengan
provinsi lain.
b. Cluster 2
Cluster 2 berisi provinsi yang memiliki karakteristik sebagai berikut:
Banyaknya lansia yang tidak pernah sekolah/tamat SD lebih banyak
dibandingkan dengan provinsi lain.
Banyaknya lansia yang memakan makanan pokok <21 kali dalam seminggu
lebih banyak dibandingkan dengan provinsi lain.
Banyaknya lansia yang makan lauk-pauk berprotein tinggi <4 kali dalam
seminggu lebih banyak dibandingkan dengan provinsi lain.
Banyaknya lansia yang memiliki pakaian <4 stel lebih sedikit dibandingkan
dengan provinsi lain.
Banyaknya lansia yang tidak mempunyai tempat tetap untuk tidur lebih
banyak dibandingkan dengan provinsi lain.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 25
Analisis Multivariat II
Banyaknya lansia yang bila sakit tidak lebih banyak dibandingkan dengan
provinsi lain.
Dari ciri-ciri kedua cluster di atas, cluster 1 berisikan provinsi-provinsi yang
lansianya tidak terlantar sedangkan cluster 2 berisikan provinsi-provinsi yang lansianya
terlantar, yang akan disajikan dalam table berikut:
Cluster 1 Cluster 2Lansia Tidak Terlantar Lansia Terlantar
Sumatera Utara Lampung Bali Sumatera Selatan Sulawesi TengahSumatera Barat DKI Jakarta Nusa Tenggara Barat Jawa Barat Sulawesi Selatan
Riau Jawa Tengah Kalimantan Selatan Nusa Tenggara Timur Sulawesi TenggaraJambi D.I. Yogyakarta Kalimantan Tengah Kalimantan Barat Irian Jaya
Bengkulu Jawa Timur Sulawesi Utara Kalimantan Timur
Namun sekali lagi, penamaan cluster maupun penarikan kesimpulan dari isi
cluster pada dasarnya bersifat subyektif dan tergantung tujuan penelitian.
4.3.2 Melihat Perbedaan Variabel Pada Cluster Yang Terbentuk
Setelah terbentuk 2 cluster, langkah berikut adalah melihat apakah variabel-
variabel yang telah membentuk cluster tersebut mempunyai perbedaan pada tiap
cluster. Hal itu dilakukan dengan melihat outpu ANOVA berikut.
Kolom cluster menunjukkan besaran between cluster mean, sedangkan kolom error
menunjukkan besaran within cluster mean, sehingga kolom F adalah
Interpretasi angka F dan signifikan:
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 26
Analisis Multivariat II
Pada prinsipnya, semakin besar angka F suatu variabel, dan angka signifikannya adalah
di bawah 0,05 maka semakin besar pula perbedaan variabel tersebut pada kedua cluster
yang terbentuk.
Interpretasi Output :
a. Pada variable X1 atau variable tidak pernah sekolah/tamat SD nilai F adalah 0,004
dengan nilai signifikansi adalah 0,949, yang berarti signifikansi adalah tidak nyata. Hal
ini berarti banyaknya lansia yang tidak pernah sekolah/tamat SD tidak berbeda antara
kedua cluster yang terbentuk. Atau bisa juga dikatakan, banyaknya lansia yang tidak
pernah sekolah/tamat SD di kedua cluster yang terbentuk adalah sama.
b. Pada variable X2 atau variable makan makanan poko <21 kali dalam seminggu nilai F
adalah 21,224 dengan nilai signifikansi adalah 0,000, yang berarti signifikansi adalah
nyata. Hal ini berarti banyaknya lansia yang makan makanan pokok <21 kali dalam
seminggu sangat membedakan karakteristik kedua cluster. Atau bisa juga dikatakan,
banyaknya lansia yang makan makanan pokok <21 kali dalam seminggu di kedua
cluster yang terbentuk adalah sangat berbeda.
c. Pada variable X3 atau variable makan lauk-pauk berprotein tinggi <4 kali dalam
seminggu nilai F adalah 0,742 dengan nilai signifikansi adalah 0,398, yang berarti
signifikansi adalah tidak nyata. Hal ini berarti banyaknya lansia yang makan lauk-pauk
berprotein tinggi <4 kali dalam seminggu tidak berbeda antara kedua cluster yang
terbentuk. Atau bisa juga dikatakan, banyaknya lansia yang makan lauk-pauk
berprotein tinggi <4X dalam seminggu di kedua cluster yang terbentuk adalah sama.
d. Pada variable X4 atau variable memiliki pakaian <4 stel nilai F adalah 0,04 dengan nilai
signifikansi adalah 0,843, yang berarti signifikansi adalah tidak nyata. Hal ini berarti
banyaknya lansia yang memiliki pakaian <4 stel tidak berbeda antara kedua cluster
yang terbentuk. Atau bisa juga dikatakan, banyaknya lansia yang memiliki pakaian <4
stel di kedua cluster yang terbentuk adalah sama.
e. Pada variable X5 atau variable tidak mempunyai tempat tetap untuk tidur nilai F adalah
10,279 dengan nilai signifikansi adalah 0,004, yang berarti signifikansi adalah nyata.
Hal ini berarti banyaknya lansia yang tidak mempunyai tempat tetap untuk tidur sangat
membedakan karakteristik kedua cluster. Atau bisa juga dikatakan, banyaknya lansia
yang tidak mempunyai tempat tetap untuk tidur di kedua cluster yang terbentuk adalah
sangat berbeda.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 27
Analisis Multivariat II
f. Pada variable X6 atau variable bila sakit tidak diobati nilai F adalah 10,801 dengan nilai
signifikansi adalah 0,003, yang berarti signifikansi adalah nyata. Hal ini berarti
banyaknya lansia yang bila sakit tidak diobati sangat membedakan karakteristik kedua
cluster. Atau bisa juga dikatakan, banyaknya lansia yang bila sakit tidak diobati di
kedua cluster yang terbentuk adalah sangat berbeda.
Perhatikan bahwa semakin besar angka F semakin menunjukkan perbedaan yang
tajam antar-cluster, sebaliknya makin kecil angka F makin kecil perbedaan tersebut, hingga
sampai angka tertentu, perbedaan itu bahkan sudah tidak ada lagi (angka Sig sudah di atas
0,05). Namun demikian, di sini tidak berarti variabel yang tidak signifikan akan
dikeluarkan. Analisis hanya ingin mengetahui mana variabel yang signifikan perbedaannya,
dan mana yang tidak.
4.3.3 Jumlah Anggota Di Setiap Cluster
Dari table di atas terlihat bahwa provinsi terbanyak ada di cluster 1, sedangkan
provinsi paling sedikit ada di cluster 2, dengan tidak ada variabel yang hilang
(missing). Dengan demikian, semua kasus, sejumlah 24 provinsi, lengkap terpeta pada
kedua cluster.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 28
Analisis Multivariat II
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Untuk menangani masalah penduduk di Indonesia, pemerintah perlu mendahulukan
daerah-daerah mana saja yang perlu mendapatkan perhatian khusus. Untuk itu, di bagi 2
cluster yang berisi wilayah yang dengan lansia tidak terlantar dan wilayah yang memiliki
penduduk lansia terlantar. Untuk cluster 1 adalah wilayah yang memiliki penduduk lansia
tidak terlantar dan cluster 2 adalah wilayah yang memiliki penduduk lansia yang terlantar.
Tabel di bawah ini berisikan wilayah-wilayah yang masuk pada cluster 1 dan cluster 2.
Cluster 1 Cluster 2Lansia Tidak Terlantar Lansia Terlantar
Sumatera Utara Lampung Bali Sumatera Selatan Sulawesi TengahSumatera Barat DKI Jakarta Nusa Tenggara Barat Jawa Barat Sulawesi Selatan
Riau Jawa Tengah Kalimantan Selatan Nusa Tenggara Timur Sulawesi TenggaraJambi D.I. Yogyakarta Kalimantan Tengah Kalimantan Barat Irian Jaya
Bengkulu Jawa Timur Sulawesi Utara Kalimantan Timur
Karakteristik pada cluster 1 adalah banyaknya lansia yang tidak pernah
sekolah/tamat SD lebih sedikit dibandingkan dengan provinsi lain, banyaknya lansia yang
memakan makanan pokok <21 X dalam seminggu lebih sedikit dibandingkan dengan
provinsi lain, banyaknya lansia yang makan lauk-pauk berprotein tinggi <4 X dalam
seminggu lebih sedikit dibandingkan dengan provinsi lain, banyaknya lansia yang
memiliki pakaian <4 stel lebih banyak dibandingkan dengan provinsi lain, banyaknya
lansia yang tidak mempunyai tempat tetap untuk tidur lebih sedikit dibandingkan dengan
provinsi lain, banyaknya lansia yang bila sakit tidak lebih sedikit dibandingkan dengan
provinsi lain.
Sedangkan karakteristik cluster 2 adalah banyaknya lansia yang tidak pernah
sekolah/tamat SD lebih banyak dibandingkan dengan provinsi lain, banyaknya lansia yang
memakan makanan pokok <21 X dalam seminggu lebih banyak dibandingkan dengan
provinsi lain, banyaknya lansia yang makan lauk-pauk berprotein tinggi <4 X dalam
seminggu lebih banyak dibandingkan dengan provinsi lain, banyaknya lansia yang
memiliki pakaian <4 stel lebih sedikit dibandingkan dengan provinsi lain, banyaknya
lansia yang tidak mempunyai tempat tetap untuk tidur lebih banyak dibandingkan dengan
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 29
Analisis Multivariat II
provinsi lain, banyaknya lansia yang bila sakit tidak lebih banyak dibandingkan dengan
provinsi lain.
5.2 Saran
Untuk pemerintah, provinsi-provinsi pada cluster 2 perlu lebih mendapatkan perhatian
yang ekstra agar memiliki penduduk lanjut usia yang produktif. Provinsi-provinsi yang
masuk pada cluster 2 adalah Sumatera Selatan, Jawa Barat, Nusa Tenggara Timur,
Kalimantan Timur, Kalimantan Barat, Sulawesi Tengah, Sulawesi Selatan, Sulawesi
Tenggara dan Irian Jaya.
Untuk penulis, agar lebih bisa mengeksplor dan mengaplikasikan ilmu-ilmu statistika
dalam berbagai bidang.
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 30
Analisis Multivariat II
DAFTAR PUSTAKA
Santoso,singgih. 2002.Buku Latihan SPSS Statistik Multivariat.Elex Media
Komputindo:Jakarta.
http://digilib.its.ac.id/public/ITS-Undergraduate-17290-1309105013-Paper.pdf
http://www.digilib.unipdu.ac.id/downlot.php?file=BAB%20II%207305003.pdf
http://lecturer.eepis-its.edu/~iwanarif/kuliah/dm/5Clustering.pdf
http://prayudho.wordpress.com/2008/12/30/analisis-cluster/
http://statistikaterapan.files.wordpress.com/2008/10/analisis-cluster.doc
Pengelompokkan Penduduk Lanjut Usia di Indonesia Menggunakan Metode Analisis K-Means Cluster Page 31