penerapan fuzzy k-nearest neighbor (fknn) untuk diagnosa penderita liver berdasarkan indian liver...

14
PENERAPAN FUZZY K-NEAREST NEIGHBOR (FKNN) UNTUK DIAGNOSA PENDERITA LIVER BERDASARKAN INDIAN LIVER PATIENT DATASET (ILPD) Hardika Teguh Wijaya 1 , Mardji 2 , M. Tanzil Furqon 3 1 Mahasiswa Program Studi Informatika / Ilmu Komputer Universitas Brawijaya 2,3 Staff Pengajar Program Studi Informatika / Ilmu Komputer Universitas Brawijaya Program Studi Informatika / Ilmu Komuter Program Teknologi Informasi dan Ilmu Komputer Universitas Brawijata Jalan Veteran Malang 65145, Indonesia e-mail: [email protected] 1 , [email protected] 2 , [email protected] 3 ABSTRAK Penelitian ini membahas penerapan algoritma FKNN (Fuzzy K-Nearest Neighbor) untuk diagnosa penderita liver. Sistem yang akan dibangun menggunakan data pasien liver yang diambil dari archive.ics.uci.edu/ml/datasets/ILPD+%28Indian+Liver+Patient+Dataset %29. Algoritma FKNN adalah algoritma yang memberikan nilai keanggotaan kelas pada vektor sampel dan bukan menempatkan vektor pada kelas tertentu. Data latih yang digunakan adalah data pasien liver di india pada tahun 2012. Hasil dari pengujian ini untuk mengetahui pengaruh data latih, nilai k, sebaran kelas, serta mengetahui tingkat akurasi dari sistem ini. Dari hasil penelitian didapatkan akurasi sebesar 76% terhadap data latih , akurasi sebesar 74% terhadap nilai k. Dapat disimpulkan bahwa penelitian menggunakan algoritma FKNN (Fuzzy K-Nearest Neighbor) memiliki kinerja yang baik dalam diagnosa penderita liver. Kata kunci : liver, FKNN, akurasi I. Pendahuluan I.1 Latar Belakang Liver atau hati adalah organ terbesar dalam tubuh padat dan juga dianggap sebagai kelenjar, karena di antara banyak fungsinya yang membuat dan mengeluarkan empedu. Liver ini terletak di bagian kanan atas perut yang dilindungi oleh tulang rusuk. Penyakit liver adalah suatu gangguan pada setiap fungsi liver yang menyebabkan penyakit. Liver bertanggung jawab untuk fungsi- fungsi kritis dalam tubuh, dimana hilangnya fungsi-fungsi tersebut dapat menyebabkan kerusakan yang signifikan pada tubuh. Liver adalah satu-satunya organ dalam tubuh yang dapat dengan mudah mengganti sel-sel yang rusak, tetapi jika sel-sel itu hilang, maka liver tidak mungkin dapat memenuhi kebutuhan tubuh[1]. Masalah yang ditimbulkan oleh penyakit liver adalah sulitnya mengenali penyakit liver sejak dini, bahkan ketika penyakit tersebut sudah menyebar. Diagnosa penyakit liver yang lebih awal

Upload: septyan-teguh-mahendra

Post on 17-Nov-2015

195 views

Category:

Documents


28 download

DESCRIPTION

jurnal

TRANSCRIPT

PENERAPAN FUZZY K-NEAREST NEIGHBOR (FKNN) UNTUK DIAGNOSA PENDERITA LIVER BERDASARKAN INDIAN LIVER PATIENT DATASET (ILPD)

Hardika Teguh Wijaya1, Mardji2, M. Tanzil Furqon31Mahasiswa Program Studi Informatika / Ilmu Komputer Universitas Brawijaya2,3Staff Pengajar Program Studi Informatika / Ilmu Komputer Universitas BrawijayaProgram Studi Informatika / Ilmu KomuterProgram Teknologi Informasi dan Ilmu KomputerUniversitas BrawijataJalan Veteran Malang 65145, Indonesiae-mail: [email protected], [email protected] , [email protected]

ABSTRAKPenelitian ini membahas penerapan algoritma FKNN (Fuzzy K-Nearest Neighbor) untuk diagnosa penderita liver. Sistem yang akan dibangun menggunakan data pasien liver yang diambil dari archive.ics.uci.edu/ml/datasets/ILPD+%28Indian+Liver+Patient+Dataset%29. Algoritma FKNN adalah algoritma yang memberikan nilai keanggotaan kelas pada vektor sampel dan bukan menempatkan vektor pada kelas tertentu. Data latih yang digunakan adalah data pasien liver di india pada tahun 2012. Hasil dari pengujian ini untuk mengetahui pengaruh data latih, nilai k, sebaran kelas, serta mengetahui tingkat akurasi dari sistem ini. Dari hasil penelitian didapatkan akurasi sebesar 76% terhadap data latih , akurasi sebesar 74% terhadap nilai k. Dapat disimpulkan bahwa penelitian menggunakan algoritma FKNN (Fuzzy K-Nearest Neighbor) memiliki kinerja yang baik dalam diagnosa penderita liver.

Kata kunci : liver, FKNN, akurasi

I. Pendahuluan1.1 Latar BelakangLiver atau hati adalah organ terbesar dalam tubuh padat dan juga dianggap sebagai kelenjar, karena di antara banyak fungsinya yang membuat dan mengeluarkan empedu. Liver ini terletak di bagian kanan atas perut yang dilindungi oleh tulang rusuk. Penyakit liver adalah suatu gangguan pada setiap fungsi liver yang menyebabkan penyakit. Liver bertanggung jawab untuk fungsi-fungsi kritis dalam tubuh, dimana hilangnya fungsi-fungsi tersebut dapat menyebabkan kerusakan yang signifikan pada tubuh. Liver adalah satu-satunya organ dalam tubuh yang dapat dengan mudah mengganti sel-sel yang rusak, tetapi jika sel-sel itu hilang, maka liver tidak mungkin dapat memenuhi kebutuhan tubuh[1].Masalah yang ditimbulkan oleh penyakit liver adalah sulitnya mengenali penyakit liver sejak dini, bahkan ketika penyakit tersebut sudah menyebar. Diagnosa penyakit liver yang lebih awal dapat meningkatkan tingkat kelangsungan hidup pasien [2]. Data dari faktor penyakit liver merupakan data yang masih bersifat samar dan terdapat unsur yang masih belum pasti didalamnya. Hal ini dikarenakan logika fuzzy dapat dipakai untuk memodelkan proses berpikir manusia yang menyangkut unsur ketidakpastian, keraguan dan linguistik dimana metode klasik yang biasanya digunakan seperti metode matematis sulit untuk diterapkan karena kurang cukupnya pengetahuan [3].Pada penelitian ini digunakan metode fuzzy dengan gabungan metode pada data mining untuk memprediksikan data. Pada data mining, terdapat beberapa metode untuk klasifikasi/prediksi diantaranya yaitu metode k-Nearest Neighbor, ID3, C45, Bayesian dan beberapa metode lainnya. Dimana dalam klasifikasi, terdapat target variabel kategori [4].Metode k-NN dapat di gabungkan dengan beberapa metode lain, salah satu variasi dari penggunaan metode k-NN ini adalah Fuzzy k-Nearest Neighbor (Fk-NN) dimana metode ini menggabungkan teknik fuzzy dengan teknik data mining [5]. Fk-NN sebelumnya telah digunakan untuk memprediksi IRIS, Vertebratal Column, Liver, Diabetes oleh [7] dan Web Classification Document oleh [5]. Dimana, dalam implementasinya algoritma Fk-NN memberikan nilai keanggotaan kelas pada vektor sampel dan bukan menempatkan vektor pada kelas tertentu. Keuntungannya adalah nilai-nilai keanggotaan vektor seharusnya memberikan tingkat jaminan pada hasil klasifikasi. Dasar dari algoritma Fk-NN adalah untuk menetapkan nilai keanggotaan sebagai fungsi jarak vektor dari k-NN dan keanggotaan tetangga mereka di kelas-kelas yang memungkinkan. Pada penelitian sebelumnya diperoleh hasil akurasi sebesar 88% [6].Berdasarkan uraian di atas, maka penelitian ini diberi judul Penerapan Fuzzy kNearest Neighbor (Fk-NN) untuk Diagnosa Penderita Liver Berdasarkan Indian Liver Patient Dataset (ILPD).

1.2 Rumusan MasalahRumusan masalah dalam skripsi ini adalah : 1. Bagaimana menerapkan metode Fk-NN untuk klasifikasi pada Indian Liver Patient Dataset (ILPD) dengan parameter usia, jenis kelamin, jumlah Bilirubin, Direct Bilirubin, protein total, albumin, rasio A/G, SGPT, SGOT dan Alk Phos.2. Bagaimana tingkat akurasi hasil klasifikasi Indian Liver Patient Dataset (ILPD) menggunakan metode Fk-NN jika dibandingkan dengan KNN biasa yang dipengaruhi sejumlah nilai k (tetangga).

1.3 Batasan MasalahBerdasarkan permasalahan diatas akan diberikan batasan masalah sebagai berikut:1. Data yang digunakan pada penelitian ini adalah Indian Liver Patient Dataset yang diperoleh dari url : http://archive.ics.uci.edu/ml/datasets/ILPD+(Indian+Liver+Patient+Dataset)2. Parameter Penyakit Liver yang digunakan berupa data usia, jumlah Bilirubin, Direct Bilirubin, protein total, albumin, rasio A/G, SGPT, SGOT dan Alk Phos.

1.4 TujuanTujuan yang ingin dicapai dari penelitian dan penulisan skripsi ini adalah menerapkan metode FKNN pada Indian Liver Patient Dataset dan menghitung akurasi yang dipengaruhi sejumlah nilai k.

1.5 ManfaatAdapun manfaat dari penelitian ini adalah untuk menyediakan perangkat lunak yang dapat membantu dalam proses diagnosa penyakit liver dari pasien berdasarkan data faktor resiko dengan menggunakan FKNN, sehingga nantinya dapat diketahui pasien menderita penyakit liver atau tidak.

II. Tinjauan Pustaka2.1 LiverLiver atau hati adalah organ terbesar dalam tubuh padat dan juga dianggap kelenjar. Liver ini terletak di bagian kanan atas perut yang dilindungi oleh tulang rusuk. Penyakit liver adalah setiap gangguan fungsi liver yang menyebabkan penyakit. Liver bertanggung jawab untuk fungsi-fungsi kritis dalam tubuh, hilangnya fungsi-fungsi dapat menyebabkan kerusakan yang signifikan pada tubuh.Liver adalah satu-satunya organ dalam tubuh yang dapat dengan mudah mengganti sel yang rusak, tetapi jika sel-sel hilang, liver tidak mungkin dapat memenuhi kebutuhan tubuh. Kerusakan pada liver dapat terjadi dengan berbagai cara, antara lain [1]: 1. Terjadi peradangan pada sel 2. Aliran empedu terhambat 3. Kolesterol atau trigliserida menumpukJaringan liver rusak oleh bahan kimia dan mineral, atau disusupi oleh sel-sel abnormal

2.2 Logika FuzzyLogika fuzzy adalah suatu cara yang tepat untuk memetakan ruang input kedalam suatu ruang output [8]. Konsep ini diperkenalkan dan dipublikasikan pertama kali oleh Lotfi A. Zadeh, seorang profesor dari University of California di Berkeley pada tahun 1965. Logika fuzzy menggunakan ungkapan bahasa untuk menggambarkan nilai variabel. Logika fuzzy bekerja dengan menggunakan derajat keanggotaan dari sebuah nilai yang kemudian digunakan untuk menentukan hasil yang ingin dihasilkan berdasarkan atas spesifikasi yang telah ditentukan. Telah disebutkan sebelumnya bahwa logika fuzzy memetakan ruang input ke ruang output. Antara input dan output ada suatu kotak hitam yang harus memetakan input ke output yang sesuai [9]. 1. 2. 2.3 Himpunan FuzzyHimpunan tegas (crisp) A didefinisikan oleh item-item yang ada pada himpunan itu. Pada himpunan tegas (crisp), nilai keanggotaan suatu item x dalam suatu himpunan A (A(x)) memiliki dua kemungkinan [9], yaitu:1. Satu (1), yang berarti bahwa suatu item menjadi anggota dalam suatu himpunan.2. Nol (0), yang berarti bahwa suatu item tidak menjadi anggota dalam suatu himpunan.Himpunan Fuzzy didasarkan pada gagasan untuk memperluas jangkauan fungsi karakteristik sedemikian hingga fungsi tersebut akan mencakup bilangan real pada interval [0,1]. Nilai keanggotaannya menunjukkan bahwa suatu item dalam semesta pembicaraan tidak hanya berada pada 0 atau 1, namun juga nilai yang terletak diantaranya. Dengan kata lain, nilai kebenaran suatu item tidak hanya benar atau salah. Nilai 0 menunjukkan salah, nilai 1 menunjukkan benar, dan masih ada nilai-nilai yang terletak antara benar dan salah [8].

2.4 Data MiningData mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data Mining merupakan suatu proses yang menggunakan teknik statistika, matematika, kecerdasan buatan dan machine learning untuk mengidentifikasikan informasi yang bermanfaat dan pengetahuan yang terakit dari berbagai database besar [10]. Data Mining merupakan teknologi yang sangat berguna untuk membantu perusahaan-perusahaan menemukan informasi yang sangat penting dari gudang data mereka. Dengan data mining dapat meramalkan trend dan sifat-sifat perilaku bisnis yang sangat berguna untuk mendukung pengambilan keputusan penting. Analisis yang diotomatisasi yang dilakukan oleh data mining melebihi yang dilakukan oleh sistem pendukung keputusan tradisional yang sudah banyak digunakan. Data Mining mengeksplorasi basis data untuk menemukan pola-pola yang tersembunyi, mencari informasi untuk memprediksi yang mungkin saja terlupakan oleh para pelaku bisnis karena terletak di luar ekspektasi mereka [11].Dalam skripsi digunakan normalisasi min-max. Normalisasi min-max dihitung dengan persamaan 2.1 [12]. Menurut [13] normalisasi min-max memiliki keunggulan yaitu menjaga relasi pada data. Serta mempunyai fungsi yaitu menyatukan satuan dari berbagai atribut. (2.1) Dimana, : hasil normalisasi yang nilainya berkisar antara 0 dan 1 : nilai atribut A yang akan dinormalisasi minA : nilai minimum dari suatu atribut, A maxA : nilai maksimum dari suatu atribut, A.

2.5 KlasifikasiMenurut [11], klasifikasi adalah suatu fungsionalitas data mining yang akan menghasilkan model untuk memprediksi kelas atau kategori dari objek-objek di dalam baris data. Klasifikasi merupakan proses yang terdiri dari dua tahap, yaitu tahap pembelajaran dan tahap pengklasifikasian. Pada tahap pembelajaran, sebuah algoritma klasifikasi membangun sebuah model klasifikasi dengan cara menganalisis data training. Tahap pembelajaran dapat juga dipandang sebagai tahap pembentukan fungsi atau pemetaan y = f(x) dimana y adalah kelas hasil prediksi dan x adalah tuple yang ingin diprediksi kelasnya. Selanjutnya, pada tahap pengklasifikasian, model yang telah dihasilkan digunakan untuk melakukan klasifikasi terhadap unknown data. Akan tetapi, sebuah model hanya boleh digunakan untuk klasifikasi jika akurasi model tersebut cukup tinggi. Akurasi dapat diketahui dengan cara menguji model tersebut dengan data test. Data test terdiri dari label kelas yang sudah diketahui, namun data test tidak boleh sama dengan data training karena menyebabkan pengujian tersebut menunjukkan akurasi yang tinggi, padahal belum tentu demikian.

2.6 Algoritma KNNAlgoritma k-Nearest Neighbor (KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Data pembelajaran diproyeksikan ke ruang berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi data pembelajaran. Sebuah titik pada ruang ini ditandai kelas c jika kelas c merupakan klasifikasi yang paling banyak ditemui pada k buah tetangga terdekat titik tersebut. Dekat atau jauhnya tetangga biasanya dihitung berdasarkan jarak euclidean.Menurut Agusta (2007), bahwa prinsip kerja K-Nearest Neighbor (KNN) adalah mencari jarak terdekat antara data yang dievaluasi dengan k tetangga terdekatnya dalam data pelatihan. Awalnya dicari nilai bobot tiap atribut dari setiap kelas yang ada, kemudian menghitung bobot dengan keanggotaan kelas yang ada pada data latih. Persamaan 2.2 untuk pencarian rata-rata bobot tiap atribut:(2.2)Dimana : w = rata rata bobot tiap inputan/atributxn = data inputan ke-n tiap atributn = jumlah dataSetelah itu dihitung jarak terdekat antara data uji dengan data latih terlebih dahulu. Untuk menghitung jarak digunakan fungsi jarak euclidean yang ditunjukkan oleh persamaan 2.3. (2.3) Keterangan: w = bobot tiap inputanx1 = data latih x2 = data uji i = variabel data d = jarak p = dimensi dataSetelah diketahui jarak antar record, kemudian diambil sebanyak k tetangga terdekat untuk menentukan label kelas dari record baru menggunakan label kelas tetangga.

2.7 Fungsi KombinasiUntuk memberikan keputusan klasifikasi bagi record baru, dilakukan kombinasi terhadap record yang serupa, dengan fungsi kombinasi. Jenis fungsi kombinasi weighted voting dilakukan dengan memberikan bobot terhadap beberapa tetangga yang dekat dengan record yang baru. Pemberian bobot ini dapat memberikan pengaruh lebih dalam menentukan label kelas. Weighted ditunjukkan oleh persamaan 2.4. (2.4) Dimana :y = neighbora = new Recorddistance (neighbor, newRecord) merupakan jarak antara record yang baru dengan tetangganya. Persamaan 2.4 dapat menghitung bobot dari semua tetangganya, dengan menjumlahkan bobot dari tetangga yang memiliki label kelas yang sama. Label kelas dari record yang baru adalah label kelas dari record yang jumlah bobot tetangganya paling besar [12].

2.8 FKNNFuzzy k-Nearest Neighbor (Fk-NN) merupakan metode klasifikasi yang menggabungkan teknik fuzzy dengan k-Nearest Neighbor classifier. Algoritma Fk-NN memberikan nilai keanggotaan kelas pada vektor sampel dan bukan menempatkan vektor pada kelas tertentu. Fk-NN merupakan metode klasifikasi yang digunakan untuk memprediksi data uji menggunakan nilai derajat keanggotaan data uji pada setiap kelas. Kemudian diambil kelas dengan nilai derajat keanggotaan terbesar dari data uji sebagai kelas hasil prediksi. Keuntungannya adalah nilai-nilai keanggotaan vektor seharusnya memberikan tingkat jaminan pada hasil klasifikasi. Sebagai contoh, jika vektor diberikan nilai keanggotaan 0.9 pada kelas pertama dan 0.05 pada dua kelas lainnya peneliti dapat cukup yakin bahwa kelas dengan nilai keanggotaan 0.9 adalah kelas milik vektor tersebut. Di sisi lain, jika sebuah vektor diberi nilai keanggotaan 0.55 pada kelas pertama, 0.44 pada kelas kedua, dan 0.01 pada kelas ketiga, maka peneliti harus ragu-ragu untuk menetapkan vektor berdasarkan hasil ini. Namun, dapat diyakinkan bahwa vektor tersebut bukan milik kelas ketiga. Dalam kasus seperti ini, perlu diperiksa lebih lanjut untuk menentukan klasifikasinya, karena memiliki derajat keanggotaan yang tinggi pada dua kelas yaitu satu dan dua. Pemberian nilai keanggotaan oleh algoritma ini jelas berguna dalam proses klasifikasi.Sebuah data memiliki nilai keanggotaan pada setiap kelas yang berbeda dengan nilai derajat keanggotaan dalam interval [0, 1]. Teori himpunan fuzzy men-generalisasi teori k-NN klasik dengan mendefinisikan nilai keanggotaan sebuah data pada masing-masing kelas. Formula yang digunakan ditunjukkan oleh persamaan 2.5 [7]. (2.5)Dimana ij adalah nilai keanggotaan fuzzy pada contoh pengujian (x, xj) yang merupakan satu dari contoh-contoh fuzzy k-nearest neighbor, k merupakan banyaknya nilai ketetanggan terdekat yang diambil, j merupakan variable data untuk keanggotaan data latih, i merupakan variable data untuk keanggotaan data uji, sedangkan m merupakan berat kebalikan yang sebanding dengan jarak Antara xj dan x. Variabel (m) merupakan penentuan seberapa banyak pemberian bobot pada jarak saat menghitung kontribusi jarak kedekatan pada masing-masing tetangga dengan nilai keanggotaan. Jika nilai m adalah dua, maka jarak kontribusi dari setiap titik tetangga (data latih) dibobotkan oleh nilai kebalikan dari jarak titik tetangga tersebut dengan titik yang sedang diklasifikasikan (data uji). Ketika nilai m naik, titik-titik tetangga tersebut dibobotkan lebih merata dan efek dari jarak relatif dari titik yang sedang diklasifikasikan akan berkurang. Ketika nilai m mendekati satu,semakin dekat tetangga maka akan dibobotkan lebih besar daripada tetangga yang lebih jauh (semakin besar nilai jarak maka semakin besar bobotnya), yang mana hal ini akan mempengaruhi pengurangan jumlah titik (tetangga) yang berkontribusi terhadap nilai keanggotaan dari titik yang sedang diklasifikasikan. Hasil yang ditampilkan pada jurnal ini, menggunakan nilai m=2 tetapi perhatikan bahwa hampir tingkat kesalahan yang diperoleh pada data ini hampir sama dengan menggunakan nilai m yang beragam[7].Nilai uij pada ui(x) terlebih dahulu diproses dengan menggunakan persamaan 2.6 [7]. 0.51 + (nj/K) * 0.49, jika j=iUij = (Nj/K) * 0.49, jika ji (2.6)Keterangan: nj= jumlah anggota kelas j pada suatu dataset K K= total data latih yang digunakan j= kelas target (training/tidak training)

2.9 Akurasi Akurasi merupakan seberapa dekat suatu angka hasil pengukuran terhadap angka sebenarnya (true value atau reference value). Dalam penelitian ini akurasi diagnosis dihitung dari jumlah diagnosis yang tepat dibagi dengan jumlah data. Tingkat akurasi diperoleh dengan perhitungan sesuai dengan persamaan 2.7 [14]. (2.7)Jumlah prediksi benar adalah jumlah record data uji yang diprediksi kelasnya menggunakan metode klasifikasi dan hasilnya sama dengan kelas sebenarnya. Sedangkan jumlah total prediksi adalah jumlah keseluruhan record yang diprediksi kelasnya (seluruh data uji).

III.Metodologi3.1 Langkah PenelitianBerikut ini adalah langkah-langkah yang dilakukan dalam penelitian ini :1. Mempelajari Studi literature yang terkait dengan masalah penyakit liver dan metode Fuzzy k-Nearest Neighbor.2. Melakukan pengumpulan data data dari Indian Liver Patient Dataset (ILPD).3. Menganalisis sistem dari data dan melakukan perancangan sistem yang meliputi pelatihan, dan pengujian.4. Mengimplementasikan sistem untuk membuat perangkat lunak berdasarkan analisis dan perancangan yang telah dilakukan dengan menggunakan bahasa pemrograman Java.5. Melakukan uji coba terhadap perangkat lunak.6. Mengevaluasi uji coba terhadap perangkat lunak.

3.2 Data PenelitianData yang digunakan dalam penerapan fuzzy k-nearest neighbor diambil dari situs http://archive.ics.uci.edu/ml/datasets.html dan menggunakan data penyakit liver pada tahun 2012. Pada dataset liver, atribut yang digunakan adalah usia, jenis kelamin, jumlah Bilirubin, Direct Bilirubin, protein total, albumin, rasio A/G, SGPT, SGOT dan Alk Phos. Sedangkan kelas output yaitu:1. = pasien liver.2. = bukan pasien liver.

3.3 Deskripsi SistemSecara umum sistem yang dibuat merupakan perangkat lunak yang mengimplementasikan algoritma Fuzzy k-Nearest Neighbor (Fk-NN) untuk memprediksi penderita liver.Perangkat lunak ini akan menguji keakuratan hasil klasifikasi dataset penderita liver. Parameter uji yang berkaitan dengan nilai k (tetangga) dan data latih yang berpengaruh terhadap tingkat akurasi.1. 2. 3. 3.1. 3.2. 3.3. 3.3.1. Batasan sistem prediksi penderita liver ini antara lain: Input sistem berupa data penderita liver selama tahun 20121. 2. 3. 3.1. 3.2. 3.3. 3.3.1. 3.3.2. Tahap prediksi sistem Fk-NN untuk prediksi penderita liver, langkah langkahnya adalah sebagai berikut:1. Menginputkan data latih dan data uji penderita liver dan k.2. Melakukan perhitungan normalisasi untuk nilai setiap atribut.3. Melakukan perhitungan k-NN.4. Transformasi output data ke dalam data fuzzy.5. Didapatkanlah hasil prediksi kelas penderita liver.Deskripsi sistem dapat dilihat pada Gambar 3.3.

Gambar 3.3. Deskripsi sistem secara umum

IV. Implementasi4.1 Lingkungan Implementasi Perangkat KerasPerangkat keras yang digunakan dalam pembuatan sistem memiliki beberapa spesifikasi sebagai berikut :1. Processor : Intel Core 2Duo CPU @2.10GHz2. Memory : 2.00 GB3. Hard disk: 300 GB

4.2 Lingkungan Implementasi Perangkat LunakPerangkat lunak yang digunakan untuk implementasi sistem ini adalah sebagai berikut:1. Sistem Operasi Windows 7 Professional 64-bit2. Aplikasi pembangunan GUI dan code menggunakan Netbeans IDE 8.0.23. Bahasa pemrograman yang dipakai yaitu bahasa pemrograman java.4. Komponen java yang digunakan yaitu JDK 1.7.1V. Hasil PenelitianKinerja sistem diukur dengan melakukan beberapa uji coba. Uji coba sistem ini terbagi menjadi tiga bagian yaitu pengujian tingkat akurasi terhadap data latih, banyaknya nilai k, dan sebaran kelas. 5.1 Hasil Pengujian Tingkat Akurasi terhadap Data LatihPada pengujian tingkat akurasi terhadap data latih, data latih yang digunakan meliputi 80, 110, 140, 170, 200, dan 230 data. Tabel 5.1 berikut ini menunjukan pengaruh data latih terhadap tingkat akurasi, dengan data uji yang sama yaitu 50 data uji dan nilai k=3.Tabel 5.1 Hasil uji terhadap jumlah data latihData LatihFKNN Akurasi (%)KNN Akurasi (%)

8064 %52%

11057 %45%

14068 %56%

17076 %62%

20060 %52%

23064 %54%

Dari hasil yang terdapat pada tabel 5.1 dapat disimpulkan bahwa adanya fluktuatif di data latih membuat hasil akurasi tidak baik.5.1.2 Hasil Pengujian Tingkat Akurasi terhadap Nilai kPada pengujian tingkat akurasi terhadap pengaruh nilai k, data latih yang digunakan adalah 80 data. Sedangkan data uji yang digunakan adalah 50 data. Untuk nilai k yang digunakan adalah k = 2 sampai dengan k = n. Hasil dari pengujian tingkat akurasi terhadap nilai k dapat dilihat pada tabel 5.2.Tabel 5.2 Hasil uji terhadap nilai kkFKNN Akurasi (%)KNN Akurasi (%)

268 %66%

364 %52%

462 %62%

570 %60%

670 %68%

768 %66%

870 %70%

972 %68%

1070 %70%

1474 %70%

1572 %70%

1674 %70%

1974 %72%

2074 %74%

2574 %74%

3074 %74%

3574 %74%

4074 %74%

4574 %74%

5074 %74%

8074%74%

5.1.3 Hasil Pengujian Tingkat Akurasi terhadap Sebaran DataPada pengujian tingkat akurasi terhadap sebaran data, data latih yang digunakan meliputi 70, 90, 110, 130, 150, dan 334 data. Sebaran data 1 terdiri dari 70% kelas 1 dan 30% kelas 2, sebaran data 2 terdiri dari 30% kelas 1 dan 70% kelas 2, sedangkan sebaran data 3 terdiri dari 50% kelas 1 dan 50% kelas 2. Tabel 5.3 berikut ini menunjukan pengaruh sebaran data terhadap tingkat akurasi, dengan data uji yang sama yaitu 50 data uji dimana khusus untuk sebaran data 3 terdiri dari 50% kelas 1 dan 50% kelas 2 serta nilai k=3.Tabel 5.3 Hasil uji terhadap jumlah data latihData LatihSebaran data 1 Sebaran data 2Sebaran data 3

7064 %32%48%

9056 %36%48%

11056 %28%54%

13060 %32%44%

15068 %38%57%

20056%26%56%

5.2 Analisa HasilBerdasarkan pengujian tingkat akurasi terhadap data latih, nilai k dan sebaran kelas, maka dibuatlah grafik hubungan tingkat akurasi Fk-NN dengan tingkat akurasi k-NN untuk melihat keakuratan sistem. Grafik ditunjukkan pada grafik 5.1-5.3

Gambar 5.1 Grafik Tingkat Akurasi terhadap Data Latih

Pada grafik 5.1 hasil akurasi yang paling bagus sebesar 76% dalam data latih yang sebanyak 170 data.

Gambar 5.2 Grafik Tingkat Akurasi terhadap Nilai k

Pada grafik 5.2 dihasilkan akurasi yang terbaik sebesar 74%.

Gambar 5.3 Grafik Tingkat Akurasi terhadap Sebaran Data

Pada grafik 5.3 untuk sebaran data kelas 1 paling besar didapatkan 68%, sebaran data kelas 2 paling besar didapatkan 36%, dan disebaran data kelas 3 paling besar didapatkan 57%.

VI. KesimpulanDari hasil perancangan dan implementasi sistem maka dapat disimpulkan:1. Metode Fuzzy k-Nearest Neighbor (FK-NN) bisa diterapkan untuk mendiagnosis penderita liver dengan menggunakan 10 parameter yang terdapat pada data Indian Liver Patient Dataset (ILPD). Langkah pertama ialah data latih dan data uji yang sedang digunakan diproses menggunakan min-max normalization. Kemudian data latih dan data uji yang telah dinormalisasi dihitung menggunakan persamaan euclidean distance. Output data penderita liver yang digunakan ditransformasikan kedalam bentuk fuzzy. Pada akhirnya didapatkan hasil diagnose penderita liver yang dihitung menggunakan persamaan Fuzzy k-Nearest Neighbor (FK-NN). 2. Berdasarkan pengujian terhadap data latih dihasilkan akurasi sebesar 76%, terhadap nilai k dihasilkan akurasi sebesar 74%, terhadap sebaran kelas 1 sebesar 68%, kelas 2 sebesar 36%, dan disebaran data kelas 3 paling besar didapatkan 57%.

VII. SaranSistem yang telah dibangun pada penelitian ini masih memiliki kekurangan. Adapun beberapa saran untuk penelitian lebih lanjut adalah sebagai berikut:1. Penelitian ini tidak melakukan pengujian terhadap optimasi k dan data latih. Diharapkan pada penelitian selanjutnya untuk meneliti optimasi k dan data latih.2. Diharapkan pada penelitian berikutnya menggunakan metode lain atau FKNN yang telah dimodifikasi agar mendapat hasil yang lebih maksimal.

VIII. DAFTAR PUSTAKA[1]Salindeho, E. 2013. Penyakit Liver. http://www.bmodtcenter.com/artiket_kesehatan.html. Diakses 20 November 2013.[2] Lin Rong-Ho. 2009. An intelligent model for liver disease diagnosis. Artificial Intelligence in Medicine.[3]Priyono, Agus Priyono, Muhammad Ridwan, Ahmad Jais Alias, Riza Atiq, O. K. Rahmat, Azmi Hassan & Mohd. Alauddin Mohd. Ali. 2005. Generation Of Fuzzy Rules With Subtractive Clustering, Jurnal Teknologi, 43(D) Dis. Universitas Teknologi Malaysia.[4]Kusrini dan Luthfi, Emha Tufiq. 2009. Algoritma Data Mining. Yogyakarta: Penerbit ANDI.[5]Zhang, Juan, Yi Niu, Huabei Nie. 2009. Web Document Classification Based on Fuzzy KNN Algorithm. International Conference on Computational Intelligence and Security.[6]Reviangga Dika Satyatama. 2013. Klasifikasi Incomplete Data Penyakit Liver Pada Manusia Dengan Menggunakan Algoritma Voting Feature Interval-5 (Vfi5). Universitas Brawijaya. Malang.[7]Keller, M. James, Michael R Gray, James A. Givens. 1985. A Fuzzy K-Nearest Neighbor.IEEE Transactions on System, Man and Cybernetics, Vol. SMC-15 No. 4[8]Kusumadewi, S dan Purnomo, H. 2003. Artificial Intelligence (Teknik & Aplikasinya). Graha Ilmu. Jogjakarta.[9]Kusumadewi, S dan Purnomo, H. 2010. Aplikasi Logika Fuzzy untuk Pendukung Keputusan: Jilid 2. Graha Ilmu. Yogyakarta.[10]Turban, 2005. Decision Support Sistems and Intelligent Sistems (Sistem Pendukung Keputusan dan Sistem Cerdas) jilid 1. Andi Offset: Yogyakarta.[11]Khusnawi. 2007. Pengantar Solusi Data Mining (Online). STMIK AMIKOM. Yogyakarta.http://p3m.amikom.ac.id/p3m/56%20%20PENGANTAR%20SOLUSI%20DATA%20MINING.pdf, diakses tanggal 27 November 2013.[12]Moradian, Mehdi dan Baarani, Ahmad. 2009. KNNBA: k-Nearest-Neighbor-Based_Associaton Algorithm(Online),http://www.jatit.org/volume/researchpapers/Vol6No1/14Vol6No1.pdf, diakses tanggal 27 November 2013.[13] Jayalakshmi, T. dan Santhakumaran, A. 2011. Statistical Normalization and Backpropagation for Classification, http://www.ijcte.org/papers/288-L052.pdf, diakses tanggal 27 November 2013.[14] Nugraha, Dany, dkk. 2006. Diagnosis Gangguan Sistem Urinaripada Anjing dan Kucing Menggunakan VFI 5. Institute Pertanian Bogor.