analisis implementasi machine learning untuk …

20
Gina Fauziah, 2021 ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) SKRIPSI Diajukan untuk Memenuhi Bagian dari Syarat Memperoleh Gelar Sarjana Komputer Pada Departemen Pendidikan Ilmu Komputer Program Studi Ilmu Komputer oleh Gina Fauziah NIM 1601148 PROGRAM STUDI ILMU KOMPUTER DEPARTEMEN PENDIDIKAN ILMU KOMPUTER FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS PENDIDIKAN INDONESIA 2021

Upload: others

Post on 16-Oct-2021

6 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

Gina Fauziah, 2021 ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM

BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK

PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD)

SKRIPSI

Diajukan untuk Memenuhi Bagian dari

Syarat Memperoleh Gelar Sarjana Komputer

Pada Departemen Pendidikan Ilmu Komputer

Program Studi Ilmu Komputer

oleh

Gina Fauziah

NIM 1601148

PROGRAM STUDI ILMU KOMPUTER

DEPARTEMEN PENDIDIKAN ILMU KOMPUTER

FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS PENDIDIKAN INDONESIA

2021

Page 2: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

i Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK

PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD)

Oleh

Gina Fauziah

Sebuah skripsi yang diajukan untuk memenuhi salah satu syarat memperoleh gelar

Sarjana pada Fakultas Pendidikan Matematika dan Ilmu Pengetahuan Alam

© Gina Fauziah

Universitas Pendidikan Indonesia

2021

Hak cipta dilindungi undang-undang

Skripsi ini tidak boleh diperbanyak seluruhnya atau sebagian,

Dengan dicetak ulang, difoto kopi, atau cara lainnya tanpa izin dari penulis

Page 3: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

ii Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

GINA FAUZIAH

1601148

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK

PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD)

disetujui dan disahkan oleh pembimbing:

Pembimbing I

Asep Wahyudin

Dr. Asep Wahyudin, M.T.

NIP. 197112232006041001

Pembimbing II

Enjun Junaeti, M.Si.

NIP. 198512202012122002

Mengetahui,

Ketua Program Studi Ilmu Komputer

Dr. Rani Megasari, M.T.

NIP. 198705242014042002

Page 4: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

iii Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

PERNYATAAN

Dengan ini saya menyatakan bahwa skripsi dengan judul “ANALISIS

IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH

KASUS DEMAM BERDARAH DENGUE (DBD)” ini beserta seluruh isinya

adalah benar-benar karya saya sendiri. Saya tidak melakukan penjiplakan atau

pengutipan dengan cara-cara yang tidak sesuai dengan etika ilmu yang berlaku

dalam masyarakat keilmuan. Atas pernyataan ini, saya siap menanggung

risiko/sanksi apabila di kemudian hari ditemukan adanya pelanggaran etika

keilmuan atau ada klaim dari pihak lain terhadap keaslian karya saya ini.

Bandung, Agustus 2021

Yang membuat pernyataan,

Gina Fauziah

Page 5: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

iv Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

KATA PENGANTAR

Puji serta syukur ke hadirat Allah subhanahuwata’ala yang telah

melimpahkan berkah, rahmat, dan karunia-Nya sehingga penyusunan skripsi yang

berjudul “ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK

PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD)” ini

dapat diselesaikan sesuai dengan rencana penelitian.

Tujuan dari penyusunan skripsi ini adalah sebagai salah satu syarat untuk

memenuhi syarat untuk memperoleh gelar sarjana komputer pada jenjang studi S1

Program Studi Ilmu Komputer di Universitas Pendidikan Indonesia.

Dalam penyusunan skripsi ini, penulis telah berupaya semaksimal mungkin

dalam menyajikan hasil penelitian yang dituangkan dalam bentuk laporan sehingga

dapat dibaca oleh pembaca umum. Namun, penulis menyadari bahwa masih banyak

kekurangan serta keterbatasan dalam penyusunan tulisan ini. Oleh karena itu,

penulis sangat terbuka dan menerima atas kritikan dan saran terhadap tulisan ini

agar segala kekurangan dan kualitas yang terdapat pada tulisan ini dapat diperbaiki

di tulisan berikutnya.

Bandung, Agustus 2021

Penulis,

Gina Fauziah

Page 6: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

v Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

UCAPAN TERIMA KASIH

Penulis tentu tak mampu menyelesaikan penelitian ini tanpa bantuan dan

dukungan dari pihak-pihak yang telah membantu baik secara langsung ataupun

tidak. Maka dari itu pada kesempatan ini, penulis dengan senang hati mengucapkan

terima kasih kepada:

1. Kedua orang tua penulis: Almarhum H. Usjari ayah tercinta dan Hj. N. Inayah

ibu tercinta, yang selalu memberikan dukungan baik doa, semangat, dan

materi demi kelancaran penyusunan skripsi ini, serta yang menjadi salah satu

motivasi penulis dalam melanjutkan perjuangan akademik di kampus.

2. Saudara kandung penulis yaitu: Rinna Rizkiyanah dan Diah Noor Azizah,

yang selalu memberikan motivasi akademik khususnya dalam penyusunan

skripsi ini dan pesan kehidupan, dan mengingatkan tentang kesehatan fisik

dan mental.

3. Saudara ipar penulis: Maulana Ary Perkasa dan Dinar Syahid Nur Ulum, yang

selalu memberikan motivasi akademik khususnya dalam penyusunan skripsi

ini dan bercerita pengalaman dalam dunia kuliah dan kerja.

4. Bapak Dr. Asep Wahyudin, M.T, selaku dosen pembimbing I yang tak pernah

bosan membimbing dan selalu memberikan inspirasi pada penulis mengenai

bagaimana cara berpikir sistematis, sederhana, dan mengedepankan

rasionalitas.

5. Ibu Enjun Junaeti, M.Si., selaku dosen pembimbing II yang dengan sabarnya

membimbing penulis dalam penyusunan skripsi dan memperbaiki segala

bentuk penulisan yang telah penulis buat secara detil dan hati-hati.

6. Bapak Rizky Rachman Judhie Putra M.Kom., selaku dosen Pembimbing

Akademik yang telah memberikan arahan, bimbingan, motivasi, doa dan

dukungan selama kuliah hingga penyusunan skripsi ini.

7. Bapak Dr. Lala Septem Riza, M.T., selaku demisioner ketua Departemen

Pendidikan Ilmu Komputer.

8. Ibu Dr. Rani Megasari, M.T., selaku ketua Program Studi Ilmu Komputer dan.

9. Seluruh jajaran dosen yang tidak bisa penulis tuliskan satu persatu yang telah

membimbing dan memberikan ilmu yang bermanfaat pada penulis semasa

Page 7: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

vi Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

kuliah dan staf administrasi Departemen Pendidikan Ilmu Komputer yang

telah membantu dan memberikan informasi akademik selama masa

perkuliahan.

10. Teman gunung Anggi Haifa Lestari, Silvi Febrianti, Afina Hadaina Yudianita,

dan Tia Pusparini, yang senantiasa direpotkan selama penelitian dan

penyusunan penulisan skripsi ini. Dan Ali Hasan yang kompornya dipinjam

selama empat tahun terakhir untuk menunjang kebutuhan masak-memasak di

kosan.

11. Seluruh rekan-rekan departemen pendidikan ilmu komputer angkatan 2016

yang telah bersama-sama melewati banyak rintangan hingga sampai pada titik

terbaik yang bisa masing-masing tempuh.

12. Kakak tingkat dan adik tingkat departemen pendidikan ilmu komputer yang

telah banyak memberikan penulis pelajaran dan jadi batu loncatan penulis

untuk terus belajar.

13. Serta seluruh pihak lainnya yang tidak dapat penulis sebutkan satu persatu

yang juga telah membantu dan memberi semangat dalam proses penyusunan

skripsi ini hingga selesai.

Akhir kata, semoga skripsi ini dapat memberi manfaat dan menambah ilmu

bagi pembaca. Tidak ada kata yang dapat menggambarkan rasa terima kasih penulis

atas semua dukungan yang telah diberikan, semoga senantiasa diberikan kebaikan,

kebahagian, dan kesehatan oleh Allah SWT. Aamiin.

Page 8: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

vii Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK

PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD)

Oleh

Gina Fauziah – [email protected]

1601148

ABSTRAK

Salah satu faktor yang dapat mempengaruhi perkembangan nyamuk Aedes Aegypti

adalah perubahan iklim, sehingga dapat menyebabkan penyebaran kasus DBD.

Penelitian ini akan menganalisis prediksi total kasus DBD berdasarkan data

perubahan iklim menggunakan empat metode Machine Learning. Data yang

digunakan adalah data kasus DBD dan data perubahan iklim di Kota San Juan tahun

1990-2008 dan Kota Iquitos tahun 2000-2010. Metode yang digunakan adalah

Multiple Linear Regression, Random Forest, Support Vector Regression, XGBoost,

dan menggunakan hyperparamater tuning Grid Search Cross Validation untuk

mencari parameter optimal. Hasil akurasi menggunakan evaluasi metrik MAE

(Mean Absolute Error). Berdasarkan hasil testing, model yang paling baik adalah

XGBoost dengan nilai MAE Kota San Juan 17.592 dan Kota Iquitos 6.565. Feature

Importance atau variabel yang paling berpengaruh terhadap jumlah kasus DBD di

kedua kota adalah reanalysis_specific_humidity_g_per_kg (kelembaban spesifik

rata-rata), year (tahun) dan weekofyear (minggu dalam setahun), sehingga dapat

disimpulkan bahwa variabel waktu dan variabel perubahan iklim sangat

berpengaruh terhadap jumlah kasus DBD pada kedua kota tersebut.

Kata kunci: Prediksi; Multiple Linear Regression; Random Forest; Support Vector

Regression; XGBoost; DBD; MAE.

Page 9: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

viii Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

ANALISYS OF MACHINE LEARNING IMPLEMENTATION FOR PREDICTING

THE NUMBER OF CASES OF DENGUE HEMORRHAGIC FEVER (DHF)

Arranged by

Gina Fauziah– [email protected]

1601148

ABSTRACT

One of the factors that can affect the development of the Aedes Aegypti mosquito is

climate change, which can cause the spread of dengue cases. This study will analyze

the prediction of the number of dengue cases using four machine learning methods.

The data used are data on cases of dengue fever and climate change in the City of

San Juan in 1990-2008 and the City of Iquitos in 2000-2010. The method used is

Multiple Linear Regression, Random Forest, Support Vector Regression, XGBoost,

and using hyperparamater tuning Grid Search Cross Validation to find optimal

parameters. The accuracy results use the metric evaluation MAE (Mean Absolute

Error). Based on the testing results, the best model is XGBoost with an MAE value

of 17,592 for San Juan City and 6,565 for Iquitos City. Feature Importance or the

most influential variables are ‘reanalysis_specific_humidity_g_per_kg’ (rata), year

(year) dan weekofyear (week of the year), for the city of Iquitos which has the

highest F-score Information Gain. So it can be concluded that the time variable and

climate change variable greatly affect the number of dengue cases in the two cities.

Keywords: Forecasting; Multiple Linear Regression; Random Forest; Support

Vector Regression; XGBoost; DHF; MAE.

Page 10: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

ix Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

DAFTAR ISI

PERNYATAAN ..................................................................................................... iii

KATA PENGANTAR ........................................................................................... iv

UCAPAN TERIMA KASIH ................................................................................... v

ABSTRAK ............................................................................................................ vii

ABSTRACT ........................................................................................................... viii

DAFTAR ISI .......................................................................................................... ix

DAFTAR GAMBAR ............................................................................................ xii

DAFTAR TABEL ................................................................................................ xiv

BAB I PENDAHULUAN ...................................................................................... 1

1.1 Latar Belakang.......................................................................................... 1

1.2 Rumusan Masalah .................................................................................... 4

1.3 Tujuan Penelitian ...................................................................................... 4

1.4 Batasan Masalah ....................................................................................... 5

1.5 Manfaat Penelitian .................................................................................... 5

1.6 Sistematika Penulisan ............................................................................... 6

BAB II KAJIAN PUSTAKA ................................................................................. 8

2.1 Peta Literatur ............................................................................................ 8

2.2 Penelitian Terkait...................................................................................... 9

2.3 Prediksi atau Peramalan (Forecasting) .................................................. 11

2.4 Multiple Linear Regression (MLR) ........................................................ 12

2.4.1 Model persamaan Multiple Linear Regression ............................... 13

2.4.2 Metode Kuadrat Terkecil untuk Multiple Linear Regression ......... 14

2.5 Random Forest (RF) ............................................................................... 14

2.6 Support Vector Regression (SVR).......................................................... 16

Page 11: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

x Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

2.7 Extreme Gradient Boosting (XGBoost) .................................................. 17

2.8 Grid Search Cross-Validation ................................................................ 19

2.9 Evaluation Metrics ................................................................................. 20

BAB III METODOLOGI PENELITIAN............................................................. 21

3.1 Desain Penelitian .................................................................................... 21

3.1.1 Perumusan Masalah ............................................................................ 22

3.1.2 Studi Literatur ..................................................................................... 22

3.1.3 Pengumpulan Data .............................................................................. 22

3.1.4 Eksperimen ......................................................................................... 23

3.1.5 Analisis dan Evaluasi Hasil Eksperimen ............................................ 24

3.1.6 Penarikan Kesimpulan ........................................................................ 24

3.2 Lingkungan Komputasi .......................................................................... 25

BAB IV TEMUAN DAN PEMBAHASAN ........................................................ 26

4.1 Pengumpulan Data.................................................................................. 26

4.2 Deskripsi Data ........................................................................................ 27

4.3 Implementasi .......................................................................................... 29

4.3.1 Eksplorasi Data Analisis ..................................................................... 29

4.3.2 Data Preprocessing ............................................................................. 38

4.3.3 Training dan Testing Model ................................................................ 40

4.3.3.1 Multiple Linear Regression ............................................................. 41

4.3.3.2 Random Forest Regressor ............................................................... 43

4.3.3.3 Support Vector Regreesion ............................................................. 45

4.3.3.4 XGBoost .......................................................................................... 48

4.3.4 Analisis dan Evaluasi Model .............................................................. 50

4.3.4.1 Analisis Evaluasi Model Kota San Juan ......................................... 51

4.3.4.2 Analisis Evaluasi Model Kota Iquitos............................................. 54

Page 12: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

xi Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

4.3.4.3 Perbandingan Nilai MAE Train-Test Split ...................................... 57

4.3.5 Feature Importance ............................................................................ 70

BAB V KESIMPULAN DAN REKOMENDASI ............................................... 73

5.1 Kesimpulan ............................................................................................. 73

5.2 Rekomendasi .......................................................................................... 74

DAFTAR PUSTAKA .......................................................................................... 75

LAMPIRAN ......................................................................................................... 80

Page 13: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

xii Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

DAFTAR GAMBAR

Gambar 2.1 Peta Literatur Penelitian ...................................................................... 8

Gambar 2.2 Grafik Multiple Linear Regression (Sumber: medium.com) ............ 14

Gambar 2.3 Model Random Forest ....................................................................... 15

Gambar 2.4 Support Vector Regression................................................................ 17

Gambar 2.5 Struktur XGBoost .............................................................................. 18

Gambar 2.6 Ilustrasi Grid Search ......................................................................... 19

Gambar 3.1 Desain Penelitian ............................................................................... 21

Gambar 3.2 Desain Eksperimen ............................................................................ 23

Gambar 4.1 Sampel Data Kota San Juan dan Kota Iquitos................................... 27

Gambar 4.2 Pengecekan Jumlah Null ................................................................... 29

Gambar 4.3 Deskripsi statistik variabel ................................................................ 30

Gambar 4.4 Chart jumlah data per kota ................................................................ 31

Gambar 4.5 Korelasi semua features pada Kota San Juan.................................... 33

Gambar 4.6 Korelasi semua features pada Kota Iquitos ....................................... 33

Gambar 4.7 Korelasi antara total_cases terhadap semua features ........................ 34

Gambar 4.8 Korelasi total_cases Kota San Juan ................................................. 35

Gambar 4.9 Korelasi total_cases Kota Iquitos ..................................................... 35

Gambar 4.10 Plot grafik kota San Juan ................................................................. 36

Gambar 4.11 total_cases per minggu Kota San Juan ........................................... 36

Gambar 4.12 Plot grafik kota Iquitos .................................................................... 37

Gambar 4.13 total_cases per minggu Kota Iquitos ............................................... 37

Gambar 4.14 Sampel Dataframe Kota San Juan .................................................. 38

Gambar 4.15 Sampel Dataframe Kota Iquitos ...................................................... 39

Gambar 4.16 Hasil mengisi feature yang null dengan backwardfill ..................... 40

Gambar 4.17 Ploting MLR San Juan Training ..................................................... 41

Gambar 4.18 Ploting MLR San Juan Testing ....................................................... 41

Gambar 4.19 Ploting MLR Iquitos Training......................................................... 42

Gambar 4.20 Ploting MLR Iquitos Testing .......................................................... 43

Gambar 4.21 Ploting RF San Juan Training ......................................................... 43

Gambar 4.22 Ploting RF San Juan Testing ........................................................... 44

Page 14: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

xiii Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

Gambar 4.23 Ploting RF Iquitos Training ............................................................ 44

Gambar 4.24 Ploting RF Iquitos Testing .............................................................. 45

Gambar 4.25 Plotting SVR San Juan Training ..................................................... 46

Gambar 4.26 Plotting SVR San Juan Testing ....................................................... 46

Gambar 4.27 Plotting SVR Iquitos Training ........................................................ 47

Gambar 4.28 Plotting SVR Iquitos Testing .......................................................... 47

Gambar 4.29 Plotting XGB San Juan Training .................................................... 48

Gambar 4.30 Plotting XGB San Juan Testing ...................................................... 49

Gambar 4.31 Plotting XGB Iquitos Training ........................................................ 49

Gambar 4.32 Plotting XGB Iquitos Testing ......................................................... 50

Gambar 4.33 Perbandingan Model Training Kota San Juan................................. 51

Gambar 4.34 Hasil Testing Prediksi Kota San Juan ............................................. 52

Gambar 4.35 Perbandingan Model Training Kota Iquitos .................................... 54

Gambar 4.36 Hasil Testing Prediksi Kota Iquitos ................................................. 55

Gambar 4.37 Train-Test Split 20%-80% ............................................................... 59

Gambar 4.38 Train-Test Split 50%-50% ............................................................... 61

Gambar 4.39 Train-Test Split 70%-30% ............................................................... 64

Gambar 4.40 Train-Test Split 80%-20% ............................................................... 66

Gambar 4.41 Train-Test Split 90%-10% ............................................................... 69

Gambar 4.42 Feature Importance kota San Juan.................................................. 70

Gambar 4.43 Feature Importance kota Iquitos ..................................................... 71

Page 15: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

xiv Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

DAFTAR TABEL

Tabel 2.1 Perbandingan metode pada penelitian sebelumnya .............................. 10

Tabel 4.1 Tabel Total kasus dan Populasi Per Tahun Kota San Juan ................... 31

Tabel 4.2 Tabel Total kasus dan Populasi Per Tahun Kota San Juan ................... 32

Tabel 4.3 Sampel hasil testing prediksi total kasus Kota San Juan ...................... 53

Tabel 4.4 MAE Testing Data Kota San Juan ........................................................ 53

Tabel 4.5 Sampel hasil testing prediksi total kasus Kota Iquitos .......................... 56

Tabel 4.6 Testing Data Kota Iquitos ..................................................................... 56

Tabel 4.7 MAE Kota San Juan Train size 20% .................................................... 57

Tabel 4.8 MAE Kota San Juan Test size 80% ....................................................... 58

Tabel 4.9 MAE Kota Iquitos Train size 20% ........................................................ 58

Tabel 4.10 MAE Kota Iquitos Test size 80% ........................................................ 58

Tabel 4.11 MAE Kota San Juan Train size 50% .................................................. 60

Tabel 4.12 MAE Kota San Juan Test size 50% ..................................................... 60

Tabel 4.13 MAE Kota Iquitos Train size 50% ...................................................... 60

Tabel 4.14 MAE Kota Iquitos Test size 50% ........................................................ 61

Tabel 4.15 MAE Kota San Juan Train size 70% .................................................. 62

Tabel 4.16 MAE Kota San Juan Test size 30% ..................................................... 62

Tabel 4.17 MAE Kota Iquitos Train size 70% ...................................................... 63

Tabel 4.18 MAE Kota Iquitos Test size 30% ........................................................ 63

Tabel 4.19 MAE Kota San Juan Train size 80% .................................................. 65

Tabel 4.20 MAE Kota San Juan Test size 20% ..................................................... 65

Tabel 4.21 MAE Kota Iquitos Train size 80% ...................................................... 65

Tabel 4.22 MAE Kota Iquitos Test size 20% ........................................................ 66

Tabel 4.23 MAE Kota San Juan Train size 90% .................................................. 67

Tabel 4.24 MAE Kota San Juan Test size 10% ..................................................... 67

Tabel 4.25 MAE Kota Iquitos Train size 90% ...................................................... 68

Tabel 4.26 MAE Kota Iquitos Test size 10% ........................................................ 68

Page 16: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

75 Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

DAFTAR PUSTAKA

Ariati, J., & Anwar, A. (2014). MODEL PREDIKSI KEJADIAN DEMAM

BERDARAH DENGUE (DBD) BERDASARKAN FAKTOR IKLIM DI

KOTA BOGOR, JAWA BARAT. Buletin Penelitian Kesehatan, 42(4), 249–

256.

Azzahra, M., Darma Setiawan, B., & Pandu Adikara, P. (2018). Optimasi Parameter

Support Vector Regression Dengan Algoritme Genetika Untuk Prediksi Harga

Emas. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 2(1),

2548–2964. Retrieved from http://j-ptiik.ub.ac.id

Batubara, D. A. A. (2017). Hubungan Kelembaban Udara, Suhu Udara, Curah

Hujan dan Kepadatan Penduduk dengan Kejadian Demam Berdarah Dengue

di Kabupaten Deli Serdang Tahun 2011-2014. Universitas Sumatera Utara.

Bhatt, S., Gething, P. W., Brady, O. J., Messina, J. P., Farlow, A. W., Moyes, C. L.,

… Hay, S. I. (2013). The global distribution and burden of dengue. Nature,

496(7446), 504–507. https://doi.org/10.1038/nature12060

Boulesteix, A.-L., Janitza, S., Kruppa, J., & K¨onig, I. R. (2012). Overview of

Random Forest Methodology and Practical Guidance with Emphasis on

Computational Biology and Bioinformatics. In Technical Report Number 129.

https://doi.org/10.1002/biuz.19920220617

Breiman, L. (2001). Random forests. Random Forests, 1–122.

https://doi.org/10.1201/9780429469275-8

Campbell, L. P., Luther, C., Moo-Llanes, D., Ramsey, J. M., Danis-Lozano, R., &

Peterson, A. T. (2015). Climate change influences on global distributions of

dengue and chikungunya virus vectors. Philosophical Transactions of the

Royal Society B: Biological Sciences, 370(1665), 1–9.

https://doi.org/10.1098/rstb.2014.0135

Candraningtyas, S., Safitri, D., & Ispriyanti, D. (2013). Regresi Robust MM-

Estimator Untuk Penanganan Pencilan Pada Regresi Linier Berganda. Jurnal

Gaussian, 2(4), 395–404.

Chen, T., & Guestrin, C. (2016). XGBoost: A Scalable Tree Boosting System

Tianqi. Proceedings of the 22nd ACM SIGKDD International Conference on

Page 17: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

76

Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

Knowledge Discovery and Data Mining, 785–794.

Cheng, F., Yang, C., Zhou, C., Lan, L., Zhu, H., & Li, Y. (2020). Simultaneous

determination of metal ions in zinc sulfate solution using UV–VIS

spectrometry and SPSE-xgboost method. Sensors (Switzerland), 20(17), 1–14.

https://doi.org/10.3390/s20174936

Colón-González, F. J., Lake, I. R., & Bentham, G. (2011). Climate variability and

dengue fever in warm and humid Mexico. American Journal of Tropical

Medicine and Hygiene, 84(5), 757–763.

https://doi.org/10.4269/ajtmh.2011.10-0609

Eliana, M., Nuryani, N., & Nugroho, A. S. (2019). Deteksi Fibrilasi Atrium

Menggunakan FAM yang Dikombinasikan dengan Grid Search. Jurnal

Nasional Teknik Elektro Dan Teknologi Informasi (JNTETI), 8(2), 175.

https://doi.org/10.22146/jnteti.v8i2.507

Focks, D. A., Brenner, R. J., Hayes, J., & Daniels, E. (2000). Transmission

thresholds for dengue in terms of Aedes aegypti pupae per person with

discussion of their utility in source reduction efforts. American Journal of

Tropical Medicine and Hygiene, 62(1), 11–18.

https://doi.org/10.4269/ajtmh.2000.62.11

Han, E. S., Srivastava, A., & Kumar, V. (1996). Parallel Formulations of Inductive

Classi cation Learning Algorithm 1 Introduction 2 Sequential Classi cation

Rule Learning Algorithms.

He, L., Cheng, Y., Li, Y., Li, F., Fan, K., & Li, Y. (2021). An Improved Method

for Soil Moisture Monitoring with Ensemble Learning Methods over the

Tibetan Plateau. IEEE Journal of Selected Topics in Applied Earth

Observations and Remote Sensing, 14, 2833–2844.

https://doi.org/10.1109/JSTARS.2021.3058325

Jayaraj, V. J., Avoi, R., Gopalakrishnan, N., Raja, D. B., & Umasa, Y. (2019).

Developing a dengue prediction model based on climate in Tawau, Malaysia.

Acta Tropica, 197(February), 105055.

https://doi.org/10.1016/j.actatropica.2019.105055

Kemenkes. (2010). Demam Berdarah Dengue. Buletin Jendela Epidemiologi, 2, 48.

Khan, S., Ullah, R., Khan, A., Sohail, A., Wahab, N., Bilal, M., & Ahmed, M.

Page 18: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

77

Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

(2017). Random Forest-Based Evaluation of Raman Spectroscopy for Dengue

Fever Analysis. Applied Spectroscopy, 71(9), 2111–2117.

https://doi.org/10.1177/0003702817695571

Kholedi, A. A. N., Balubaid, O., Milaat, W., Kabbash, I. A., & Ibrahim, A. (2012).

Factors associated with the spread of dengue fever in Jeddah Governorate,

Saudi Arabia. Eastern Mediterranean Health Journal, 15–23.

https://doi.org/10.26719/2012.18.1.15

Leidiyana, H. (2013). Penerapan Algoritma K-Nearest Neighbor Untuk Penentuan

Resiko Kredit Kepemilikan Kendaraan Bermotor. Jurnal Penelitian Ilmu

Komputer, System Embedded & Logic, 1(1), 65–76.

Liaw, A., & Wiener, M. (2002). Classification and Regression by randomForest. R

News, 2(3), 18–22. https://doi.org/10.1177/154405910408300516

Machado, G., Mendoza, M. R., & Corbellini, L. G. (2015). What variables are

important in predicting bovine viral diarrhea virus? A random forest approach.

Veterinary Research, 46(1). https://doi.org/10.1186/s13567-015-0219-7

Mona, M., Kekenusa, J., & Prang, J. (2015). Penggunaan Regresi Linear Berganda

untuk Menganalisis Pendapatan Petani Kelapa. Studi Kasus: Petani Kelapa Di

Desa Beo, Kecamatan Beo Kabupaten Talaud. D’CARTESIAN, 4(2), 196.

https://doi.org/10.35799/dc.4.2.2015.9211

Morin, C. W., Comrie, A. C., & Ernst, K. (2013). Climate and dengue transmission:

Evidence and implications. Environmental Health Perspectives, 121(11–12),

1264–1272. https://doi.org/10.1289/ehp.1306556

Naish, S., Dale, P., Mackenzie, J. S., McBride, J., Mengersen, K., & Tong, S.

(2014). Climate change and dengue: A critical and systematic review of

quantitative modelling approaches. BMC Infectious Diseases, 14(1).

https://doi.org/10.1186/1471-2334-14-167

Nurmahaludin. (2014). Perbandingan Algoritma Particle Swarm Optimization dan

Regresi Pada Peramalan Waktu Beban Puncak. Jurnal Poros Teknik, 6(2).

Permatasari, A. I., & Mahmudy, W. F. (2015). Pemodelan Regresi Linear dalam

Konsumsi Kwh Listrik di Kota Batu Menggunakan Algoritma Genetika.

DORO: Repository Jurnal Mahasiswa PTIIK Universitas Brawijaya, 5(14),

1–9.

Page 19: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

78

Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

Porter, K. R., Beckett, C. G., Kosasih, H., Tan, R. I., Alisjahbana, B., Rudiman, P.

I. F., … Wuryadi, S. (2005). Epidemiology of dengue and dengue hemorrhagic

fever in a cohort of adults living in Bandung, West Java, Indonesia. American

Journal of Tropical Medicine and Hygiene, 72(1), 60–66.

https://doi.org/10.4269/ajtmh.2005.72.60

Prasetyo, S. Y. J., Christianto, Y. B., & Hartomo, K. D. (2019). Analisis Data Citra

Landsat 8 OLI Sebagai Indeks Prediksi Kekeringan Menggunakan Machine

Learning di Wilayah Kabupaten Boyolali dan Purworejo. Indonesian Journal

of Modeling and Computing, 2(2), 25–36. Retrieved from

https://ejournal.uksw.edu/icm/article/view/2954

Purnama, D. I., & Hendarsin, O. P. (2020). Peramalan Jumlah Penumpang

Berangkat Melalui Transportasi Udara di Sulawesi Tengah Menggunakan

Support Vector Regression (SVR). Jambura Journal of Mathematics, 2(2),

49–59. https://doi.org/10.34312/jjom.v2i2.4458

Qi, J., Du, J., Siniscalchi, S. M., Ma, X., & Lee, C. H. (2020). On Mean Absolute

Error for Deep Neural Network Based Vector-to-Vector Regression. IEEE

Signal Processing Letters, 27, 1485–1489.

https://doi.org/10.1109/LSP.2020.3016837

Rakićeví, Z., & Vujoševí, M. (2015). Focus forecasting in supply chain: The case

study of fast moving consumer goods company in Serbia. Serbian Journal of

Management, 10(1), 3–17. https://doi.org/10.5937/sjm10-7075

Rosenbaum, L., Dörr, A., Bauer, M. R., Frankmboeckler, & Zell, A. (2013).

Inferring multi-target qsar models with taxonomy-based multi-task learning.

Journal of Cheminformatics, 5(7). https://doi.org/10.1186/1758-2946-5-33

Smola, A. (1996). Regression estimation with support vector learning machines.

Master’s Thesis, Technische Universit at M Unchen, 1–78. Retrieved from

http://alex.smola.org/papers/1996/Smola96.pdf

Soedarto. (2012). Demam Berdarah Dengue : Dengue Haemorhagic Fever. In

Sagung Seto (Vol. 66).

Tran, B. L., Tseng, W. C., Chen, C. C., & Liao, S. Y. (2020). Estimating the

threshold effects of climate on dengue: A case study of Taiwan. International

Journal of Environmental Research and Public Health, 17(4), 1–17.

Page 20: ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK …

79

Gina Fauziah, 2021

ANALISIS IMPLEMENTASI MACHINE LEARNING UNTUK PREDIKSI JUMLAH KASUS DEMAM BERDARAH DENGUE (DBD) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

https://doi.org/10.3390/ijerph17041392

Tranmer, M., Murphy, J., Elliot, M., & Pampaka, M. (2020). Multiple Linear

Regression (2nd Edition). Cathie Marsh Institute Workin Paper, (01), 59.

Retrieved from https://hummedia.manchester.ac.uk/institutes/cmist/archive-

publications/working-papers/2020/2020-1-multiple-linear-regression.pdf

Tresnawati, L. H., Kusuma, W. A., Wijaya, S. H., & Hasibuan, L. S. (2019).

Asosiasi Single Nucleotide Polymorphism pada Diabetes Mellitus Tipe 2

Menggunakan Random Forest Regression. Jurnal Nasional Teknik Elektro

Dan Teknologi Informasi (JNTETI), 8(4), 320.

https://doi.org/10.22146/jnteti.v8i4.531

Utami, M. P., Fhira Nhita, M. ., & Annisa Aditsania, M. S. (2019). Prediksi

Penyebaran Penyakit Demam Berdarah Dengue (DBD) di Kabupaten

Bandung menggunakan Hybrid Random Forest (RF) dan Genetic Algorithm

(GA). 6(2), 9963–9977.

Wati, S. E., Sebayang, D., & Sitepu, R. (2013). Perbandingan Metode Fuzzzy

Dengan Regresi LInier Berganda Dalam Peramlan Jumlah Produksi. Saintia

Matematika, 1(3), 273–284.

Wirayoga, M. A. (2013). Hubungan kejadian demam berdarah dengue dengan Iklim

di Kota Semarang tahun 2006-2011. Doctoral Dissertation, Universitas

Negeri Semarang.

Yasin, H., Prahutama, A., & Utami, T. W. (2014). Prediksi Harga Saham

Menggunakan Support Vector Regression Dengan Algoritma Grid Search.

Media Statistika, 7(1), 29–35. https://doi.org/10.14710/medstat.7.1.29-35

Zhang, X., & Dai, J. (2021). Comparison of SARIMA and SVR Models in

Predicting Hepatitis Incidence in Tianjin. Operations Research and

Fuzziology, 11(01), 105–112. https://doi.org/10.12677/orf.2021.111013