identifikasi kualitas beras dengan citra · pdf filerice is the staple food which is consumed...

15
i IDENTIFIKASI KUALITAS BERAS DENGAN CITRA DIGITAL MENGGUNAKAN METODE DECISION TREE ITERATIVE DICHOTOMISER TREE (ID3) DAN C4.5 HALAMAN JUDUL SKRIPSI Diajukan untuk memenuhi salah satu syarat mencapai gelar Strata Satu Program Studi Informatika Disusun oleh: ARISSA APRILIA NURCAHYANI M0511010 PROGRAM STUDI INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2016

Upload: dinhhuong

Post on 22-Feb-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

i

IDENTIFIKASI KUALITAS BERAS DENGAN CITRA DIGITAL

MENGGUNAKAN METODE DECISION TREE – ITERATIVE

DICHOTOMISER TREE (ID3) DAN C4.5

HALAMAN JUDUL

SKRIPSI

Diajukan untuk memenuhi salah satu syarat mencapai gelar Strata Satu

Program Studi Informatika

Disusun oleh:

ARISSA APRILIA NURCAHYANI

M0511010

PROGRAM STUDI INFORMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET

SURAKARTA

2016

ii

SKRIPSI

IDENTIFIKASI KUALITAS BERAS DENGAN CITRA DIGITAL

MENGGUNAKAN METODE DECISION TREE – ITERATIVE

DICHOTOMISER TREE (ID3) DAN C4.5

HALAMAN PENGAJUAN

Disusun oleh:

Arissa Aprilia Nurcahyani

M0511010

Ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar

Strata Satu Program Studi Informatika

PROGRAM STUDI INFORMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET

SURAKARTA

2016

iii

HALAMAN PERSETUJUAN

iv

HALAMAN P ENGESA HAN

v

PERSEMBAHAN

Dengan segala rasa syukur, laporan skripsi ini penulis persembahkan kepada:

Bapak Aries Ramelani dan Ibu Suci Nuryani serta adik-adik Hafidha Ainurrahma

dan Indana Alya Mumtaza,

Bapak Ristu Saptono, S.Si, M.T serta Ibu Esti Suryani, S.Si, M.Kom,

Sahabat dan keluarga Informatika khususnya teman seperjuangan angkatan 2011,

Keluarga SAT beserta Staff dan Karyawan UPT TIK UNS,

Bolo Kurowo IPA 1 SMA Negeri 1 Gemolong

vi

MOTTO

“Inna ma’al ‘usri yusroo.”

“Sesungguhnya bersama kesulitan itu ada kemudahan.”

Q.S. Al Insyirah: 6

vii

KATA PENGANTAR

Puji syukur kehadirat Allah SWT yang telah melimpahkan rahmatnya

sehingga penulis dapat menyelesaikan Skripsi dengan judul “Identifikasi Kualitas

Beras dengan Citra Digital Menggunakan Metode Decision Tree – Iterative

Dichotomiser Tree (ID3) dan C4.5”. Laporan Skripsi ini disusun untuk memenuhi

salah satu syarat dalam memperoleh gelar Sarjana Komputer pada Program Studi

Informatika Universitas Sebelas Maret.

Dalam melakukan penelitian dan penyusunan laporan Skripsi ini penulis

telah mendapatkan banyak dukungan dan bantuan dari berbagai pihak. Penulis

mengucapkan terimakasih yang tak terhingga kepada:

1. Bapak dan Ibu serta keluarga yang selalu memberikan dukungan dan

semangat untuk menyelesaikan tugas akhir.

2. Prof. Ir. Ari Handono Ramelan M.Sc. (Hons), Ph.D. selaku Dekan Fakultas

MIPA Universitas Sebelas Maret.

3. Bapak Drs. Bambang Harjito M.APP.Sc, Ph.D. selaku Kepala Program

Studi Informatika Universitas Sebelas Maret.

4. Bapak Ristu Saptono S.Si., M.T. dan Ibu Esti Suryani S.Si., M.Kom. selaku

dosen pembimbing yang telah dengan penuh kesabaran dan ketulusan

memberikan ilmu dan bimbingan terbaik kepada penulis.

5. Para Dosen Program Studi Informatika Universitas Sebelas Maret yang

telah memberikan bekal ilmu kepada penulis.

6. Para Staff dan karyawan serta keluarga SAT UPT. TIK UNS yang telah

mendukung dan berbagi ilmu dalam dalam kuliah dan kerja.

7. Bapak Warsono dan Bapak Eko yang telah banyak membantu dalam

memberikan informasi serta validasi dalam penelitian ini.

Penulis menyadari sepenuhnya bahwa laporan Skripsi ini masih jauh dari

sempurna. Walaupun demikian, semoga tulisan ini dapat memberikan manfaat dan

memberikan wawasan tambahan bagi para pembaca dan khususnya bagi penulis.

Surakarta, Januari 2016

Penulis

viii

IDENTIFIKASI KUALITAS BERAS DENGAN CITRA DIGITAL

MENGGUNAKAN METODE DECISION TREE – ITERATIVE

DICHOTOMISER TREE (ID3) DAN C4.5

ARISSA APRILIA NURCAHYANI

Program Studi Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam,

Universitas Sebelas Maret

ABSTRAK

Beras merupakan makanan pokok yang paling banyak di konsumsi oleh masyarakat

Indonesia. Namun, seiring dengan bertambahnya kebutuhan beras di Indonesia,

harga beras di pasaran justru semakin melonjak dan banyak beredar beras yang

memiliki kualitas kurang baik. Oleh karena itu perlu adanya standar kualitas mutu

dari pihak gudang beras saat mendistribusikan beras. Standar pengujian kualitas

dari pihak Bulog adalah uji laboratorium dan uji visual. Namun, pengujian secara

visual selama ini masih dilakukan secara manual sehingga masih sering terjadi

kesalahan. Oleh karena itu, sistem pengujian secara visual dengan citra digital

dapat menjadi solusi yang efektif untuk permasalahan tersebut. Proses pengujian

dapat dilihat dari nilai putih, bersih, dan utuh beras yang diperoleh melalui

pengolahan citra digital. Nilai bersih dan putih diperoleh dengan menganalisis

nilai HSV, sedangkan nilai utuh diperoleh dengan menganalisis luas region objek.

Sebelumnya, dilakukan training menggunakan 30 data untuk mendapatkan pohon

keputusan ID3 dan C4.5. Data yang telah diperoleh dari pengolahan citra

kemudian diklasifikasi ke dalam 3 kelas yaitu baik, kurang dan buruk menggunakan

pohon keputusan. Hasil evaluasi data klasifikasi dengan metode supplied test

menghasilkan akurasi 100% untuk ID3 dan 83.3% untuk C4.5. Sedangkan

pengujian data dengan k-fold cross validation dengan k=5 didapatkan akurasi

precision 0.969, recall 0.967, f-measure 0.967 untuk metode ID3 dan precision

0.97, recall 0.97, f-measure 0.97 untuk metode C4.5.

Kata Kunci: Pengolahan Citra, Beras, Decision Tree, ID3, C4.5

ix

RICE GRAIN QUALITY IDENTIFICATION WITH DIGITAL IMAGE USING

DECISION TREE – ITERATIVE DICHOTOMISER TREE (ID3) AND C4.5

ARISSA APRILIA NURCAHYANI

Departement of Informatics, Faculty of Mathematics and Natural Science,

Sebelas Maret University

ABSTRACT

Rice is the staple food which is consumed by Indonesian people. However, along

with the increasing of rice demand, the price of rice in the market also increasing,

and then many poor quality rice emerging. Therefore, we need for quality standards

of rice from the rice warehouse while distribute the rice. The Bulog quality testing

standards are laboratory tests and visual tests. However, the visual testing is still

done manually consequently the errors are still occur. Therefore, the visual test

system with digital image can be an effective solution to these problems. The testing

process can be seen from the white, clean, and roundness value of rice acquired

through digital image processing. Clean and white values are obtained by analyzing

the value of HSV, while the value of the roundness is obtained by analyzing the wide

region of the object. Previously, 30 data are used for training to get a decision tree

ID3 and C4.5 model. The image data has been acquired then classified into three

classes i.e., good, fair and poor using the decision tree. The classification data

results that evaluated by supplied test method produces 100% of accuracy for ID3

and 83.3% for C4.5. While testing data by k-fold cross validation with k = 5 obtain

precision 0.969, recall 0.967, f-measure 0.967 for ID3 and precision 0.97, recall

0.97, dan f-measure 0.97 for C4.5.

Keywords: Image Processing, Rice, Decision Tree, ID3, C4.5

x

DAFTAR ISI

HALAMAN JUDUL ................................................................................................ i

HALAMAN PENGAJUAN .................................................................................... ii

HALAMAN PERSETUJUAN ............................................................................... iii

HALAMAN PENGESAHAN ................................................................................ iv

PERSEMBAHAN ................................................................................................... v

MOTTO .................................................................................................................. vi

KATA PENGANTAR ............................................................................................ vii

ABSTRAK ........................................................................................................... viii

ABSTRACT ........................................................................................................... ix

DAFTAR ISI ........................................................................................................... x

DAFTAR TABEL ................................................................................................. xiii

DAFTAR GAMBAR ........................................................................................... xiv

DAFTAR LAMPIRAN ......................................................................................... xv

BAB I PENDAHULUAN ....................................................................................... 1

1.1 Latar Belakang ............................................................................................ 1

1.2 Rumusan Masalah ....................................................................................... 2

1.3 Batasan Masalah .......................................................................................... 2

1.4 Tujuan Penelitian ......................................................................................... 3

1.5 Manfaat Penelitian ....................................................................................... 3

1.6 Sistematika Penulisan .................................................................................. 3

BAB II TINJAUAN PUSTAKA ............................................................................. 4

2.1 Dasar Teori .................................................................................................. 4

2.1.1 Definisi Citra Digital .............................................................................. 4

2.1.2 Pengolahan Citra Digital ........................................................................ 5

2.1.3 Model Warna .......................................................................................... 5

2.1.4 Segmentasi Citra ..................................................................................... 8

2.1.5 Connected Component Labelling ........................................................... 8

2.1.6 Decision Tree ........................................................................................ 10

2.1.7 Iterative Dichotomiser Tree (ID3) ........................................................ 10

2.1.8 C4.5 ...................................................................................................... 14

2.1.9 Distribusi Normal ................................................................................. 16

xi

2.2 Penelitian Terkait ....................................................................................... 17

2.2.1 Quality Evaluation of Rice Using Morphological Methods (Ajay, Suneel,

Kumar, & Prasad, 2013) ....................................................................... 17

2.2.2 Klasifikasi Kualitas Beras Berdasarkan Ciri Fisik Berbasis Pengolahan

Citra Digital (Suminar, Hidayat, & Atmaja, 2012) ............................... 17

2.2.3 Identifikasi Mutu Fisik Beras dengan Menggunakan Teknologi

Pengolahan Citra dan Jaringan Syaraf Tiruan (Somantri, Darmawati, &

Astika, 2013) ........................................................................................ 18

2.2.4 A Comparative Study of Decision tree ID3 and C4.5 (Hssina, Merbouha,

Ezzikouri, & Erritali, 2013) .................................................................. 18

2.2.5 Predicting Students’ Performance Using ID3 and C4.5 Classification

Algorithms (Adhatrao, Gaykar, Dhawan, Jha, & Honrao, 2013) ......... 19

2.3 Rencana Penelitian .................................................................................... 19

BAB III METODOLOGI ...................................................................................... 23

3.1 Pengambilan Data Tekstual ....................................................................... 23

3.2 Penentuan Parameter dan Standar Kualitas Beras ..................................... 24

3.3 Akuisisi Data Citra Digital ........................................................................ 25

3.4 Segmentasi Citra ....................................................................................... 25

3.5 Ekstraksi Ciri dan Identifikasi ................................................................... 27

3.5.1 Analisis Jumlah Bulir Beras ................................................................. 27

3.5.2 Analisis Nilai Putih Beras .................................................................... 28

3.5.3 Analisis Nilai Bersih Beras................................................................... 30

3.5.4 Analisis Nilai Utuh Beras ..................................................................... 32

3.6 Training Data Tekstual .............................................................................. 33

3.7 Klasifikasi Kualitas Beras ......................................................................... 33

3.8 Evaluasi ..................................................................................................... 34

BAB IV HASIL DAN PEMBAHASAN .............................................................. 36

4.1 Pengambilan Data Tekstual ....................................................................... 36

4.2 Penentuan Parameter ................................................................................. 36

4.2.1 Parameter Nilai Utuh dan Noise ........................................................... 36

4.2.2 Parameter Nilai Putih ........................................................................... 37

xii

4.2.3 Parameter Nilai Bersih.......................................................................... 38

4.3 Segmentasi Citra ....................................................................................... 39

4.4 Ekstraksi Ciri dan Identifikasi ................................................................... 40

4.4.1 Analisis Jumlah Bulir Beras ................................................................. 40

4.4.2 Analisis Nilai Putih Beras .................................................................... 40

4.4.3 Analisis Nilai Bersih Beras................................................................... 41

4.4.4 Analisis Nilai Utuh Beras ..................................................................... 42

4.5 Pelatihan Data Tekstual ............................................................................. 43

4.6 Klasifikasi Kualitas Beras ......................................................................... 44

4.7 Pembahasan ............................................................................................... 45

4.7.1 Data Hasil Identifikasi Citra ................................................................. 45

4.7.2 Pohon Keputusan ID3 dan C4.5 ........................................................... 46

4.7.3 Evaluasi ................................................................................................ 47

BAB V KESIMPULAN DAN SARAN ................................................................ 50

5.1 Kesimpulan ................................................................................................ 50

5.2 Saran .......................................................................................................... 50

DAFTAR PUSTAKA ............................................................................................ 51

LAMPIRAN .......................................................................................................... 54

xiii

DAFTAR TABEL

Tabel 2.1. Data klasifikasi ..................................................................................... 11

Tabel 2.2. Pemilihan root ...................................................................................... 12

Tabel 2.3. Pemilihan node 1.1 .............................................................................. 13

Tabel 2.4. Keterkaitan penelitian dengan penelitian sebelumnya ........................ 20

Tabel 3.1. Tabel parameter kualitas beras ............................................................. 24

Tabel 3.2. Confucion matrix hasil klasifikasi ....................................................... 35

Tabel 4.1. Susunan kombinasi data tekstual ......................................................... 36

Tabel 4.2. Penentuan parameter keutuhan dan noise ............................................ 37

Tabel 4.3. Penentuan parameter HSV nilai putih ................................................. 37

Tabel 4.4. Penentuan batas nilai putih .................................................................. 38

Tabel 4.5. Penentuan parameter HSV nilai bersih ................................................ 38

Tabel 4.6. Hasil analisis jumlah bulir beras .......................................................... 40

Tabel 4.7. Hasil analisis nilai putih beras ............................................................. 41

Tabel 4.8. Hasil analisis nilai bersih beras ............................................................ 42

Tabel 4.9. Hasil analisis nilai utuh beras .............................................................. 42

Tabel 4.10. Contoh hasil klasifikasi...................................................................... 44

Tabel 4.11. Data informasi kualitas per bulir beras .............................................. 46

Tabel 4.12. Tabel akurasi k-fold cross validation metode ID3 ............................. 48

Tabel 4.13. Tabel akurasi k-fold cross validation metode C4.5 ............................ 48

Tabel 4.14. Hasil pengujian ID3 ........................................................................... 49

Tabel 4.15. Hasil pengujian C4.5 ......................................................................... 49

xiv

DAFTAR GAMBAR

Gambar 2.1. Aturan koordinat citra digital ........................................................... 4

Gambar 2.2. Struktur warna RGB ......................................................................... 6

Gambar 2.3. Struktur warna HSV ......................................................................... 6

Gambar 2.4. Citra grayscale ................................................................................. 7

Gambar 2.5. Representasi citra biner ..................................................................... 7

Gambar 2.6. Labelling objek ................................................................................ 9

Gambar 2.7. Pohon keputusan tahap awal ........................................................... 13

Gambar 2.8. Hasil akhir pohon keputusan .......................................................... 14

Gambar 2.9. Kurva distribusi normal .................................................................. 16

Gambar 3.1. Diagram alir metodologi penelitian ................................................ 23

Gambar 3.2. Standar beras berkualitas baik. ....................................................... 24

Gambar 3.3. Data gambar beras. ......................................................................... 25

Gambar 3.4. Diagram alir segmentasi citra biner ................................................ 26

Gambar 3.5. Diagram alir hitung jumlah beras ................................................... 28

Gambar 3.6. Diagram alir analisis nilai putih beras ............................................ 29

Gambar 3.7. Diagram alir analisis nilai bersih beras ........................................... 31

Gambar 3.8. Diagram alir analisis nilai utuh beras ............................................. 33

Gambar 3.9. Diagram alir klasifikasi kualitas beras ............................................ 34

Gambar 4.1. Proses segmentasi citra biner .......................................................... 39

Gambar 4.2. Pohon keputusan ID3 ...................................................................... 43

Gambar 4.3. Pohon keputusan C4.5 .................................................................... 44

Gambar 4.4. Citra hasil labelling jumlah beras ................................................... 45

Gambar 4.5. Pohon keputusan ID3 ...................................................................... 47

Gambar 4.3. Pohon keputusan C4.5 .................................................................... 47

xv

DAFTAR LAMPIRAN

Lampiran 1. Kombinasi Data Tekstual ................................................................ 54

Lampiran 2. Data Informasi Beras Standar ......................................................... 55

Lampiran 3. Hasil Pengujian dengan Sistem ...................................................... 57

Lampiran 4. Tampilan Aplikasi ........................................................................... 60