laporan tugas besar bdt algoritma c4.5
TRANSCRIPT
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
1/39
BAB I
PENDAHULUAN
A. LATAR BELAKANG
Di dalam kehidupan manusia sehari-hari, manusia selalu dihadapkan oleh
berbagai macam masalah dari berbagai macam bidang. Masalah-masalah yang
dihadapi oleh manusia memiliki tingkatkesulitan dan kompleksitas yang sangat
bervariasi, mulai dari masalah yang teramat sederhana dengan sedikit faktor-faktor
yang terkait, sampai dengan masalah yang sangat rumit dengan banyak sekali faktor-
faktor yang terkait dan perlu untuk diperhitungkan.Untuk menghadapi masalah-
masalah ini, manusia mulai mengembangkan sebuah sistem yang dapat membantu
manusia agar dapat dengan mudah mampu untuk menyelesaikan masalah-masalah
tersebut.Kami menggunakan Algoritma C.! dalam pengolahan data mahasis"a
#$M%K &alangka 'aya. #edangkan untuk membuat pohon keputusannya kami
menggunakan aplikasi ()KA dengan algoritma *+. Adapun pohon keputusan ini
adalah sebuah a"aban akan sebuah sistem yang harus di kembangkan untuk
membantu mencari dan membuat keputusan dalam masalah-masalah tersebut dan
dengan memperhitungkan berbagai macam faktor yang ada di dalam lingkup
masalah tersebut. Dengan pohon keputusan, manusia dapat dengan mudah
mengidentifikasi dan melihat hubungan antara faktor-faktor yang mempengaruhi
suatu masalah dan dapat mencari penyelesaian terbaik dengan memperhitungkan
faktor-faktor tersebut.Dalam pengolahan data ini kami mengklasifikasikan data mahasis"a #$M%K
&alangka 'aya menadi beberapa atribut yaitu nomor urut, enis kelamin, urusan,
kelas, dan agama. amun, nilai hasil yang akan kami kemukaan dalam analisis ini
adalah membuat pohon keputusan mengenai mayoritas agamanya sehingga atribut
agama dicantumkan sebagai atribut hasil.
B. RUMUSAN MASALAH
Dalam analisis ini, masalah pokok yang akan kami ungkapkan adalah mengetahui
agama apa yang menadi mayoritas dalam lingkungan #$M%K &alangka 'aya
berdasarkan data mahasis"a. #ecara lebih khusus masalah penelitian ini dirumuskan
sebagai berikut
/
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
2/39
/. 0agaimana cara menemukan mayoritas agama yang dimiliki oleh mahasis"a
#$M%K &alangka 'aya dengan algoritma C.! berdasarkan atribut kelas,
urusan, enis kelamin, dan nomor urut1
2. 0agaimana cara membuat pohon keputusannya menggunakan algoritma *+ danseperti apa tampilan pohonnya1
C. TUJUAN DAN MANFAAT
Analisis ini bertuuan untuk/. Mengetahui mayoritas agama di lingkungan #$M%K &alangka 'aya berdasarkan
data mahasis"a.2. Memberikan tampilan desicion tress mayoritas agama mahasis"a #$M%K
&alangka 'aya.
Manfaat dari analisis ini adalah
/. Memberi kemudahan dalam mengambil keputusan tentang mayoritas agama di
#$M%K &alangka 'aya2. 3asil pemaparan analisis ini dapat diadikan bahan pembelaaran bagi rekan-
rekan pembaca agar dapat memahami proses pengolahan pohon keputusan
dengan algoritma C.!
BAB II
LANDASAN TEORI
A. POHON KEPUTUSAN (DECISION TRESS)
2
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
3/39
/. #earah &ohon Keputusan
Di dalam kehidupan manusia sehari-hari, manusia selalu dihadapkan oleh
berbagai macam masalah dari berbagai macam bidang. Masalah-masalah yang
dihadapi oleh manusia memiliki tingkat kesulitan dan kompleksitas yang sangat
bervariasi, mulai dari masalah yang teramat sederhana dengan sedikit faktor-
faktor yang terkait, sampai dengan masalah yang sangat rumit dengan banyak
sekali faktor-faktor yang terkait dan perlu untuk diperhitungkan. Untuk
menghadapi masalahmasalah ini, manusia mulai mengembangkan sebuah sistem
yang dapat membantu manusia agar dapat dengan mudah mampu untuk
menyelesaikan masalah-masalah tersebut.
Adapun pohon keputusan ini adalah sebuah a"aban akan sebuah sistemyang manusia kembangkan untuk membantu mencari dan membuat keputusan
untuk masalah-masalah tersebut dan dengan memperhitungkan berbagai macam
faktor yang ada di dalam lingkup masalah tersebut. Dengan pohon keputusan,
manusia dapat dengan mudah mengidentifikasi dan melihat hubungan antara
faktor-faktor yang mempengaruhi suatu masalah dan dapat mencari penyelesaian
terbaik dengan memperhitungkan faktor-faktor tersebut.
&ohon keputusan ini uga dapat menganalisa nilai resiko dan nilai suatu
informasi yang terdapat dalam suatu alternatif pemecahan masalah. &eranan
pohon keputusan sebagai alat bantu dalam mengambil keputusan 4decision
support tool5 telah dikembangkan oleh manusia seak perkembangan teori pohon
yang dilandaskan pada teori graf. Kegunaan pohon keputusan yang sangat
banyak ini membuatnya telah dimanfaatkan oleh manusia dalam berbagai
macam sistem pengambilan keputusan.
2. &engertian &ohon Keputusan
&ohon dalam analisis pemecahan masalah pengambilan keputusan adalah
pemetaan mengenai alternatif-alternatif pemecahan masalah yang dapat diambil
dari masalah tersebut. &ohon tersebut uga memperlihatkan faktor-faktor
kemungkinan6probablitas yang akan mempengaruhi alternatif-alternatif
keputusan tersebut, disertai dengan estimasi hasil akhir yang akan didapat bila
kita mengambil alternatif keputusan tersebut.
7
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
4/39
7. Manfaat &ohon Keputusan
&ohon keputusan adalah salah satu metode klasifikasi yang paling
populer karena mudah untuk diinterpretasi oleh manusia. &ohon keputusan
adalah model prediksi menggunakan struktur pohon atau struktur berhirarki.
Konsep dari pohon keputusan adalah mengubah data menadi pohon keputusan
dan aturan-aturan keputusan. Manfaat utama dari penggunaan pohon keputusan
adalah kemampuannya untuk mem-break downproses pengambilan keputusan
yang kompleks menadi lebih simpel sehingga pengambil keputusan akan lebih
menginterpretasikan solusi dari permasalahan.
&ohon Keputusan uga berguna untuk mengeksplorasi data, menemukanhubungan tersembunyi antara seumlah calon variabel input dengan sebuah
variabel target. &ohon keputusan memadukan antara eksplorasi data dan
pemodelan, sehingga sangat bagus sebagai langkah a"al dalam proses
pemodelan bahkan ketika diadikan sebagai model akhir dari beberapa teknik
lain. #ering teradi ta"ar mena"ar antara keakuratan model dengan transparansi
model. Dalam beberapa aplikasi, akurasi dari sebuah klasifikasi atau prediksi
adalah satu-satunya hal yang ditonolkan, misalnya sebuah perusahaan direct
mail membuat sebuah model yang akurat untuk memprediksi anggota mana
yang berpotensi untuk merespon permintaan, tanpa memperhatikan bagaimana
atau mengapa model tersebut bekera.
. Kelebihan &ohon Keputusan
Kelebihan dari metode pohon keputusan adalah
a5 Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat
global, dapat diubah menadi lebih simpel dan spesifik.b5 )liminasi perhitungan-perhitungan yang tidak diperlukan, karena ketika
menggunakan metode pohon keputusan maka sample diui hanya
berdasarkan kriteria atau kelas tertentu.c5 8leksibel untuk memilih fitur dari internal node yang berbeda, fitur yang
terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain
dalam node yang sama.
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
5/39
d5 Kefleksibelan metode pohon keputusan ini meningkatkan kualitas keputusan
yang dihasilkan ika dibandingkan ketika menggunakan metode
penghitungan satu tahap yang lebih konvensional.
e5 Dalam analisis multivariat, dengan kriteria dan kelas yang umlahnya sangatbanyak, seorang pengui biasanya perlu untuk mengestimasikan baik itu
distribusi dimensi tinggi ataupun parameter tertentu dari distribusi kelas
tersebut. Metode pohon keputusan dapatf5 menghindari munculnya permasalahan ini dengan menggunakan criteria
yang umlahnya lebih sedikit pada setiap node internal tanpa banyak
mengurangi kualitas keputusan yang dihasilkan.
!. Kekurangan &ohon Keputusana5 $eradi overlap terutama ketika kelas-kelas dan criteria yang digunakan
umlahnya sangat banyak. 3al tersebut uga dapat menyebabkan
meningkatnya "aktu pengambilan keputusan dan umlah memori yang
diperlukan.b5 &engakumulasian umlah eror dari setiap tingkat dalam sebuah pohon
keputusan yang besar.c5 Kesulitan dalam mendesain pohon keputusan yang optimal.d5 3asil kualitas keputusan yang didapatkan dari metode pohon keputusan
sangat tergantung pada bagaimana pohon tersebut didesain.
B. ALGORITMA C4.5
Algoritma C.! adalah algoritma klasifikasi data dengan teknik pohon
keputusan yang terkenal dan disukai karena memiliki kelebihan-kelebihan.
Kelebihan ini misalnya dapat mengolah data numerik 4kontinyu5 dan diskret, dapat
menangani nilai atribut yang hilang, menghasilkan aturan-aturan yang mudah
diintrepetasikan dan tercepat diantara algoritma-algoritma yang lain. Keakuratan
prediksi yaitu kemampuan model untuk dapat memprediksi label kelas terhadap data
baru atau yang belum diketahui sebelumnya dengan baik. Dalam hal kecepatan atau
efisiensi "aktu komputasi yang diperlukan untuk membuat dan menggunakan
model. Kemampuan model untuk memprediksi dengan benar "alaupun data ada
nilai dari atribut yang hilang. Dan uga skalabilitas yaitu kemampuan untuk
membangun model secara efisien untuk data berumlah besar 4aspek ini akan
!
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
6/39
mendapatkan penekanan5. $erakhir interpretabilitas yaitu model yang dihasilkan
mudah dipahami.
Dalam algoritma C.! untuk membangun pohon keputusan hal pertama
yang dilakukan yaitu memilih atribut sebagai akar. Kemudian dibuat cabang untuk
tiap-tiap nilai didalam akar tersebut. 9angkah berikutnya yaitu membagi kasus
dalam cabang. Kemudian ulangi proses untuk setiap cabang sampai semua kasus
pada cabang memiliki kelas yang sama.
Untuk memilih atribut dengan akar, didasarkan pada nilai gain tertinggi dari
atribut-tribut yang ada. Untuk menghitung gain digunakan rumus sebagai berikut
:ain4#,A5 ; )ntropy 4#5 < i=1
n |Si||S|Entropy (Si)
Dengan # 3impunan kasusA Atributn *umlah partisi atribut A=#i= *umlah kasus pada partisi ke i=#= *umlah kasus dalam #
#ehingga akan diperoleh nilai gain dari atribut yang paling tertinggi. :ain
adalah salah satu atribute selection measure yang digunakan untuk memilih test
atribute tiap node pada tree. Atribut dengan information gain tertinggi dipilih
sebagai test atribut dari suatu node. #ementara itu, penghitungan nilai entropi dapat
dilihat pada persamaan
)ntropy 4#5 ; i=1
n
Pilog2Pi
Dengan # 3impunan kasusA 8itur n *umlah pertisi #&i &roporsi dari #i terhadap #
)ntropy adalah ukuran dari sebuah ketidakpastian dengan variabel yang
random 4acak5. Dalam hal stored instances, maka entropy adalah ukuran
ketidakpastian dari attribute.
>
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
7/39
C. STMIK PALANGKA RAYA
#ekolah $inggi Manaemen %nformatika dan Komputer 4#$M%K5
&alangkaraya yang dulunya bernama AM%K &alangkaraya, merupakan &erguruan
$inggi %nformatika dan Komputer yang pertama di Kalimantan $engah khususnya di
Kota Cantik &alangka 'aya. 0erdiri sesuai dengan iin yang dikeluarkan oleh Diren
Dikti Depdikbud omor ?@+6D66/BB!, tanggal 2+ #eptember /BB! dan iin
perubahan status menadi #$M%K &alangkaraya dari Menteri &endidikan asional
'epublik %ndonesia omor @/6D662??@ tanggal 2 Mei 2??@.
$anggal %in &erubahan #tatus dari AM%K &alangkaraya menadi #$M%K
&alangkaraya itulah yang diadikan sebagai tanggal untuk memperingati Diesatalis #$M%K &alangkaraya selanutnya.
D. WEKA DAN ALGORITMA J48
/. ()KA(eka adalah aplikasi data mining open source berbasis ava.Aplikasi ini
dikembangkan pertama kali oleh Universitas (aikato di #elendia 0aruse belum
menadi bagian dari &entaho.(eka terdiri dari koleksi algoritma machine
learning yang dapat digunakan untuk melakukan generalisasi6 formulasi dari
sekumpulan data sampling. (alaupun kekuatan "eka terletak pada algoritma
yang makin lengkap dan canggih, kesuksesan data mining tetap terletak pada
factor pengetahuan manusia implementornya. $ugas pengumpulan data yang
berkualitas tinggi dan pengetahuan permodelan dan penggunaan algoritma yang
tepat diperlukan untuk menamin ke akuratan formulasi yang diharapkan.
)mpat tombol diatas dapat digunakan untuk menalankan aplikasi
/. )plorer digunakan untuk menggali lebih auh data dengan aplikasi ()KA
@
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
8/39
2. )perimenter digunakanuntukmelakukanpercobaandenganpenguian statistic
skemabelaar7. Kno"ledge 8lo" digunakan untuk pengetahuan pendukung. #imple C9% antarmuka dengan menggunakan tampilan command-line yang
memungkinkan langsung mengeksekusi perintah "eka untuk #istem perasi
yang tidak menyediakan secara langsung.
+
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
9/39
BAB III
ANALISIS DAN HASIL
Untuk mendapatkan hasil analisa yang tepat digunakan tiga metode dalam
pengeraannya. Metode yang digunakan dalam analisis ini adalah perhitungan algoritma
C.! menggunakan perhitungan manual dan Microsoft ecel. Kemudian hasil analisis
akan dibuktikan dengan menggunakan aplikasi ()KA untuk menampilkan pohon
keputusannya.
A. ALGORITMA C4.5
#$M%K palangkaraya memiliki total mahasis"a pada tahun 2?/?-2?//adalah sebesar ?7 orang. $erdiri dari urusan $%, M%, #% dan memiliki kelas untuk
$% 4kelas A, kelas 0, kelas C, dan kelas D5, #% 4Kelas A dan kelas 05, dan M% 4Kelas
A dan kelas 05.0erikut ini adalah tabel data mahasis"a angkatan tahun 2?/?-2?// yang telah kami
ambil beberapa data atributnya untuk kami analisis.
No.JURUSAN
KELAS L/P
AGAMA
1 TI A L ISLAM
2 TI A
LKRIST
EN
3 TI A L ISLAM
4 TI A
LKRIST
EN
5 TI A L ISLAM
6 TI A
LKRIST
EN
7 TI A L ISLAM
8 TI A L ISLAM
9 TI A
L
KRIST
EN10 TI A L ISLAM
11 TI A L ISLAM
12 TI A L KRIST
EN
13 TI A L ISLAM
14 TI A L ISLAM
15 TI A L ISLAM
16 TI A
LKRIST
EN
B
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
10/39
17 TI A
LKRIST
EN
18 TI A P ISLAM
19 TI A
LKRIST
EN
20 TI A
LKRIST
EN
21 TI A L ISLAM
22 TI A L ISLAM
23 TI A
LKRIST
EN
24 TI A L ISLAM
25 TI A
LKRIST
EN
26 TI A
LKRIST
EN
27 TI A
LKRIST
EN
28 TI A L ISLAM
29 TI A
LKATOL
IK
30 TI A L ISLAM
31 TI A L ISLAM
32 TI A L ISLAM
33 TI A L ISLAM
34 TI A L ISLAM
35 TI A L ISLAM
36 TI A
PKRIST
EN
37 TI A
PKRIST
EN
38 TI A P ISLAM
39 TI A P ISLAM
40 TI A P ISLAM
41 TI A
PKRIST
EN
42 TI A P ISLAM
43 TI A P KRISTEN
44 TI A P ISLAM
45 TI A P ISLAM
46 TI A P ISLAM
47 TI A P ISLAM
48 TI A P ISLAM
49 TI B L ISLAM
50 TI B L ISLAM
51 TI B
LKRIST
EN
/?
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
11/39
52 TI B
LKRIST
EN
53 TI B
LKRIST
EN
54 TI B L ISLAM
55 TI B
LKRIST
EN
56 TI B L ISLAM
57 TI B L ISLAM
58 TI B L ISLAM
59 TI B L HINDU
60 TI B L ISLAM
61 TI B L ISLAM
62 TI B L ISLAM
63 TI B L ISLAM
64 TI B
LKRIST
EN
65 TI B L ISLAM
66 TI B L ISLAM
67 TI B L ISLAM
68 TI B L HINDU
69 TI B
LKRIST
EN
70 TI B
LKRIST
EN
71 TI B L ISLAM
72 TI B L ISLAM
73 TI B
LKRIST
EN
74 TI B L ISLAM
75 TI B L ISLAM
76 TI B L ISLAM
77 TI B L ISLAM
78 TI B L ISLAM
79 TI B L ISLAM
80 TI B L ISLAM
81 TI B L ISLAM82 TI B L ISLAM
83 TI B
LKRIST
EN
84 TI B L ISLAM
85 TI B
LKATOL
IK
86 TI B P ISLAM
87 TI B P ISLAM
88 TI B P ISLAM89 TI B P KRIST
//
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
12/39
EN
90 TI B P ISLAM
91 TI B P ISLAM
92 TI
B
P
KRIST
EN93 TI B P ISLAM
94 TI B P ISLAM
95 TI B P ISLAM
96 TI B
PKRIST
EN
97 TI B P ISLAM
98 TI B
PKRIST
EN
99 TI C L ISLAM
100 TI C
L
KRIST
EN101 TI C L ISLAM
102 TI C L HINDU
103 TI C L ISLAM
104 TI C L ISLAM
105 TI C L HINDU
106 TI C L ISLAM
107 TI C
LKRIST
EN
108 TI C L ISLAM
109 TI C L
KRIST
EN
110 TI C
LKRIST
EN
111 TI C
LKATOL
IK
112 TI C
LKRIST
EN
113 TI C
LKRIST
EN
114 TI C
LKRIST
EN
115 TI C L ISLAM116 TI C L HINDU
117 TI C
LKRIST
EN
118 TI C
LKRIST
EN
119 TI C
LKRIST
EN
120 TI C
LKRIST
EN121 TI C L KRIST
/2
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
13/39
EN
122 TI C
LKRIST
EN
123 TI C
LKRIST
EN
124 TI C L ISLAM
125 TI C
LKRIST
EN
126 TI C L ISLAM
127 TI C L ISLAM
128 TI C
LKRIST
EN
129 TI C
LKRIST
EN
130 TI C L ISLAM
131 TI C
L ISLAM132 TI C L ISLAM
133 TI C
LKRIST
EN
134 TI C L ISLAM
135 TI C L ISLAM
136 TI C
PKRIST
EN
137 TI C P ISLAM
138 TI C P HINDU
139 TI
C
P
KRIST
EN
140 TI C
PKRIST
EN
141 TI C P HINDU
142 TI C
PKRIST
EN
143 TI C
PKRIST
EN
144 TI C
PKRIST
EN
145 TI C
PKRIST
EN
146 TI C
PKRIST
EN
147 TI C P ISLAM
148 TI C
PKRIST
EN
149 TI D L ISLAM
150 TI D L ISLAM
151 TI D L ISLAM
152 TI D
LKRIST
EN
/7
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
14/39
153 TI D
LKRIST
EN
154 TI D
LKRIST
EN
155 TI D LKRIST
EN
156 TI D
LKRIST
EN
157 TI D
LKRIST
EN
158 TI D
LKRIST
EN
159 TI D
LKRIST
EN
160 TI D L ISLAM
161 TI D
L
KATOL
IK
162 TI D
LKRIST
EN
163 TI D L ISLAM
164 TI D
LKRIST
EN
165 TI D
LKRIST
EN
166 TI D L ISLAM
167 TI D L HINDU
168 TI D L ISLAM
169 TI D
LKRIST
EN
170 TI D L ISLAM
171 TI D
LKRIST
EN
172 TI D
LKRIST
EN
173 TI D
LKRIST
EN
174 TI D
LKRIST
EN
175 TI D L ISLAM
176 TI D L ISLAM
177 TI D L ISLAM
178 TI D
LKRIST
EN
179 TI D L ISLAM
180 TI D L ISLAM
181 TI D
LKRIST
EN
182 TI D L ISLAM
183 TI D L HINDU
/
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
15/39
184 TI D
LKRIST
EN
185 TI D L ISLAM
186 TI D
PKRIST
EN
187 TI D
LKATOL
IK
188 TI D
PKRIST
EN
189 TI D
PKRIST
EN
190 TI D P HINDU
191 TI D
PKRIST
EN
192 TI D P ISLAM
193 TI D P
KRIST
EN
194 TI D
PKRIST
EN
195 TI D P HINDU
196 TI D
PKRIST
EN
197 TI D
PKRIST
EN
198 SI A
LKRIST
EN
199 SI A L ISLAM
200 SI A L ISLAM201 SI A L ISLAM
202 SI A
LKRIST
EN
203 SI A L ISLAM
204 SI A L ISLAM
205 SI A
LKRIST
EN
206 SI A L ISLAM
207 SI A
LKATOL
IK
208 SI A
LKRIST
EN
209 SI A L ISLAM
210 SI A L ISLAM
211 SI A L ISLAM
212 SI A L ISLAM
213 SI A L ISLAM
214 SI A
LKRIST
EN
215 SI A L ISLAM
/!
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
16/39
216 SI A
LKRIST
EN
217 SI A L ISLAM
218 SI A L ISLAM
219 SI A L KRISTEN
220 SI A L ISLAM
221 SI A
LKATOL
IK
222 SI A L ISLAM
223 SI A L ISLAM
224 SI A
LKRIST
EN
225 SI A L ISLAM
226 SI
A
L
KRIST
EN
227 SI A
LKRIST
EN
228 SI A
LKRIST
EN
229 SI A
LKRIST
EN
230 SI A
PKRIST
EN
231 SI A P ISLAM
232 SI A P ISLAM
233 SI A P
KRIST
EN234 SI A P ISLAM
235 SI A P ISLAM
236 SI A
PKRIST
EN
237 SI A
PKRIST
EN
238 SI A
PKRIST
EN
239 SI A P HINDU
240 SI A P HINDU
241 SI A P ISLAM
242 SI A
PKRIST
EN
243 SI A P ISLAM
244 SI A P ISLAM
245 SI A P ISLAM
246 SI A
PKATOL
IK
247 SI A
PKRIST
EN
/>
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
17/39
248 SI A
PKRIST
EN
249 SI A
LKRIST
EN
250 SI A LKRIST
EN
251 SI B L HINDU
252 SI B L ISLAM
253 SI B
LKRIST
EN
254 SI B L ISLAM
255 SI B L ISLAM
256 SI B L HINDU
257 SI B L ISLAM
258 SI
B
L
KRIST
EN259 SI B L ISLAM
260 SI B L ISLAM
261 SI B
LKRIST
EN
262 SI B L ISLAM
263 SI B L ISLAM
264 SI B
LKRIST
EN
265 SI B L ISLAM
266 SI
B
L
KRIST
EN267 SI B L ISLAM
268 SI B
LKRIST
EN
269 SI B L ISLAM
270 SI B
LKRIST
EN
271 SI B L ISLAM
272 SI B L KRIST
EN
273 SI B L ISLAM
274 SI B L KRISTEN
275 SI B
LKRIST
EN
276 SI B
LKRIST
EN
277 SI B
LKRIST
EN
278 SI B
LKRIST
EN
279 SI B
LKRIST
EN
/@
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
18/39
280 SI B
LKRIST
EN
281 SI B
LKRIST
EN
282 SI B L ISLAM
283 SI B P ISLAM
284 SI B
PKRIST
EN
285 SI B
PKRIST
EN
286 SI B P ISLAM
287 SI B P ISLAM
288 SI B P ISLAM
289 SI B P ISLAM
290 SI
B
P
KRIST
EN291 SI B P ISLAM
292 SI B
PKRIST
EN
293 SI B
PKRIST
EN
294 SI B P ISLAM
295 SI B
PKRIST
EN
296 SI B P ISLAM
297 SI B
PKRIST
EN
298 SI B P ISLAM
299 SI B
PKRIST
EN
300 SI B
PKRIST
EN
301 SI B
PKRIST
EN
302 SI B L ISLAM
303 MI A
LKATOL
IK
304 MI A L ISLAM
305 MI A
LKRIST
EN
306 MI A L ISLAM
307 MI A L ISLAM
308 MI A
LKRIST
EN
309 MI A
LKRIST
EN
310 MI A
LKRIST
EN311 MI A L KRIST
/+
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
19/39
EN
312 MI A L ISLAM
313 MI A
LKRIST
EN
314 MI A L ISLAM315 MI A L ISLAM
316 MI A L ISLAM
317 MI A
LKATOL
IK
318 MI A
LKRIST
EN
319 MI A L ISLAM
320 MI A L ISLAM
321 MI A L ISLAM
322 MI A
L
KRIST
EN323 MI A L ISLAM
324 MI A
LKRIST
EN
325 MI A
LKRIST
EN
326 MI A
LKRIST
EN
327 MI A
LKRIST
EN
328 MI A L ISLAM
329 MI A L ISLAM
330 MI A
LKRIST
EN
331 MI A L ISLAM
332 MI A L ISLAM
333 MI A
LKRIST
EN
334 MI A
LKRIST
EN
335 MI A P ISLAM
336 MI A
PKRIST
EN
337 MI A L ISLAM
338 MI A P ISLAM
339 MI A P ISLAM
340 MI A
PKRIST
EN
341 MI A P ISLAM
342 MI A P ISLAM
343 MI A P HINDU
344 MI A P ISLAM
345 MI A P ISLAM
/B
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
20/39
346 MI A
PKRIST
EN
347 MI A
PKRIST
EN
348 MI A P ISLAM
349 MI A P ISLAM
350 MI A P ISLAM
351 MI A
PKATOL
IK
352 MI A
PKRIST
EN
353 MI B L HINDU
354 MI B L ISLAM
355 MI B
LKRIST
EN
356 MI B LKRIST
EN
357 MI B L ISLAM
358 MI B
LKRIST
EN
359 MI B L ISLAM
360 MI B
LKRIST
EN
361 MI B L HINDU
362 MI B
LKRIST
EN
363 MI B L ISLAM
364 MI B
LKRIST
EN
365 MI B
LKATOL
IK
366 MI B
LKRIST
EN
367 MI B
LKRIST
EN
368 MI B L ISLAM
369 MI B
LKRIST
EN
370 MI B
LKRIST
EN
371 MI B
LKRIST
EN
372 MI B L ISLAM
373 MI B L ISLAM
374 MI B L ISLAM
375 MI B L ISLAM
376 MI B
LKRIST
EN
377 MI B L ISLAM
2?
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
21/39
378 MI B
LKRIST
EN
379 MI B L ISLAM
380 MI B
LKRIST
EN
381 MI B
LKRIST
EN
382 MI B
LKRIST
EN
383 MI B
LKRIST
EN
384 MI B
LKRIST
EN
385 MI B L ISLAM
386 MI B P ISLAM
387 MI B P
KRIST
EN388 MI B P ISLAM
389 MI B P ISLAM
390 MI B P ISLAM
391 MI B P ISLAM
392 MI B
PKRIST
EN
393 MI B P HINDU
394 MI B
PKRIST
EN
395 MI B P ISLAM
396 MI B P ISLAM
397 MI B P ISLAM
398 MI B P ISLAM
399 MI B P ISLAM
400 MI B P ISLAM
401 MI B P ISLAM
402 MI B
PKRIST
EN
403 MI B P ISLAM
Dalam kasus yang tertera pada table data mahasis"a, akan dibuat pohon
keputusan untuk menentukan agama dengan melihat nomor urut, urusan, kelas, dan
enis kelamin mahasis"a.#ecara umum algoritma C.! untuk membangun pohon keputusan adalah sebagai
berikut a. &ilih atribut sebagai akarb. 0uat cabang untuk masing-masing nilaic. 0agi kasus dalam cabang
2/
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
22/39
Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari
atribut-atribut yang ada. Untuk menghitung gain digunakan rumus seperti tertera
dalam 'umus.
:ain4#,A5 ; )ntropy 4#5 < i=1
n
|Si||S|Entropy (Si)
Dengan # 3impunan kasusA Atributn *umlah partisi atribut A=#i= *umlah kasus pada partisi ke i=#= *umlah kasus dalam #
#edangkan perhitungan nilai entropy dapat dilihat pada rumus.
)ntropy 4#5 ; i=1
n
Pi
log2Pi
Dengan # 3impunan kasusA 8itur n *umlah pertisi #&i &roporsi dari #i terhadap #
0erikut ini adalah penelasan lebih rinci mengenai masing-masing langkah
dalam pembentukan pohon keputusan dengan menggunakan algoritma C.! untuk
menyelesaikan permasalahan pada tabel data mahasis"a.
a. Menghitung umlah kasus, umlah kasus untuk keputusan %slam, umlah kasus untuk
keputusan Kristen, umlah kasus untuk keputusan 3indu, umlah kasus untuk
keputusan Katolik, dan entropy dari semua kasus dan kasus yang dibagi berdasarkan
atribut nomor urut, urusan, enis kelamin, dan kelas. #etelah itu lakukan
perhitungan :ain untuk masing-masing atribut. 3asil perhitungan ditunukkan oleh
tabel berikut
Tabe N!"e
ode*umlah
Kasus %slam Kristen Katolik 3indu )ntropy :ain
/ $otal ?7 /B+ /@ /2 /B /,7+!>/>
*urusa
n?,??
$% /B@ B@ + ! // /,7B!B2
#% /?! !? + 7 /,7!2?B
M% /?/ !/ 2 /,7B7/!2
Kelas ?,?
22
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
23/39
A /!/ +2 !B @ 7 /,72!+/2
0 /!7 +7 >/ 2 @ /,2B2B@+
C !? /@ 2@ / ! /,!2+@
D B /> 2@ 2 /,+>?
96& ?,?/
9 2@B /7> /22 /? // /,7+7/B@
& /2 >2 !2 2 + /,7@>B/
$ata cara perhitungan untuk mendapatkan nilai pada table node di atas adalah
sebagai berikut
E#$%!&' (T!$a )
;
(198403 x log2( 198403 ))+(174403 x log2(174403 ))+(12403 x log2( 12403 ))+(19403 x log2( 19403 ))(198403 x ( log2 (198 )log2(403 )))+(174403 x ( log2 (174 )log2(403 )))+(12403 x ( log2(12 )log2(403 ))
;
(198
403
x (7,6293578,654636 )
)+
(174
403
x (7,4429438,654636 )
)+
(12
403
x (3,5849638,654636 )
)+
(1
40
; (0,503735 )+ (0,523163 )+ (0,150958 )+ (0,20776 )
; /,7+!>/>
Me#*+,$-#* E#$%!&' J-%-a#
E#$%!&' (TI )
;
(97197 x log2( 9197 ))+(84197 x log2( 84197 ))+(5197x log2( 5197 ))+(11197 x log2( 11197 ));
(97197 x ( log2(97 )log2 (197 )))+(84197 x ( log2(84 )log2 (197 ) ))+(5197x ( log2(5 )log2(197 )))+(11197 x (log2
27
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
24/39
;
(97197 x (6,5999137,622052 ))+(84197 x (6,3923177,622052 ))+(5197 x (2,3219287,622052 ) )+(11197 x
; (0,503287 )+(0,524354 )+ (0,134521 )+ (0,232431 ); /,7B!B2
E#$%!&' (SI )
;
(50105 x log2( 50105 ))+(48105 x log2( 48105 ))+(3105x log2( 3105 ))+(4105x log2( 4105 ));
(50
105 x ( log2 (50 )log2 (105 )))+(
48105
x ( log2 (48 )log2 (105 )))+(3
105x ( log2 (3 )log2(105 )))+(
4105
x ( log2 (
;
(50105 x (5,6438566,714246 ))+(48105 x (5,5849636,714246 ))+(3105 x (1,5849636,714246 ))+(4105 x; (0,509709 )+ (0,516244 )+ (0,146551)+ (0,17959 )
; /,7!2?B
E#$%!&' (MI )
;
(51101 x log2( 51101 ))+(42101 x log2( 42101 ))+(4101x log2( 4101 ))+(4101x log2( 4101 ));
(51101 x (log2(51 )log2(101 )))+(42101 x ( log2(42 )log2 (101 )))+(4101x ( log2(4 )log2(101 )))+(4101x ( log2 (;
(51101 x (5,6724256,65811 ))+(42101 x (5,3923176,65811 ))+( 3105 x (26,65811 ))+( 4105 x (26,65811; (0,497773 )+(0,526411)+(0,184484 )+(0,184484 )
; /,7B7/!2
2
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
25/39
Me#*+,$-#* E#$%!&' Kea
E#$%!&' Kea (A
;
(82151 log2( 82151 ))+(59151 log2( 59151 ))+(7151 log2( 7151 ))+(3151 log2( 3151 ));
(82151 ( log2 (82 )log2 (151 )))+(59151 ( log2(59 )log2(151 )))+(7151 ( log2 (7 )log2(151 )))+(3151 ( log2
;
(82151 (6,3575527,238405 ))+(59151 (5,8826437,238405 ))+(7151 (2,8073557,238403 ))+(3151 (1;
(82151 (0,88085 ))+(59151 (1,35576 ))+(7151 (4,43105 ))+(3151 (5,65344 )); 0,478344+0,529735+0,205413+0,11232
; 1,325812
E#$%!&' Kea (B
;
(
83153
log2( 83153 ))+
(
61153
log2( 61153 ))+
(
2153
log2( 2153 ))+
(
7153
log2( 7153));
(83153 ( log2 (83 )log2(153 )))+(61153 ( log2 (51 )log2 (153 )))+(2153 ( log2 (2 )log2 (153 )))+(7153 ( log2;
(83153 (6,3570397,257388 ))+(61153 (5,9307377,257388 ))+(2153 (17,257388 ))+(7153 (2,8073
2!
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
26/39
;
(83153 (0,88235 ))+(61153 (1,32665 ))+(2153 (6,25739 ))+(7153 (4,45003 )); 0,47866+0,528926+0,081796+0,203596
; 1,292978
E#$%!&' Kea (C
; (1750 log2( 1750 ))+(2750 log2( 2750 ))+(150 log2( 150 ))+(550 log2( 550 ));
(17
50 ( log2 (17 )log2(50 )))+(
1
50 ( log2 (1 ) log2 (50 )))+(
2
50 x (log2(2 )log2(50 )))+(
5
50 ( log2(5 )lo
;
(1750 (4,0874635,643856 ))+(2750 (4,7548885,643856 ))+(150 (05,643856 ))+(550 (2,32192;
(1750 (1,55639 ))+(2750 (0,88897 ))+(150 (5,64386 ))+(550 (3,32193 )); 0,529174+0,480043+0,112877+0,332193
; 1,454287
E#$%!&' Kea (D
; (1649 log2( 1649 ))+(2749 log2( 2749 ))+(249 log2( 249 ))+(449 log2( 449 ));
(1649 ( log2 (16 )log2(49 )))+(2749 ( log2 (27 )log2(49 )))+(249 ( log2 (2 )log2(49 )))+(449 ( log2(4 );
(1649 (45,61471))+(2749 (4,7548885,61471 ))+(249 (15,61471 ))+(449 (25,61471 ))
2>
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
27/39
;
(1649 (1,61471 ))+(2749 (0,85982 ))+(249 (4,61471 ))+(449 (3,61471 )); 0,527252+0,47378+0,188356+0,295078
; 1,484466
Me#*+,$-#* E#$%!&' L/P
E#$%!&' L/P (L
;(136279
x log2( 136279 ))+
;
(136279 x ( log2 (136 )log2(279 )))+(122279 x ( log2 (122 )log2 (279 )))+(10279 x (log2(10 )log2 (279 )))+(;
(136279 x (7,0874638,124121 ))+(122279 x (6,9307378,124121 ))+(10279 x (3,3219288,124121 ));
(136279 x (1,03666 ))+(
122279 x (1,19338 ))+(
10279 x (4,80219 ))+(
12279 x (4,66469 ))
; ?,!?!72! ?,!2/+7+ ?,/@2/22 ?,/+7B/2
; /,7+7/B@
E#$%!&' L/P (L
;
(62
124 x log
2
( 62
124
))+;
(62124 x ( log2 (62 )log2 (124 )))+(52124 x (log2(52 )log2 (124 )))+(2124 x ( log2 (2 )log2(124 )))+(8124 x; /,7B@/7> ?,!2!@>++B7! ?,?B>?7!2 ?,2!!/?B7B
2@
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
28/39
; /,7@>B/
Se0e#$a%a ,$- -#$-1 #,a, Ga,# &a"a ba%, J-%-a# a"aa+ eba*a, be%,1-$)
:ain 4$otal, *urusan5 ; )ntropy 4$otal5 < i=1
n |Jurusani||Total|
xEntropy (Jurusan )
; /, 7+!>/> - (( 197403x1,394592 )+( 105403x1,352094 )+( 101403x 1,393152)); ?,??
Se0e#$a%a ,$- -#$-1 #,a, Ga,# &a"a ba%, Kea a"aa+ eba*a, be%,1-$)
:ain 4$otal, Kelas5 ; )ntropy 4$otal5 < i=1n |Kelasi||Total| xEntropy (Kelas)
; /,7+!>/> -
((151403x 1,325812)+( 153403 x1,292978)+( 503403 x1,454287)+( 49403x 1,484466)); ?,?7@?7B>
; ?,?
Se0e#$a%a ,$- -#$-1 #,a, Ga,# &a"a ba%, L/P a"aa+ eba*a, be%,1-$)
:ain 4$otal, *EKel5 ; )ntropy 4$otal5 < i=1
n |JKel i||Total|
x Entropy(JKel)
; /, 7+!>/> - ((279404 x 1,383197)+( 124403 x1,376914)); ?,?//
; ?,?/
0erdasarkan perhitungan menggunakan algoritma C.! didapatkan bah"a gain
tertinggi adalah kelas.
2+
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
29/39
B. MICROSOFT E2CEL
0erdasarkan dengan tabel Data Mahasis"a #ebelumnya, buat nama area
sesuai dengan ketentuan berikut
/. Cell 0/ sampai 0? diberi nama noEurut, sehingga menadi seperti gambar
diba"ah ini.
2. Cell D/ sampai D? diberi nama urusan, sehingga menadi seperti gambar di
ba"ah ini.
7. Cell )/ sampai )? diberi nama kelas, sehingga menadi seperti gambar di
ba"ah ini.
. Cell 8/ sampai dengan 8? diberi nama Ekel, sehingga menadi seperti
gambar di ba"ah ini.
#etelah itu berdasarkan data pada tabel Data Mahasis"a buat calon
percabangan, adapun calon percabangan yang mungkin teradi dari tabel Data
Mahasis"a adalah
2B
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
30/39
0erikutnya buat tabel untuk menghitung frekuensi yang muncul dari setiap
hasil produk berikut dengan proporsi serta entropynya, sehingga tampak seperti
berikut
0erikut adalah formula-formula yang digunakan untuk mengisi tabel di atas
/. Untuk cell C/7 48rekuensi %slam5;CU$%84agamaF0/75
2. Untuk cell C/ 48rekuensi Kristen5
;CU$%84agamaF0/5
7. Untuk cell C/! 48rekuensi Katolik5;CU$%84agamaF0/!5
. Untuk cell C/> 48rekuensi 3indu5;CU$%84agamaF0/>5
!. Cell C/@ 4$otal 8rekuensi5>. Cell D/7 4&roporsi %slam6pb5
;C/76C/@@. Cell D/ 4&roporsi Kristen6pb5
;C/6C/@+. Cell D/! 4&roporsi Katolik6pb5
;C/!6C/@B. Cell D/> 4&roporsi 3indu6pb5
;C/>6C/@/?. Cell )/7 4%slam6log2pb5
;9:4D/7F25//. Cell )/ 4Kristen6log2pb5
;9:4D/F25/2. Cell )/! 4Katolik6log2pb5
;9:4D/!F25/7. Cell )/> 43indu6log2pb5
7?
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
31/39
;9:4D/>F25/. Cell 8/7 4)ntropy %slam6-pb.log2.pb5
;4-)/75GD/7/!. Cell 8/ 4)ntropy Kristen6-pb.log2.pb5
;4-)/5GD//>. Cell 8/! 4)ntropy Katolik6-pb.log2.pb5;4-)/!5GD/!
/@. Cell 8/> 4)ntropy 3indu6-pb.log2.pb5;4-)/>5GD/>
/+. Cell 8/@ 4$otal )ntropy5;#UM48/78/>5
0erikutnya kita akan menghitung :ain dari masing-masing criteria untuk mencari
gain tertinggi yang akan diadikan cabang keputusan, untuk itu digunakan bantuan
tabel seperti di ba"ah ini
Cabang I!a
"K#$%&n
Ka%'!$(
H$n)*
P+I!a",
P+K#$%&n,
P+Ka%-'!$(,
P+H$n)*,
.P+I!a"
, L'g2
P+I!a",
.P+K#$%&
n, L'g2
P+K#$%&n,
.P+Ka%'!$
(, L'g2
P+Ka%'!$(,
.P+H$n)*
, L'g2
P+H$n)*,
1*#*an TI 97 84 5 11 049 043 003 006 050 052 013 023
*#*an SI 50 48 3 4 048 046 003 004 051 052 015 018
*#*an
MI 51 42 4 4 050 042 004 004 050 053 018 018
2 K&!a A 82 59 7 3 054 039 005 002 048 053 021 011
K&!a B 83 61 2 7 054 040 001 005 048 053 008 020
K&!a C 17 27 1 5 034 054 002 010 053 048 011 033
K&!a D 16 27 2 4 033 055 004 008 053 047 019 030
3 LP L136
122 10 11 049 044 004 004 051 052 017 018
LP P 62 52 2 8 050 042 002 006 050 053 010 026
Adapun formula tabel di atas adalah sebagai berikut
7/
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
32/39
/. Cell )/B 4produk dengan hasil islam pada urusan $%5;CU$%8#4urusanFD2?FagamaFH)H/B5
2. Cell %2? 4&roporsi produk dengan hasil islam terhadap keseluruhan produk
pada *urusan $%5
;%8)'''44)2?64)2?82?:2?32?55F?557. Cell M2? 4-&4%slam5 9og2 &4%slam55;%8)'''44-%2?G9:4%2?F255F?5
. Cell I2? 4$otal5 ; ;#UM4M2?&2?5!. Cell '2? 4&4*urusan;..55
;CU$%8#4urusanFD2?56CU$A4urusan5
>. Cell #2? 4$otal &4*urus@. Cell $2? 4)4$otalG&4*uru+. Cell U2? 4:ain *urusan5
Note:
Lakukan hal yang sama untuk
Mahasiswa. Namun, untuk gai
72
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
33/39
C. APLIKASI WEKA
Untuk membuat pohon keputusan, langkah-langkahnya adalah sebagai
berikut
/. &ilih e!plore, maka akan tampil endela seperti di ba"ah ini
2. Kemudian klik open "ile dan pilih data yang data mahasis"a pilih open.7. 0uka file yang akan dieksekusi oleh (eka, pergunakan ekstensi .ar"" disini
kami menggunakanDatamhs.ar"" sebagai berikut
Contoh file arff.
77
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
34/39
. #etelah data dimasukkan, maka akan tampil kotak dialog seperti di ba"ah ini. Conteng
semua atributnya kemudian pilih classi"y.
!. Kemudian pilih algoritma yang akan digunakan seperti tampilan sebagai berikut
ini
7
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
35/39
*adi ketika ingin melakukan klasifikasi dengan menggunakan ()KA, akan ada
4empat5 buah pilihan, yang disebut dengan test options. $est option ini
digunakan untuk mengetes hasil dari klasifikasi yang telah dilakukan. 0erikut
penelasan mengenai masing-masing option.
/. Use training set&engetesan dilakukan dengan mengunakan data training itu sendiri.
2. #upplied test set&engetesan dilakukan dengan menggunakan data lain. Dengan menggunakan
option inilah, kita bisa melakukan prediksi terhadap data tes.7. Cross-validation
Akan menampilkan hasil dari rata-rata perhitungan data errornya.. &ercentage split
3asil klasifikasi akan dites dengan menggunakan data tersebut.
Aa$ U1-% E3a-a, Pa"a Ka,,1a,
Alat ukur evaluasi untuk mengetahui evaluasi dari kinera model
klasifikasi didasarkan pada banyaknya 4count5 dataset record yang diprediksi
secara benar dan tidak benar pada model klasifikasi tersebut. Count ini
ditabulasikan dalam sebuah hasil yang dikenal sebagai con"usion matri!. &ada
()KA Classifier hasil klasifikasi yang diperoleh akan disertakan dengan
beberapa alat ukur sebagai bukti teradinya hasil proses pada klasifikasi tersebut
yang telah tersedia didalamnya, salah satu alat ukur tersebut adalah Confusion
Matri.
7!
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
36/39
Confusion Matri adalah salah satu alat ukur berbentuk matriks yang
digunakan untuk menetapkan umlah perempatan klasifikasi pada proses
menggunakan aplikasi ()KA.
&ada hasil evaluasi dihasilkan data yang diklasifikasikan secara benar4correct classified instances5 sebanyak !2./?J dan data pemilih diklasifikasikan
secara tidak benar 4incorrect classified instances5 sebanyak @.+BJ.
:ambar 3asil )valuasi
#etelah dilakukan pengolahan data training maka diperoleh akurasi pada model
tersebut. Akurasi pada model dihitung dengan mengunakan confusion matri.
0erdasarkan pada hasil yang terdapat dalam Confusion Matri diatas maka pada
kolom me"akili suatu prediksi, dan baris me"akili kelas yang sebenarnya. 3al
tersebut dapat dilihat banyaknya prediksi yang benar adalah 4aa, bb, cc, dd5 dan
banyaknya total prediksi yang tidak benar adalah
4ab,ac,ad,ba,bc,bd,ca,cb,cd,da,db,dc5.Kemudian akan dilakukan proses perhitungan rata-rata persentasi akurasi
keberhasilan dan error rate pada Confusion matri dengan cara
&ersentase Akurasi ;
&ersentase Akurasi ;
; /?? J ; !2, /? J
7>
&rediksi benar /?? J$otal 0an akn a &rediksi
/2 +> ? ? /?? J/2 @ ? ? ++ +> ? ? + ? ? @ /2 ? ?
210
403
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
37/39
)rror rate ;
)rror rate ;
; /?? J ; @, +B J
Untuk melihat decision treecaranya adalah sebagai berikut
7@
&rediksi #alah /?? J
$otal 0an akn a &rediksi
/?? J
++ + @ @ /2 ? ? ? ? ? ?
/2 @ ? ? ++ +> ? ? + ? ? @ /2 ? ?
193
403
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
38/39
#ehingga akan tampil decision treesebagai berikut
#ambar Decision $ree.
7+
-
7/26/2019 Laporan Tugas Besar BDT Algoritma C4.5
39/39
BAB I
KESIMPULAN
Algoritma C.! adalah metode untuk memilih akar percabangan sebuah
data yang berbentuk tabel. &emilihan cabang ini didasarkan pada nilai gain
tertinggi dari atribut-atribut yang ada. 0erdasarkan perhitungan sebelumnya,
kami menemukan bah"a atribut kelas memiliki nilai gain tertinggi, yang diikuti
dengan urusan dan enis kelamin. Klasifikasi inilah yang akan menadi dasar
pembuatan pohon keputusan. Maka berdasarkan algoritma C.! dan *+, data
kelas yang akan menadi prioritas utama percabangan. #ehingga menghasilkan
tampilan pohon seperti gambar.Decision tree di atas.
0erdasarkan analisis tersebut kami menyimpulkan hasil perhitungan data
mahasis"a menggunakan algoritma C.! dengan dua buah cara penyelesaian
yaitu hitungan manual dan Microsoft ecel bah"a enis agama yang menadi
mayoritas mahasis"adi lingkungan #$M%K &alangka 'aya adalah %slam. 3al di
dasarkan pada hasil perhitungan entropy dan gain dari setiap atribut data
mahasis"a.Kemudian agama Kristen berada diperingkat kedua. Untuk hindu dan
katolik berada di peringkat ketiga dan empat.