bab ii. landasan teori - library & knowledge...
TRANSCRIPT
5
BAB II. LANDASAN TEORI
2.1. Teknik Informatika
Secara umum teknik informatika (computer science) adalah ilmu yang
mempelajari dasar-dasar teoritis dari informasi dan komputasi. Teknik
informatika juga mencakup teknik-teknik praktis untuk implementasi dan
aplikasi ke dalam sistem komputer. (Comer, Gries, Mulder, Tucker, Turner, &
Young, 1989)
2.1.1. Taksonomi Teknik Informatika
IEEE Computer Society mengelompokkan kata kunci teknik informatika
berdasarkan Association for Computer Machinary (IEEE Computer Society).
Berikut adalah taksonomi kata kunci utamanya:
1. Literatur umum
2. Piranti Keras
3. Organisasi Sistem Komputer
4. Piranti Lunak / Rekayasa Piranti Lunak
5. Data
6. Teori Komputasi
7. Matematika Komputasi
8. Sistem dan Teknologi Informasi
9. Metodologi Komputasi
10. Aplikasi Komputer
6
11. Computing Milieux
Taksonomi teknik informatika dijelaskan lebih lengkap pada lampiran
bersama dengan hasil pengumpulan data.
2.2. Data Mining
Menurut Vercellis istilah data Mining merujuk pada keseluruhan proses
yang terdiri dari pengumpulan dan analisis data, pengembangan model
pembelajaran induktif dan adopsi praktek pengambilan keputusan serta
konsekuensi dari tindakan berdasarkan pengetahuan yang diperoleh (Vercellis,
2009, p. 77).
Kegiatan data mining dapat dibagi menjadi dua bagian utama penelitian,
sesuai dengan tujuan utama dari analisisnya yaitu interpretasi dan prediksi
(Vercellis, 2009, p. 78).
- Interpretasi. Tujuan interpretasi adalah untuk megindentifikasi pola-
pola teratur dalam data dan untuk mengekspresikannya melalui aturan
dan kriteria yang dapat dengan mudah dipahami oleh para alhi dalam
domain aplikasi. Sebagai contoh, untuk sebuah perusahaan di industri
ritel mungkin akan menguntungkan apabila bisa mengelompokkan para
pelanggan yang setia berdasarkan profil pembelanjaan mereka. Segmen
yang dihasilkan dengan cara ini terbukti berguna dalam
mengidentifikasi relung pasar baru dan mengarahkan promosi
pemasaran perusahaan di masa depan.
7
- Prediksi. Tujuan dari prediksi adalah untuk mengantisipasi nilai
dimana variabel acak akan mengasumsikan masa depan atau
memperkirakan kemungkinan kejadian di masa depan. Sebagai contoh,
sebuah perusahaan retail dapat memprediksikan penjualan produk
tertentu untuk minggu-minggu berikutnya. Sebagian besar teknik data
mining berasal dari nilai sekumpulan variabel yang berkaitan dengan
entity di dalam database. Sebagai contoh, model data mining dapat
menunjukkan bahwa kemungkinan seorang pelanggan akan melakukan
pembelian lagi di masa depan tergantung pada fitur-fitur seperti usia,
pekerjaan, dan lain-lain.
2.2.1. Aplikasi Data Mining
Data mining dapat diterapkan pada berbagai domain, dari kontrol proses
pemasaran dan manufaktur sampai kepada pembelajaran faktor risiko dalam
diagnosis medis, dari evaluasi efektivitas obat baru sampai deteksi penipuan
(Vercellis, 2009, p. 81).
- Pemasaran
Beberapa aplikasi yang berhubungan dengan pemasaran adalah:
• Identifikasi segmen pelanggan untuk mengarahkan promosi ke
target yang benar.
• Prediksi tingkat tanggapan positif pelanggan terhadap promosi
pemasaran.
• Interpretasi dan pemahaman perilaku pembelian pelanggan.
• Analisis keranjang pasar (market basket analysis)
8
- Deteksi Penipuan
Penipuan dapat mempengaruhi industri yang berbeda seperti telepon,
asuransi (klaim palsu) dan perbankan (penggunaan kartu kredit dan cek
bank secara ilegal)
- Evaluasi Risiko
Tujuan dari analisis risiko adalah untuk memperkirakan risiko yang
berhubungan dengan keputusan masa depan. Misalnya, dengan
menggunakan pengamatan terakhir yang tersedia, sebuah bank dapat
mengembangkan model prediksi untuk menentukan apakah tepat untuk
memberikan pinjaman uang atau kredit rumah, berdasarkan
karakteristik pemohon.
- Text Mining
Data mining dapat diterapkan untuk berbagai jenis teks, yang mewakili
data tidak terstruktur, dengan tujuan untuk mengklasifikasikan artikel,
buku, dokumen, email, dan halaman web. Contohnya adalah mesin
pencari web. Aplikasi teks lainnya adalah penyaring pesan email.
- Pengenalan Citra
Klasifikasi gambar digital, baik statis maupun dinamis, adalah sebuah
subyek yang menarik baik untuk kepentingan teoritis dan aplikasi. Hal
ini berguna untuk mengenali karakter tulisan, membandingkan dan
mengidentifikasi wajah manusia, serta deteksi perilaku mencurigakan
melalui kamera video pengawas.
9
- Web Mining
Web mining dapat berguna untuk analisis situs e-commerce, dimana
menawarkan pengetahuan mengenai halaman yang paling populer.
- Diagnosis Medis
Model pembelajaran adalah alat bantu dalam bidang medis untuk
deteksi dini penyakit berdasarkan hasil pengujian klinis. Analisis citra
untuk tujuan diagnosis adalah salah satu bidang penelitian yang saat ini
sedang berkembang.
2.2.2. Metodologi Analisis Data Mining
Menurut Vercellis, ada tujuh kegiatan dasar data mining (Vercellis, 2009,
p. 90), yaitu:
- Karakterisasi dan Diskriminasi
Sebelum mengembangkan model klasifikasi, ada baiknya melakukan
analisis eksplorasi. Tujuannya ada dua. Yang pertama adalah untuk
mendapatkan karakterisasi dengan cara membandingkan distribusi dari
nilai-nilai atribut yang dimiilki oleh kelas yang sama. Yang ke dua
adalah untuk mendeteksi perbedaan melalui perbandingan distribusi
dari nilai-nilai atribut yang dimiliki oleh kelas yang berbeda.
- Klasifikasi
Teknik klasifikasi merupakan teknik yang paling umum digunakan
untuk data mining. Klasifikasi melihat perilaku dan atribut kelompok
yang telah ditentukan. Data mining dapat menetapkan klasifikasi data
baru dengan memeriksa data yang sudah diklasifikasian dan
10
menggunakan hasil tersebut untuk menyimpulkan suatu set aturan.
Aturan ini kemudian akan diterapkan pada data yang yang akan
diklasifikasikan. Teknik ini sering menggunakan induksi yang terawasi
yaitu mempekerjakan pelatihan kecil set catatan yang sudah
diklasifikasikan untuk menentukan klasifikasi tambahan. Contohnya
adalah untuk menemukan karakteristik pelanggan yang akan atau tidak
akan membeli produk jenis tertentu. Beberapa algoritma klasifikasi
adalah decision trees, jaringan syaraf, dan Naïve Bayes.
- Regresi
Tidak seperti klasifikasi yang ditujukan untuk target yang terpisah
regresi digunakan saat variabel sasaran memiliki nilai kontinu. Regresi
digunakan untuk memetakan data dengan prediksi atribut bernilai real.
Misalnya untuk memprediksi jumlah penjualan produk baru atau
memprediksi kecepatan memutar (wind velocities) pada fungsi
temperature dan tekanan udara.
- Time Series
Terkadang atribut target berkembang dari waktu ke waktu dan oleh
karena itu berhubungan dengan sumbu waktu. Misalnya, penjualan
mingguan suatu produk dalam waktu 2 tahun mengandung 104
pengamatan.
- Asosiasi
Teknik data mining ini digunakan untuk mengidentifikasi perilaku dari
suatu peristiwa atau proses tertentu. Penemuan asisiasi menghubungkan
kejadian dalam peristiwa tunggal. Contohnya, pria yang membeli kopi
11
dengan merek premium tiga kali lebih mungkin untuk membeli rokok
yang mereknya impor dibanding pria yang hanya membeli kopi degan
merek standar. Penemuan asosiasi berdasarkan aturan berikut: “Jika
item A adalah bagian dari suatu kejadian, maka X persen dari waktu
(faktor keyakinan), item B adalah bagian dari kejadian yang sama.”.
Contohnya adalah sebagai berikut:
• Jika pelanggan membeli makanan ringan, maka 85 persen
kemungkinan bahwa pelanggan tersebut akan membeli minuman
ringan atau bir.
• Jika sesorang membeli tiket penerbangan untuk keluarganya, maka
85 persen kemungkinan bahwa dia akan menyewa mobil ukuran
besar untuk ke lokasi liburan.
Dengan bantuan pemindai, toko retail menggunakan teknik data mining
ini untuk menemukan pola pembelian toko grosir. Karena konteksnya
seperti sebuah toko grosir, asosiasi kadang-kadang disebut dengan
analisis keranjang pasar (market basket analysis) (Moss & Atre, 2003,
p. 388).
- Clustering
Teknik clustering digunakan untuk menemukan kelompok yang
berbeda dalam data. Clustering serupa dengan klasifikasi, hanya saja
kelompok-kelompok tersebut belum didefinisikan pada saat
menjalankan tool data mining. Teknik clustering yang sering digunakan
adalah jaringan syaraf tiruan atau metode statistika. Clustering
12
digunakan untuk mendeketeksi masalah seperti cacat manufaktur atau
kelompok afinitas untuk kartu kredit.
- Deskripsi dan Visualisasi
Tujuan dari data mining terkadang adalah untuk memberikan
representasi yang sederhana dan ringkas dari informasi yang tersimpan
dalam dataset yang besar. Berbeda dengan clustering dan asosisasi,
analisis deskriptif tidak melakukan pengelompokkan atau pembagian
dalam dataset. Sebuah deskripsi singkat mengenai dataset yang besar
sangat membantu, dan mungkin juga menjelaskan pola-pola
tersembunyi dalam data.
2.2.3. Time Series
Time series adalah suatu himpunan pengamatan yang dibangun secara beru-
rutan dalam waktu. Waktu atau periode yang dibutuhkan untuk melakukan suatu
peramalan itu biasanya disebut sebagai lead time yang bervariasi pada tiap
persoalan.
Berdasarkan himpunan pengamatan yang tersedia maka time series
dikatakan kontinu jika himpunan pengamatan tersebut adalah kontinu dan
dikatakan diskrit bila himpunan pengaamatan tersebut juga diskrit. Dalam time
series diskrit. interval waktunya seragam seperti, menit, jam, hari, minggu, bulan,
kwartal atau tahunan (Vercellis, 2009, p. 187).
Contohnya time series digunakan untuk memprediksi konsumsi
penggunaan industri. Gambar 2.1 menunjukkan konsumsi listrik di Italia
dinyatakan dalam puluhan juta kilowatt per jam, direkam setiap dua bulan dari
dua bulan pertama tahun 1998 sampai dua bulan ke enam tahun 2003.
13
Gambar 2.1 – Time Series Konsumsi Listrik Itali
Tiga komponen time series dibagi menjadi tiga yaitu: tren, musiman, dan
random noise.
- Tren. Komponen tren jangka panjang menggambarkan perilaku rata-
rata dari waktu ke waktu, dan trennya dapat meningkat, menurun, atau
statis. Usaha yang dibuat untuk perkiraan tren time series dilambangkan
dengan Mt, menggunakan fungsi sederhana dari bentuk linier,
polinomial, eksponensial, dan logaritma.
- Musiman. Komponen musiman dilambangkan dengan Qt, yaitu hasil
gelombang fluktuasi jangka pendek dari frekuensi yang muncul dalam
time series tertentu.
- Random Noise. Adalah komponen fluktuasi dari time series yang
digunakan untuk mewakili semua variasi yang tidak beraturan dalam
data yang tidak bisa dijelaskan oleh komponen lainnya.
2.2.4. Algoritma Prediksi
Berikut ini adalah algoritma yang sering digunakan untuk melakukan
prediksi time series (Singh & Balasundaram, 2007):
65707580859095
100105
1998
1999
2000
2001
2002
2003
2004
14
- ARIMA
Model ARIMA merupakan penggabungan dari dua metode yaitu
Autoregressive dan Moving Average. ARIMA mencari pola yang
paling cocok dalam kesatuan waktu dengan menggunakan nilai masa
lalu, dan meramalkan pola masa depan dalam jangka pendek. ARIMA
cocok jika observasi time series secara statistik berhubungan satu sama
lain.
- Support Vector Regression
Support Vector Regression (SVR) merupakan Support Vector Machines
(SVM) untuk regresi yang merepresentasikan fungsi dengan sebagian
training data, yang biasa disebut support vectors. Implementasi SVM
untuk prediksi time series menunjukkan performance yang sangat baik.
- Jaringan Syaraf Tiruan
Jaringan syaraf tiruan terdiri atas sejumlah proses yang sangat
sederhana yang disebut dengan node atau simpul. Simpul ini analog
dengan neuron yang ada di otak manusia. Kumpulan simpul–simpul
yang membentuk suatu konfigurasi tertentu dikenal sebagai jaringan
syaraf tiruan. Jaringan syaraf tiruan terdiri atas lapisan input dan output.
Tetapi ada juga yang mempunyai lapisan tersembunyi diantara lapisan
input dan output. Karakteristik jaringan syaraf tiruan ditentukan oleh
pola hubungan antara neuron-neuronnya yang biasanya disebut
arsitektur/topologi jaringan, metode penentuan bobot sambungannya
(pelatihan jaringan) dan fungsi aktivasinya. (Eliyani, 2007) melakukan
15
peramalan harga saham perusahaan dengan menggunakan jaringan
syaraf tiruan dan akaike information criterion.
Algortima lainnya yang digunakan untuk prediksi antara lain:
- Decision Tree
Decision tree adalah sebuah diagram alur dengan struktur seperti pohon.
Setiap node berisi menandakan suatu tes pada atribut. Setiap cabang
mewakili hasil tes. Node daun merepresentasikan kelas distribusi.
Struktur decision tree menunjukkan aturan “jika-maka” (bukan
persamaan matematika) sehingga hasilnya mudah untuk ditafsirkan.
Penelitian decision tree berkembang di bidang-bidang seperti rekayasa,
bisnis, kedokteran dan pendidikan. Fang dan Lu mengembangkan
model decision tree unruk memprediksi kinerja siswa dalam dinamika
teknik (Fang & Lu, 2009).
- Naive Bayes
Naive bayes merupakan teknik sederhana yang sangat cocok saat
dimensi dari input tinggi. Meskipun sederhana, naive bayes seringkali
dapat mengungguli metode klasifikasi yang lebih canggih. Aturan naive
bayes merupakan dasar dari banyak machine learning dan metode data
mining. Aturan naive bayes digunakan untuk membuat model dengan
kemampuan prediksi. Algoritma ini digunakan saat:
• Dimensi dari input tinggi
• Atributnya tidak bergantung satu sama lain
• Ingin output yang lebih efisien
16
G.Subbalakshmi et al. menggunakan algoritma naive bayes dalam
sistem pendukung keputusan prediksi penyakit jantung
(G.Subbalakshmi, Ramesh, & Rao, 2011).
- Logika Fuzzy
Logika fuzzy merupakan sebuah metodologi sistem kontrol
penyelesaian masalah yang cocok diimplementasikan dalam sistem,
mulai dari sistem yang sederhana, kecil, embedded micro-controllers,
hingga yang besar, jaringan, multi chanel PC dan sistem kontrol. Logika
fuzzy menyediakan sebuah cara yang sederhana untuk mendapatkan
kesimpulan berdasarkan informasi yang kabur, ambigu, tidak tepat atau
bahkan yang hilang. Umumnya, logika fuzzy adalah metode cukup
efektif untuk sistem yang model matematikanya tidak diketahui atau
tidak dapat dibuat (Aydin, Karakose, & Akin, 2009). Penggunaan
logika fuzzy untuk prediksi telah banyak digunakan, seperti prediksi
pemesanan hotel (Hoekstra, 2010) dan prediksi penggunaan bandwidth
(Din & Fisal, 2008).
2.3. Jaringan Syaraf Tiruan
Jaringan syaraf tiruan (JST) telah secara luas diterapkan untuk klasifikasi
pola dan masalah regresi. Alasan utama keberhasilan dari JST adalah
kemampuannya dalam memperoleh fungsi model perkiraan non-linier yang
menggambarkan hubungan antara variabel dependen dan independen dengan
menggunakan input sampel yang diberikan (Singh & Balasundaram, 2007).
17
2.3.1. Arsitektur Jaringan
Ada beberapa arsitektur jaringan syaraf, antara lain (Kusumadewi, 2003, p.
212):
- Jaringan dengan lapisan tunggal (single layer net)
Jaringan dengan lapisan tunggal hanya memiliki satu lapisan dengan
bobot-bobot terhubung. Jaringan ini hanya menerima input kemudian
secara langsung akan mengolahnya menjadi output tanpa harus melalui
lapisan tersembunyi.
Gambar 2.2 – Arsitektur Jaringan dengan Lapisan Tunggal
Gambar 2.2 menunjukkan arsitektur jaringan dengan lapisan tunggal.
Lapisan input memiliki tiga neuron, yaitu X1, X2 dan X3. Sedangkan
pada lapisan output memiliki dua neuron yaitu Y1 dan Y2. Neuron-
Lapisan Input
Lapisan Output
Nilai Output
Nilai Input
w11 w12 w21 w22
w31 w32 Matriks Bobot
X1 X2 X3
Y1 Y2
18
neuron pada kedua lapisan saling berhubungan. Seberapa besar
hubungan antara 2 neuron ditentukan oleh bobot yang bersesuaian.
Semua unit input akan dihubungkan dengan setiap unit output.
- Jaringan dengan banyak lapisan (multi layer net)
Jaringan dengan banyak lapisan memiliki satu atau lebih lapisan yang
terletak di antara lapisan input dan lapisan output. Umumnya ada
lapisan bobot-bobot yang terletak antara dua lapisan tersebut. Gambar
2.3 menunjukkan arsitektur jaringan dengan banyak lapisan.
Gambar 2.3 – Arsitektur Jaringan dengan Banyak Lapisan
Nilai Output
Lapisan Output
Lapisan Input
Lapisan Tersembunyi
Nilai Input
v11 v12 v21 v22
v31 v32 Matriks Bobot Pertama
X1 X2 X3
Z1 Z2
Y
w1 w2
Matriks Bobot Ke Dua
19
- Jaringan dengan lapisan kompetitif (competitive layer net)
Merupakan jenis jaringan saraf yang memiliki bobot yang telah
ditetapkan dan tidak memiliki proses pelatihan. Digunakan untuk
mengetahui neuron pemenang dari sejumlah neuron yang ada. Nilai
bobot untuk diri sendiri tiap neuron adalah 1, sedangkan untuk neuron
lain adalah bobot random negatif. Gambar 2.4 menunjukkan salah satu
contoh arsitektur jaringan dengan lapisan kompetitif yang memiliki
bobot - η
Gambar 2.4 – Arsitektur Jaringan dengan Lapisan Kompetitif
2.3.2. Fungsi Aktivasi
Ada beberapa fungsi aktivasi yang sering digunakan dalam jaringan saraf
tiruan, antara lain:
- Fungsi Undak Biner (Hard Limit)
Jaringan dengan lapisan tunggal sering menggunakan fungsi undak
(step function) untuk mengkonversikan input dari suatu variabel yang
bernilai kontinu ke suatu output biner yaitu 0 atau 1 (Gambar 2.5).
Fungsi undak biner (hard limit) dirumuskan sebagai berikut:
-η -η
A1
Ai
Am
Aj
-η
-η
-η -η
20
0, 01, 0
Gambar 2.5 – Fungsi Undak Biner (Hard Limit)
- Fungsi Nilai Ambang (Threshold)
Fungsi undak biner dengan menggunakan nilai ambang sering juga
disebut dengan nama fungsi nilai ambang (threshold) atau fungsi
Heaviside (Gambar 2.6). Fungsi undak biner (dengan nilai ambang θ)
dirumuskan sebagai berikut:
0, θ1, θ
Gambar 2.6 – Fungsi Undak Biner (Threshold)
- Fungsi Linier
Fungsi linear memiliki nilai output yang sama dengan nilai inputnya
(Gambar 2.7). Fungsi linear dirumuskan sebagai:
θ
y
x
1
0
y
x
1
0
21
Gambar 2.6 – Fungsi Linier
- Fungsi Sigmoid
Fungsi dengan kurva berbentuk huruf S. Setiap nilai x dipetakan ke
dalam interval 0 sampai 1dinamakan fungsi sigmoid biner. Sedangkan
output yang memiliki rentang antara -1 sampai 1 disebut sigmoid tan.
Fungsi sigmoid biner dirumuskan sebagai berikut:
dengan: 1
Fungsi sigmoid tan dirumuskan sebagai berikut:
dengan: 1 1
2.3.3. Metode Pembelajaran
JST sering diklasifikasikan ke dalam pembelajaran terawasi (supervised
learning) dan tidak terawasi (unsupervised learning) berdasarkan metode
pembelajarannya (Cho, Chun, & Lee, 2007). Metode pembelajaran pada jaringan
syaraf disebut terawasi jika output yang diharapkan telah diketahui sebelumnya.
-1
-1
1
y
x
1
0
22
Sedangkan metode pembelajaran yang tidak terawasi tidak memerlukan target
output.
Algoritma berikut ini merupakan metode pembelajaran JST yang terawasi
(Kusumadewi, 2003, p. 224).
- Perceptron
Perceptron biasanya digunakan untuk mengklasfikasikan suatu tipe pola
tertentu yang sering dikenal dengan pemisahan secara linear. Pada
dasarnya, perceptron pada jaringan syaraf dengan satu lapisan memiliki
bobot yang bisa diatur dan suatu nilai ambang (threshold). Algortima
yang digunakan oleh aturan perceptron ini akan mengatur parameter-
parameter bebasnya melalui proses pembelajaran.
- Backpropagation
Backpropagation merupakan algoritma pembelajaran yang terawasi dan
biasanya digunakan oleh perceptron dengan banyak lapisan untuk
mengubah bobot-bobot yang terhubung dengan neuron-neuron yang ada
pada lapisan tersembunyinya. Algoritma backpropagation
menggunakan error output untuk mengubah nilai bobot-bobotnya dalam
arah mundur (backward). Untuk mendapatkan error ini, tahap
perambatan maju (forward propagation) harus dikerjakan terlebih
dahulu. Pada saat perambatan maju, neuron-neuron diaktifkan dengan
menggunakan fungsi aktivasi sigmoid, yaitu:
1
1
23
Aristektur jaringan backpropagation dapat dilihat pada Gambar 2.7 di
bawah ini.
Gambar 2.7 – Arsitektur Jaringan Backpropagation
Salah satu algoritma untuk pembelajaran JST yang tidak terawasi adalah
jaringan kohonen. Pada jaringan ini, suatu lapisan yang berisi neuron-neuron
akan menyusun dirinya sendiri berdasarkan input nilai tertentu dalam suatu
kelompok yang dikenal dengan istilah cluster. Selama proses penyusunan diri,
cluster yang memiliki vektor bobot paling cocok dengan pola input yaitu yang
memiliki jarak paling dekat akan terpilih sebagai pemenang. Neuron yang
menjadi pemenang beserta neuron-neuron tetangganya akan memperbaiki bobot-
bobotnya.
W21
V32
V31
V11
V22
V21
V12
X1
X2
X3
Y1
Y2
Y3
Z1
Z2
W23
W22
W11
W13
W12
24
2.4. Extreme Learning Machine
Extreme learning machine merupakan jaringan syaraf tiruan feedforward
dengan satu hidden layer atau lebih dikenal dengan istilah single hidden layer
feedforward neural network (Sun, Choi, Au, & Yu, 2008).
Tingkat pembelajaran jaringan syaraf feed-forward (feed-forward neural
network - FFNN) lebih banyak mengkonsumsi waktu. Menurut Huang et al. ada
dua alasan kenapa ini bisa terjadi, pertama adalah karena penggunaan algoritma
pembelajaran dengan gradien yang lambat untuk pelatihan jaringan syaraf dan
yang ke dua adalah karena tuning berulang dari parameter jaringan karena
algoritma ini. Untuk mengatasi masalah ini, Huang et al. mengajukan sebuah
algoritma pembelajaran yang dinamakan extreme learning machine (ELM) untuk
jaringan syaraf single hidden layer feed-forward (SLFNs) yang memilih secara
acak bobot input dan secara analitik menentukan bobot output SLNFs. Huang et
al. menyatakan “Secara teori, algoritma ini cenderung memberikan kinerja
generalisasi terbaik pada kecepatan pembelajaran yang sangat cepat.” (Huang,
Zhu, & Siew, 2004).
ELM memiliki fitur yang menarik dan signifikan, berbeda dengan algoritma
pembelajaran berbasiskan gradien yang populer untuk jaringan syaraf feed-
forward. Fitur yang dimaksud adalah sebagai berikut (Huang, Zhu, & Siew,
2006):
- Kecepatan belajar ELM sangat cepat. Dalam simulasi yang dilaporkan
dalam literatur, fase pembelajaran ELM dapat diselesaikan dalam
hitungan detik untuk banyak aplikasi. Sebelumnya, tampaknya ada
penghalang kecepatan virtual yang sebagaian besar algortima
25
pembelajaran klasik tidak dapat menembusnya. Bukan hal yang tidak
biasa lagi kalau pelatihan jaringan syaraf feed-forward yang
menggunakan algorima pembelajaran klasik memerlukan waktu yang
cukup lama bahkan untuk aplikasi yang sederhana.
- ELM memiliki kinerja geneneralisasi yang lebih baik dibandingkan
pembelajaran berbasiskan gradien, seperti backpropagation dalam
kebanyakan kasus. Algoritma pembelajaran klasik berbasiskan gradien
dan beberapa algoritma pembelajaran lainnya menghadapi beberapa
masalah seperti minima lokal, tingkat pembelajaran yang tidak tepat,
dan lain-lain. Untuk menghindari masalah ini, beberapa metode seperti
peluruhan bobot dan metode pemberhentian lebih awal sering
digunakan pada algoritma klasik ini.
- ELM cenderung untuk mencapai solusi sederhana tanpa masalah sepele
seperti itu. Algoritma pembelajaran ELM terlihat jauh lebih sederhana
dari algoritma pembelajaran jaringan syaraf feed-forward kebanyakan.
Tidak seperti algoritma pembelajaran berbasiskan gradien yang hanya
bekerja untuk fungsi aktivasi terdiferensiasi, algortima ELM dapat
digunakan untuk melatih SLFNs dengan banyak fungsi aktivasi yang
tidak terdiferensiasi.
26
2.4.1. Cara Kerja Algoritma ELM
Gambar 2.8 merupakan struktur dari ELM (Huang, Zhu, & Siew, 2004).
Gambar 2.8 – Struktur ELM
Metode ELM mempunyai model matematis yang berbeda dari jaringan
syaraf tiruan feedforward. Model matematis dari ELM lebih sederhana dan
efektif. Berikut ini adalah model matematis dari ELM. Untuk N jumlah sampel
yang berbeda (Xi, ti)
, , … , (1)
, , … , (2)
Standar SLFNs dengan jumlah node tersembunyi sebanyak N dan fungsi
aktivasi g(x) dapat digambarkan secara matematis sebagai berikut:
∑ ∑ . (3)
Dimana:
J = 1, 2, …, N
Xi1 Xi2 XiN
β
w
Input Layer
Hidden Layer
Output Layer
…
…
…
27
Wi = (Wi1, Wi2, … , Win)T merupakan vektor dari bobot (weight) yang
menghubungkan ith node tersembunyi dan
node input.
βi = (βi1, βi2, … , βin)T merupakan vektor bobot (weight vector)
yang menghubungkan ith node tersembunyi
dan node output.
bi threshold dari ith node tersembunyi
wixj merupakan inner produk dari wi dan xj
SLFNs dengan N hidden nodes dan activation function g ( x ) diasumsikan
dapat memperkirakan dengan tingkat error 0 atau dapat dinotasikan sebagai
berikut:
∑ o sehingga (4)
∑ . (5)
Persamaan [5] dapat dituliskan secara sederhana sebagai berikut:
(6)
, … , , , … , , , … ,
. .
. . (7)
(8)
(9)
H pada persamaan [7] di atas adalah layar tersembunyi output matriks.
. menunjukkan output dari neuron tersembunyi yang berhubungan
28
dengan input . merupakan matriks dari output bobot dan matriks T dari target
atau output.
Pada ELM bobot input dan bias tersembunyi ditentukan secara acak, maka
bobot output yang berhubungan dengan layer tersembunyi dapat ditentukan dari
persamaan [6].
(10)
2.4.2. Implementasi ELM
Meskipun tergolong algoritma baru, beberapa penerapan ELM untuk
prediksi telah dilakukan, seperti prediksi properti material (El-Sebakhy, 2008),
prediksi permintaan barang (Agustina, Anggraeni, & Mukhlason, 2010), prediksi
penjualan di industri retail (Chen & Ou, 2011), dan klasifikasi nasabah bank
(Duan, Huang, & Wang, 2009).
Hasil penerapan metode ELM untuk prediksi permintaan barang
menunjukkan bahwa metode ELM memiliki tingkat akurasi lebih baik
dibandingkan dengan metode konvensional seperti Moving Average (MA) dan
Exponential Smoothing (ES). Dimana tingkat kesalahan (Mean Square Error dan
Mean Absolut Precentage Error) metode ELM lebih kecil dibandingkan dengan
dua metode konvensional tersebut. Berikut ini adalah perbandingan nilai MSE
dan MAPE antara metode ELM, MA, dan ES. (Agustina, Anggraeni, &
Mukhlason, 2010)
29
Tabel 2.1 – Perbandingan Nilai MSE dan MAPE antara Metode ELM, MA, dan
ES untuk Data Kaos
MA ES ELM
MSE 116.74 502.19 0.0481
MAPE 19.19 32.93 0.0042
Chen dan Ou mengkombinasikan metode Grey Relation Analysis (GRA)
dan ELM untuk model prediksi industri retail (Chen & Ou, 2011). Kombinasi ini
disebut dengan GELM. Kinerja GELM dibandingkan dengan model prediksi
Generalized ARCH (GARCH), Back Propagation Network (GBPN), dan GRA
Multilayer Functional Link Network (GMFLN) dengan hasil sebagai berikut:
Tabel 2.2 – Perbandingan Hasil dari Model Prediksi yang Berbeda
Tipe Model MAD MSE Lama Pelatihan
Model time series statistik GARCH 0.13876 0.03191 -
Model jaringan syaraf tiruan GBPN 0.09837 0.01979 11.573
GMFLN 0.08911 0.01883 4.216
GELM 0.07039 0.00907 0.3750
Duan et al. menggunakan ELM untuk mengklasifikasi nasabah bank (Duan,
Huang, & Wang, 2009). Kinerja ELM juga dibandingkan dengan algoritma
decision tree, jaringan syaraf tiruan, serta Bayes dengan hasil sebagai berikut:
30
Tabel 2.3 – Perbandingan Waktu dan Keakuratan dari ELM, Decision Tree,
JST, dan Bayes
Algoritma Waktu Keakuratan
Training (s) Testing (s) Training Testing
ELM 0.8590 0.3440 0.9530 0.9200
Decision Tree 3.6520 1.3450 0.8600 0.8300
JST 3.1231 1.1240 0.9460 0.8840
Bayes 2.9315 0.9134 0.9840 0.9000
Huang et al. melakukan evaluasi kinerja ELM dengan membandingkannya
dengan algoritma feed-forward yang cukup populer yaitu backpropagation (BP)
dan support vector machine for regression (SVR). Salah satu hasil evaluasinya
ditunjukkan pada tabel di bawah ini (Huang, Zhu, & Siew, 2006):
Tabel 2.4 – Perbandingan Kinerja dari Pembelajaran Fungsi: SinC
Algoritma Waktu (s) Training Testing Jumlah dari SV
s/node Training Testing RMS Dev RMS Dev
ELM 0.125 0.031 0.1148 0.0037 0.0097 0.0028 20
BP 21.26 0.032 0.1196 0.0042 0.0159 0.0041 20
SVR 1273.4 5.9067 0.1149 0.0007 0.0130 0.0012 2499.9
Keterangan:
RMS = root mean square error
Dev = standar deviasi
Sebagai teknik pembelajaran, ELM telah mendemonstrasikan potensi yang
bagus untuk menyelesaikan masalah regresi dan klasifikasi. Akhir-akhir ini,
31
teknik ELM menerima perhatian yang cukup banyak dari komunitas
computational intelligence dan machine learning, baik dari segi teori dan
aplikasinya (Huang, Wang, & Lan, 2011).
2.5. Prediksi Topik-Topik Penelitian
Dalam pembuatan rencana teknologi dan bisnis, sangat diperlukan untuk
memahami teknologi secara keseluruhan dan memprediksi apa yang akan terjadi
dalam waktu dekat (Kobayashi, Shirai, Hiyane, Kumeno, Inujima, & Yamauchi,
2005).
Penelitian mengenai prediksi trend-trend telah banyak dilakukan di banyak
domain. Kobayashi et al. memprediksi trend teknologi berdasarkan sumber dari
internet. Subyek penting lainnya dalam dokumen paten adalah kebutuhan
manusia, khususnya pestisida, obat-obatan, dan deterjen. Subyek paking besar
dalam legiatan penelitian adalah teknologi pangan, khususnya minyak kelapa,
minyak kelapa sawit, dan penyimpanan. Topik yang menonjol pada tahun 1993
sampai 1996 adalah proses fermentasi, proses penyimpanan, dan alat pengering
(Kobayashi, Shirai, Hiyane, Kumeno, Inujima, & Yamauchi, 2005).
Rahayu dan Hasibuan mengidentifikasi trend teknologi pada dokumen
paten Indonesia, laporan penelitian kimia dan bidang metallurgy. Tujuan dari
penelitiannya adalah untuk mengetahui trend topik yang inti, menonjol, dan
berkembang. Hasil penelitiannya menunjukkan subyek dan kata kunci yang
berulang pada dokumen dari tahun 1993 sampai 1997 adalah kimia organik,
terutama mengenai pewarnaan dan ekstraksi (Rahayu & Hasibuan, 2006).
32
Small mengeksplorasi peluang menggunakan co-citation cluster
berdasarkan tiga periode waktu untuk melacak perkebangan dan pertumbuhan
area penelitian, dan kemudian memprediksi perubahan jangka dekatnya. Data
setnya berasal dari tiga data enam tahunan yang berulang yaitu: 1996-2001,
1997-2002 dan 1998-2003 (Small, 2006).
Daim et al. memprediksi tiga area teknologi berkembang dengan
mengintegrasikan penggunaan bibliometrik dan analisis paten ke dalam tool
teknologi prediksi seperti scenario planning, growth curves, dan analogi.
Teknologi yang diprediksi adalah sel bahan bakar, keamanan pangan, dan
teknologi penyimpanan optic (Daim, Rueda, Martin, & Gerdsri, 2006).
2.6. Growth Rate Analysis
Tingkat pertumbuhan (growth rate) adalah jumlah kenaikan yang diperoleh
oleh sebuah variabel dalam periode dan konteks tertentu. Analisis tingkat
pertumbuhan (growth rate analysis) bertujuan untuk mengidentifikasi variabel
yang tingkat pertumbuhannya signifikan dan juga mengidentifikasi variabel yang
baru muncul.
Ada banyak pilihan untuk menentukan tingkat pertumbuhan. Ziegle
mempertimbangkan empat kemungkinan: perbedaan antara jumlah hit tahun
terakhir dan jumlah hit tahun awal itu, rasio jumlah hit terbanyak dan jumlah hit
awal, tingkat kurva eksponensial sesuai dengan time series, dan average year of
publication (rata-rata tahun publikasi) (Ziegle, 2009).
Metrik pertama untuk perhitungan laju pertumbuhan adalah perbedaan
angka antara jumlah hit akhir dengan hit awal dari suatu term. Meskipun metrik
33
sederhana ini secara intuitif menarik, metrik ini memiliki dua kekurangan. Yang
pertama adalah jumlah hit tahun-tahun selain tahun pertama dan tahun terakhir
diabaikan. Kelemahan yang ke dua adalah term dengan jumlah hit awal lebih
besar lebih disukai dibandingkan yang jumlah hit awalnya kecil.
Penggunaan metrik rasio memiliki satu peringatan: tingkat pertumbuhan
tidak terdefinisi jika jumlah hit tahun awal bernilai nol. Ada beberapa
kemungkinan penyelesaian masalah ini, yakni dengan menggantikan nol dengan
jumlah hit terendah.
Dua metrik yang dibahas di atas hanya mempertimbangkan jumlah hit dari
tahun awal sampai tahun akhir. Dua metrik selanjutnya merupakan metrik yang
mempertimbangkan semua jumlah hit. Pertama adalah dengan menggunakan
kurva eksponensial pada time series, dan mengambil parameter eksponensial
sebagai tingkat pertumbuhan (growth rate).
Ke dua adalah average year of publication (rata-rata tahun publikasi).
Untuk menghitung average year of publication, kita menjumlah seluruh hasil
perkalian tahun dengan jumlah hit per tahun, kemudian membaginya dengan
jumlah seluruh hit pada semua tahun. Dalam rumus:
∑
∑
2.7. Prediksi Linier
Prediksi linier adalah teknik pemrosesan sinyal yang digunakan secara luas
dalam analisis sinyal suara dan sebagaimana yang dimaksud dalam pemrosesan
literature suara. Prediksi linier adalah sebuah teknik analisis time series, yang
34
muncul dari pengujian sistem linier. Dengan menggunakan prediksi linier,
parameter dari sistem dapat ditentukan dengan menganalisis input dan output dari
sistem (Cinneide, 2008).
Salah satu algoritma prediksi linier adalah autoregressive. Pada matlab
terdapat sebuah tool untuk melakukan prediksi linier yaitu lpc. Lpc menggunakan
metode autocorrelation dari model autoregressive untuk menemukan filter
coefficient.
Lpc menghitung penyelesaian kuadrat terkecil dengan:
Dimana:
Dan m adalah panjang dari x. Menyelesaikan masalah kuadrat terkecil
melalui persamaan normal.
mengarah kepada persamaan Yule-Walker