implementasi metode kernel partial least square...
TRANSCRIPT
IMPLEMENTASI METODE KERNEL PARTIAL LEAST SQUARE UNTUK
KLASIFIKASI KANKER OVARIUM(Kata kunci: Klasifikasi kanker ovarium, KPLS,
kernel, SELDI-TOF)
PRESENTASI TUGAS AKHIR – KI091391
Penyusun Tugas Akhir :
Lisa Yuli Kurniawati
(NRP : 5108.100.089)
Dosen Pembimbing :
Prof. Ir. Handayani Tjandrasa, M.Sc., Ph.D.
Isye Arieshanti, S.Kom., M.Phil.
08 Juni 2012 Tugas Akhir – KI091391
Outline
2
Latar Belakang1
Tujuan2
Rumusan Masalah3
Metode4
Desain & Implementasi5
Uji Coba6
Kesimpulan7
Outline
3
Latar Belakang1
Tujuan2
Rumusan Masalah3
Metode4
Desain & Implementasi5
Uji Coba6
Kesimpulan7
4
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Latar Belakang
Diagnosa dini itu penting!
5
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Latar Belakang
Kernel Partial Least Square
6
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Latar Belakang
Outline
7
Latar Belakang1
Tujuan2
Rumusan Masalah3
Metode4
Desain & Implementasi5
Uji Coba6
Kesimpulan7
Tujuan2
Tujuan
Implementasi perangkat lunak prediktor kanker ovarium dengan menggunakan KPLS
8
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Outline
9
Latar Belakang1
Tujuan2
Rumusan Masalah3
Metode4
Desain & Implementasi5
Uji Coba6
Kesimpulan7
Rumusan Masalah3
Bagaimana mengimplementasikan perangkat lunak prediktor kanker ovarium dengan Kernel Partial Least Square?
Bagaimana mengevaluasi fungsi-fungsi pada perangkat lunak?
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Rumusan Masalah
10
Outline
11
Latar Belakang1
Tujuan2
Rumusan Masalah3
Metode4
Desain & Implementasi5
Uji Coba6
Kesimpulan7
Metode4
Metode
Partial Least Square :
Variabel
respon
(output)
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
12
Variabel prediktor
(input)
Koefisien regresi
Metode
KPLS PLS + trik Kernel
Permasalahan Nonlinear diselesaikan secara Linear ??
fungsiKERNEL
dilibatkan
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
13
Outline
14
Latar Belakang1
Tujuan2
Rumusan Masalah3
Metode4
Desain & Implementasi5
Uji Coba6
Kesimpulan7
Desain & Implementasi5
Desain & Implementasi
Data Masukan
Data Keluaran
Gambaran Proses
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Data Masukan
Data
Spektometri masa
SELDI-TOF High Resolution
Teknologi
proteomik
Data ini dibuat oleh National Cancer Institute (NCI) yang telah dipublikasikan dan dapat diunduh pada situs berikut:
http://home.ccr.cancer.gov/ncifdaproteomics/ppatterns.asp.
m/z ratio
Dimensi data>370.000
16
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Jumlah Sampel
Normal = 95Kanker = 121
Data Keluaran
Keluaran proses latih
Keluaran proses prediksi
Koefisien regresi
Hasil prediksi
KANKER+1
NORMAL-1
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Gambaran Proses
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
18
Data Latih
Model Klasifikasi(KPLS)
Ulangi untuk K-Fold Cross Validation
Proses Uji
Proses Latih
Evaluasi (akurasi, sensitivitas &
spesifisitas)
Hasil Prediksi
Data
Ovarium
SELDI-TOF
Data Uji
Tahap
Pra-proses
Tahap Pra-Proses
Data OvariumSELDI-TOF jumlah fitur >370.000
Penghilangan missing value
Set A
Seleksi Fitur(Uji T-2 sampel)
Set B
jumlah fitur= 39.905
jumlah fitur= 24.544
Transformasi Data
Set C
C10 jumlah fitur= 15.964 C40 jumlah fitur= 3.992
Transformasi Data
Set D
D10, jumlah fitur= 9.820D50, jumlah fitur= 1.964
dataset 1
dataset 2
dataset 3 & 4 dataset 5&6
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Penghilangan missing value
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
20
Seleksi Fitur (Uji-T 2 Sampel)
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
21
Transformasi Data
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
22
Lebar window = 10
Gambaran Proses
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
23
Data Latih
Model Klasifikasi(KPLS)
Ulangi untuk K-Fold Cross Validation
Proses Uji
Proses Latih
Evaluasi (akurasi, sensitivitas &
spesifisitas)
Hasil Prediksi
Data
Ovarium
SELDI-TOF
Data Uji
Tahap
Pra-proses
Proses Latih
Membuat matriks kernel K dan Kt
K = matriks kernel dari X orde (nxn)Kt = matriks kernel antara X dan Xt orde (nt x n)
Fungsi kernel polinomial
Komponen matriks kernel
dot product
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
24
Proses Latih
Mencari koefisien regresi
p = jumlah komponen latent vector yang diekstraksi
Algoritma NIPALS
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Koefisien regresi:
25
K
Gambaran Proses
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Data Latih
Model Klasifikasi(KPLS)
Ulangi untuk K-Fold Cross Validation
Proses Uji
Proses Latih
Evaluasi (akurasi, sensitivitas &
spesifisitas)
Hasil Prediksi
Data
Ovarium
SELDI-TOF
Data Uji
Tahap
Pra-proses
26
Proses Uji
Prediksi terhadap Yt
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
27
Koefisien regresi
Proses Evaluasi
Semakin besar nilai Akurasi , Sensitivitas dan Spesifisitas menunjukkan model semakin akurat
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
28
Outline
29
Latar Belakang1
Tujuan2
Rumusan Masalah3
Metode4
Desain & Implementasi5
Uji Coba6
Kesimpulan7
Uji Coba6
Rata-rataSensitivitasSet A= 90%Set B = 89%
Uji Coba I
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
30
Uji coba I : variasi data (Set A, Set B) dengan atau tanpa Seleksi Fitur
Jumlah fiturSet A = 39.905Set B= 24.544
Rata-rataSpesifisitas
Set A&B= 99%
Rata-rataAkurasi
Set A= 94%Set B = 93%
Uji Coba I
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
31
Uji coba I : variasi data (Set A, Set B) dengan atau tanpa Seleksi Fitur
Jumlah fiturSet A = 39.905Set B= 24.544
Rata-rataSpesifisitas
Set A&B= 99%
Rata-rataSensitivitasSet A= 90%Set B = 89%
Uji Coba I
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
32
Uji coba I : variasi data (Set A, Set B) dengan atau tanpa Seleksi Fitur
Jumlah fiturSet A = 39.905Set B= 24.544
Uji Coba II
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
33
Uji coba II : Transformasi data, variasi parameter lebar window [Set A]
Jumlah fiturSet C10 = 15.964Set C20 = 7.984Set C30 = 5.324Set C40 = 3.992Set C50 = 3.196
Lebar Window yang digunakan adalah 10,20,30,4,50
Rata-rataAkurasi Set C terbaik
Set C50= 76,4%
Uji Coba II
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
34
Uji coba II : Transformasi data, variasi parameter lebar window [Set B]
Jumlah fiturSet D10 = 9.820Set D20 = 4.912Set D30 = 3.276Set D40 = 2.456Set D50 = 1.964
Lebar Window yang digunakan adalah 10,20,30,4,50
Rata-rataAkurasi Set D terbaik
Set D40= 74,02%
Outline
35
Latar Belakang1
Tujuan2
Rumusan Masalah3
Metode4
Desain & Implementasi5
Uji Coba6
Kesimpulan7 Kesimpulan7
Kesimpulan
“Perangkat lunak yang dikembangkan dengan metode KPLS ini mampu memprediksi kanker ovarium. ”
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
36
0.00
0.20
0.40
0.60
0.80
1.00
1.20
A B C10 C40 D10 D50
Pe
form
a s
iste
m (
%)
Dataset
Akurasi
Sensitivitas
Spesifisitas
IMPLEMENTASI METODE KERNEL PARTIAL LEAST SQUARE UNTUK
KLASIFIKASI KANKER OVARIUM(Kata kunci: Klasifikasi kanker ovarium, KPLS,
kernel, SELDI-TOF)
PRESENTASI TUGAS AKHIR – KI091391
Penyusun Tugas Akhir :
Lisa Yuli Kurniawati
(NRP : 5108.100.089)
Dosen Pembimbing :
Prof. Ir. Handayani Tjandrasa, M.Sc., Ph.D.
Isye Arieshanti, S.Kom., M.Phil.
08 Juni 2012 Tugas Akhir – KI091391
TEORI-TEORI PENTING
[PEMBAHASAN]
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Latent Vector?
Sudah diketahui nilainya
Var. baruMenemukan faktor-faktor yang
memaksimalkan common variance, karena jika common variance diperbesar maka error
akan semakin kecil.
Matriks kovarian
Common variance(berkorelasi dengan var.
lain)
Spesific variance(tidak berkorelasi dengan
var. lain)
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Matriks Kovarian
2
1 12 1
2
21 2 2
2
1 2
p
p
n n p
Matriks yang unsur-unsurnya berupa varian(ragam) dan kovarian
(peragam) dari sekumpulan variabel.
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Loading Vector?
Latent
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Uji Hipotesis rata-rata multivariat dua populasi yang saling bebas
Dua sampel acak yang saling bebas yangdibentuk dari populasi yang berdistribusi normal,dengan asumsi keduanya memiliki variansi yangsama, maka dapat digunakan statistik uji t sebagaiberikut :
Dengan derajat bebas
1 2
2 2
1 1 2 2
1 2 1 2
( 1) ( 1) 1 1
2
x xt
n s n s
n n n n
1 2 2n n
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
SELDI-TOF
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Surface-Enhanced Laser Desorption Ionization Time of Flight
Menjadi ion
A typical low resolution
SELDI-TOF proteomic
profile will leave up to
15.500 data points that
comprise the recordings of
data between 500 and
20.000 m/z, with high
resolution mass
spectometry instrument
generating as much as
400.000 data points for 500
to 12.000 m/z
M/z value? Intensity?
The time of flight(TOF) of the
ion, before it is detected by an
electrode, is a measure of the
mass to charge (m/z) value
The ion spectra can be
analysed by computer-
assisted tools to classify a
subset of the spectra by teir
characteristic patterns of
relative intensity.
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Transformasi Data
Rata-Rata (Pusat Data)
Varian (Tingkat persebaran data)
Skewness (kesimetrisan)
Kurtosis (keruncingan)
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Skewness (Kesimetrisan)
Skewness <0
Skewness =0
Skewness >0
Implementasi Metode Kernel Partial Least Square Untuk Klasifikasi Kanker Ovarium
Kurtosis(Keruncingan)
Pengaruh Jumlah Komponen
0%
20%
40%
60%
80%
100%
120%
3 5 10 50 75
Ra
ta-R
ata
Pe
rfo
rma
s S
Iste
m
Jumlah Komponen Latent Vector
Set A
Akurasi
Sensitivitas
Spesifisitas