08.sistemmultimedia-simpanbuka
TRANSCRIPT
-
7/26/2019 08.SistemMultimedia-SimpanBuka
1/14
Sistem Multimedia
Copyleft tsetiaji 2015 1
Pertemuan VIII
Penyimpanan dan Pengambilan Data Multimedia
A.Pencarian (search) data multimedia
Kebanyakan pengaturan dan pencarian citra digital dilakukan secara konvensional
dengan metode berbasis teks (text-based) dan penjelasan dalam bentuk teks (text-annotated).Sehingga hasil dari pencarian citra didasarkan pada pencarian dengan keyword nama file atau
metadata citra. Text-annotated pada citra digital sangat sederhana dan mudah dimanipulasi.
Terdapat dua persoalan dalam metode text-annotated. Pertama, membuat keyword untuk
sejumlah besar citra merupakan pekerjaan yang memakan banyak waktu. Kedua, keyword yang
diberikan inherently subjective dan tidak unik. Untuk mengatasi inefisiensi dan keterbatasan
metode tersebut, maka dikembangkan metode pengambilan informasi multimedia (multimedia
information retrieval) seperti citra dan video berdasarkan isi data visual berupa warna, tekstur
dan bentuk objek citra. Proses pengindeksan dan pengambilan citra dapat dilakukan secaraotomatis berdasarkan pada isi visual citra (content based) dan dapat dikembangkan untuk
aplikasi pencarian citra dengan jumlah data yang besar.
Content-based image retrieval system (CBIRS) adalah sistem dan teknik untuk
melakukan pencarian citra (image retrieval) berdasarkan isi visualnya (content-based) antara lain
seperti warna, tekstur, bentuk, tepian, dan karakteristik citra lainnya. Sedangkan MPEG-7 Color
Descriptor digunakan untuk mengekstrak fitur citra secara otomatis berdasarkan deskripsi
content yang terdapat dalam citra. Untuk proses pengindeksan dilakukan dengan memanfaatkan
library Apache Lucene. Lucene menangani pengindeksan dan pencarian berbasis full-text. Untuk
mengintegrasikan Lucene dengan aplikasi yang akan dibangun hanya perlu memahami perintahdan aturan class yang tersedia pada library Lucene yang dibangun dalam bahasa pemrograman
Java (Hatcher, 2005).
Ide aplikasi pencarian citra yang dibangun terinspirasi oleh kelebihan Lucene yang
mampu menerima segala jenis data untuk diindekskan terlebih dahulu. Untuk itu dalam aplikasi
pencarian citra, harus dibuat dahulu suatu cara untuk mengubah citra dengan merepresentasikan
citra ke dalam bilangan vektor. Kemudian membandingkan vektor citra dengan data yang telahdiindekskan, lalu akan dihitung perbandingannya. Proses selanjutnya adalah mencari relevansidari query citra dengan indeks yang ada. Hasil yang didapat berupa jarak vektor citra yang
menunjukkan kesamaan dengan data yang sebelumnya diindeks terlebih dahulu. Semakin kecil
jarak yang didapat dari proses perbandingan maka tingkat kesamaan semakin tinggi denganquery yang diberikan. Aplikasi pencarian citra ini dapat dimanfaatkan dalam pengidentifikasianarsip digital image, pencocokan warna, pencarian duplikasi image, bidang disain grafis dan lain-
lain.
Pencarian citra dapat dilakukan dengan menggunakan atribut yang melekat pada citraseperti tanggal pembuatan, lokasi penyimpanan, ukuran atau dengan atribut-atribut yang telah
didefinisikan sebelumnya. Namun hasil pencarian dengan cara ini sangat tergantung padakepiawaian user dalam mendeskripsikan citra. Selain itu pencarian tidak bisa didasarkan pada isi
visual pada citra. Teknologi pencarian citra berkembang kearah pencarian data citra berdasarkan
-
7/26/2019 08.SistemMultimedia-SimpanBuka
2/14
Sistem Multimedia
2
isi visual dari citra. Pendekatan ini didasarkan pada fitur-fitur yang dimiliki oleh citra sepertifitur warna, bentuk, tekstur atau kombinasi dari unsur-unsur tersebut. Salah satu penerapan
pencarian citra berdasarkan isi visual adalah untuk mendeteksi apakah suatu citra itu termasuk
suatu citra porno atau bukan, dengan terlebih dahulu dilakukan training terhadap sistemmengenai ciri-ciri citra yang termasuk kategori porno dan tidak porno.
Citra digital adalah citra yang disimpan dalam format digital (dalam bentuk file). Citradigital dapat didefinisikan sebagai fungsi f(x,y), dimana x dan y adalah koodinat spasial dan nilai
f(x,y) adalah intensitas citra pada koordinat tersebut. Pencarian citra berbasis isi, Cari citra daridatabase yang mirip dengan citra x. Pencarian ini didasarkan pada informasi visual dari citra.
Ada 3 modul utama dalam pencarian citra berbasis isi, yaitu:1. Ekstraksi fitur
2. Pengideks-an multidimensi
3. Pencarian citra-citra dalam database citra diindeks berdasarkan informasi yang
melekat secara visual seperti warna, tekstur, bentuk, pola, topologi citra, layout, dll.
Sebuah citra dapat direpresentasikan dengan vektor multidimensi dari fitur citra. Vektor
fitur sebenarnya berperan sebagai tanda tangan dari citra. Sebuah vektor fitur dapat diasosiasikan
sebagai sebuah titik dalam ruang multidimensi. Sebagai contoh sebuah citra direpresentasikan
dalam n-dimensi vektor fitur dimana komponen n1 adalah warna, n2 adalah bentuk, n3 topologi
citra dan n4 adalah tekstur dari citra. Dengan demikian ada N = n1+n2+n3+n4 komponen.
Dengan demikian citra contoh dapat disederhanakan dengan menggunakan pengindeks-an
berbasis isi visual dari citra.
Fitur citra yang terekstrak disimpan sebagai metadata dan citra digenerate indeksnya
berdasarkan informasi metadata ini. Informasi metadata dapat berisi beberapa ukuran dari fitur-fitur citra yang terekstrak. Vektor fitur-vektor fitur yang mirip akan dicluster dalam ruang N-dimensi. Pencarian citra dilakukan dengan mencari vektor fitur mana dalam N-dimensi yang
memiliki derajat kedekatan yang mirip dengan vektor fitur query citra. content-based adalahpengambilan data dengan merujuk pada fitur image seperti warna, tekstur, bentuk, atau
kombinasi atau yang biasa desebut dengan Content Based Image Retrieval (CBIR). Padaperkembangannya teknik context based menjadi tidak praktis dikarenakan adanya ukuran basis
data yang besar dan penilaian subjektif dalam mengartikan image dengan text. Untukmenghindari teknik ini, maka digunakan pendekatan lain dalam image retrieval yaitu content
based. CBIR adalah salah satu metodologi untuk pemanggilan kembali data image berdasarkancontent sebuah image. Teknik CBIR yang banyak digunakan adalah teknik warna, teknik tekstur,
dan teknik bentuk. Pada sistem CBIR, content visual dari image akan diekstraksi dan diuraikanmenggunakan metode pengekstrakan ciri. Untuk mendapatkan kembali image, user
menginputkan query image. Kemudian sistem akan mengekstrak image tersebut sehinggamenghasilkan fitur ciri image. Fitur ciri image query dan image dalam database akan dicari
similaritynya. Image yang memiliki nilai similarity yang paling tinggi akan muncul diurutanteratas.
Arsitektur CBIR dibagi menjadi 2 bagian. Dalam bagian pertama citra dalam database
citra diproses secara offline. Fitur dari database citra diekstrak ke bentuk informasi metadata.
Hal ini menggambarkan citra menggunakan fitur isi visual. Selanjutnya fitur digunakan untuk
Copyleft tsetiaji 2015
-
7/26/2019 08.SistemMultimedia-SimpanBuka
3/14
Sistem Multimedia
3
mengindeks citra dan kemudian indeks ini disimpan dalam database metadata bersama dengancitranya. Pada bagian kedua dilakukan proses pencarian. Query image dianalisis untuk diekstrak
fitur visualnya. Fitur visual ini digunakan untuk mencari citra yang mirip dengan yang ada dalam
database. Ekstraksi Fitur Warna, Warna merupakan fitur visual yang paling banyak digunakandalam CBIR. Warna sudah sukses diaplikasikan dalam pencarian image karena memilikihubungan yang kuat dengan obyek dalam citra. Selain itu fitur warna robust dalam komplikasi
background, perskalaan, orientasi, perspektif dan ukuran dari citra.
Sistem temu kembali citra merupakan bidang yang mengintegrasikan berbagai disiplinilmu yaitu antara lain temu kembali informasi (information retrieval), pemrosesan citra (digital
image processing) dan basisdata. Penelitian dalam bidang sistem temu kembali citra ini dipicuoleh semakin pesatnya perkembangan internet dan website, semakin murahnya teknologi
peralatan akuisisi citra (imaging), aplikasi perpustakaan digital (digital libraries), pengarsipan
citra (image archieve) dan video-on-demand. Menurut Smeulders (2000), tantangan terbesar
adalah pemanfaatan hasil-hasil penelitian dalam bidang ini tidak hanya terbatas untuk keperluancomputer vision dan basis data, tetapi harus juga bisa digunakan untuk aplikasi dibidang lain
seperti permodelan biologi, peramalan cuaca, citra medis, citra satelit dan lain-lain dalam bentukinteractive image understanding. Masalah utama dalam pengembangan sistem temu kembali
citra adalah bagaimana mengintegrasikan antara konsep representasi visual low-level yang tidak
ada korelasinya dengan konsep semantik high-level untuk mendapatkan informasi dari basis data
citra (Jiang et al 2006). Menurut Smeulder et al (2000), terdapat tiga jenis pendekatan spesifikasi
query citra yaitu :
1. Query dengan bentuk spasial, menghasilkan bentuk spasial yang berhubungan dengannilai citra secara literal.
2. Query dengan citra contoh yang memberikan masukan pada sistem berupa array of
pixel dan melakukan query pada basisdata sehingga menghasilkan urutan nominasicitra.
3. Query dengan grup citra contoh yaitu melakukan seleksi citra sesuai dengan
spesifikasi yang didefinisikan secara semantik.
Hasil dari pendekatan ini adalah kumpulan citra dengan klasifikasi yang sama.Perkembangan pesat penelitian dalam bidang ini pada umumnya lebih difokuskan pada metode
untuk merepresentasikan ciri citra yaitu warna, tekstur dan bentuk. Ditambah lagi dengan adopsilogika fuzzy dalam sistem temu kembali citra yang bertujuan untuk meningkatkan kinerja sistem
temu kembali yaitu keakuratan sistem temukembali citra. Rancangan sistem temu kembali citra(Gambar 1) dibagi menjadi dua proses utama yaitu pengindeksan dan temu kembali. Proses
pengindeksan adalah proses melakukan segmentasi berdasarkan ciri citra yaitu ciri warnamenggunakan metode adaptive histogram dan ciri bentuk menggunakan metode citra binary.
Sedangkan untuk mengurutkan ciri citra proses pengimplementasian algoritma Fagin danTreshold yang terdiri dari tahapan fuzzyfikasi nilai crisp ciri citra, agregasi serta visualisasi
nominasi citra yang relevan.
Copyleft tsetiaji 2015
-
7/26/2019 08.SistemMultimedia-SimpanBuka
4/14
Sistem Multimedia
4
Gambar 1. Rancangan Sistem Temu Kembali Citra
Penelitian ini terdiri dari tiga tahap yaitu ekstraksi ciri, pembuatan basis kaidah fuzzy dan
pengukuran kinerja sistem. Tahap ekstraksi ciri merupakan proses segmentasi citra berdasarkanwarna dan bentuk atau pengindeksan citra. Metode yang digunakan untuk segmentasi warna
adalah histogram dengan bin warna yang sudah didefinisikan (warna referensi) dan metodeuntuk segmentasi bentuk adalah momen invarian. Hasil ekstraksi ciri ini selanjutnya digunakan
untuk pembuatan file indeks citra. Validasi dan verifikasi yaitu penilaian kinerja sistemdilakukan dengan mengukur nilai presisi dan recall keluaran sistem. Basisdata citra yang
digunakan dalam penelitian ini adalah citra dengan tema yang beragam. Hal ini dimaksudkanuntuk menguji secara lebih mendetil keakuratan dan efisiensi algoritma Fagin dan Treshold.
Pengukuran Kinerja Sistem
Pemilihan temu citra yang beragam ini didasari karena banyak sekali faktor-faktor yang
mempengaruhi warna dan bentuk citra saat perekaman oleh kamera adalah sudut pandang danpencahayaan. Perbedaan sudut pandang dan pencahayaan menyebabkan citra yang dihasilkan
bervariasi warna dan bentuknya untuk setiap tema citra. Database citra yang digunakan dalam
penelitian ini adalah citra dengan tema yang beragam. Hal ini dimaksudkan untuk mengujisecara lebih mendetil keakuratan dan efisiensi algoritma Fagin dan Treshold. Pemilihan tema
citra yang beragam ini didasari karena banyak sekali faktor-faktor yang mempengaruhi warna
dan bentuk citra, pada saat perekaman oleh kamera, atau sudut pandang dan pencahayaan.
Perbedaan sudut pandang dan pencahayaan menyebabkan citra yang dihasilkan bervariasi warna
dan bentuknya untuk setiap tema citra. Dalam penelitan ini penulis memfokuskan kepada Citrabuah terhadap faktor warna dan bentuk yang dimiliki Citra buah.
Dalam menentukan kinerja sistem temu kembali pada citra yang berdasarkan bentuk dan
warna dengan menggunakan Algoritma Fagin dan Threshold, akan menjadi benar dan akurat,
Copyleft tsetiaji 2015
-
7/26/2019 08.SistemMultimedia-SimpanBuka
5/14
Sistem Multimedia
5
jika jumlah citra yang berhasil diidentifikasi dengan benar oleh sistem. Pengukuran kinerjasistem ini dapat menggunakan persamaan sebagai berikut:
Basis data multimedia merupakan salah satu media penyimpanan dalam berbagai format,
salah satunya adalah format citra atau image. Dalam pencarian data multimedia terdapat kendalauntuk pencarian data yang sesuai dengan input query yang diberikan. Sebagai salah satu contoh
sederhana adalah bagaimana mencari obyek yang memiliki obyek lingkaran dan segitiga. Padaawal image retrieval dilakukan menggunakan pendekatan pengindeksan dan informasi citra
berbasis teks. Teknik pencarian berbasis teks menjadi tidak praktis karena dua alasan, yaitu:ukuran basis data citra yang besar dan subyektif dalam mengartikan citra dengan teks. Kata
kunci yang dikodekan orang adalah terbatas pada beberapa istilah yang dihasilkan untuk masing-masing referensi gambar. Lebih lanjut beberapa gambar yang dihasilkan akan tampak sangat
berbeda dibandingkan dengan keinginan user dari otomatisasi pencarian menggunakan kata
kunci, sebagai contoh pada gambar di bawah dengan memasukkan kata kunci bunga putih padaGoogle Search Engine akan dihasilkan gambar yang ada gambar penari berlatar belakang bunga,dan gambar vas bunga.
Copyleft tsetiaji 2015
-
7/26/2019 08.SistemMultimedia-SimpanBuka
6/14
Sistem Multimedia
6
Proses temu kembali yang akan dilakukan dengan mensegmentasi citra menjadi 4x4bagian sub blok yang diekstrak dalam format ruang warna HSV, kemudian dijadikan fitur baru.
Setelah proses ekstraksi warna, langkah selanjutnya mengekstrak tekstur dengan metode DWT
Haar Wavelet dengan 2 (dua) tingkat dekomposisi yang sebelumnya memroses histogram warna,kemudian juga dijadikan fitur baru. Sehingga terdapat 6 fitur baru yang akan dijadikan acuanbaru untuk pembobotan, guna mengukur jarak kesamaan tiap piksel pada citra yang akan di-
retrieve. Tahap selanjutnya adalah nilai dari 6 fitur baru diambil rata ratanya dan diukurjumlah tiap piksel yang terdapat pada sampling image. Kemudian data diolah dengan software
HCE[11] untuk mendapatkan nilai minimum similarity
B.Pengambilan (retrieval) data multimedia
Information Retrieval berkaitan dengan representasi, penyimpanan, pengorganisasian,dan perolehan informasi. Pengorganisasian dari informasi tersebut harus memungkinkan
pemakai mendapatkan informasi sesuai dengan yang diinginkan. Informasi yang diorganisir
tersebut disimpan dalam bentuk data yang dapat berupa teks maupun multimedia. Jika data yang
digunakan berupa data teks, maka dapat digolongkan ke dalam text retrieval, sedangkan jika data
yang digunakan berupa data multimedia maka dapat digolongkan ke dalam multimedia retrieval.
Multimedia retrieval mempelajari cara representasi, penyimpanan, pengorganisasian, dan
perolehan informasi dari data multimedia. Multimedia itu sendiri adalah penggunaan beberapa
media yang berbeda yang menyampaikan informasi. Media-media tersebut adalah teks, suara
(audio), gambar, dan video, yang biasanya dikombinasikan untuk membentuk suatu aplikasi
multimedia. Kombinasi dari berbagai media tersebut meningkatkan kemudahan bagi pemakai
aplikasi multimedia untuk mendapatkan informasi yang diinginkan. Aplikasi multimediadigunakan dalam berbagai bidang, yang antara lain mencakup seni, pendidikan, adalah aplikasi
ensiklopedi elektronik, yang memungkinkan pemakai untuk memperoleh informasi dalambentuk teks, yang disertai dengan animasi suara dan gambar yang mengilustrasikan topik yang
diinginkan.
Multimedia retrieval terbagi menjadi beberapa bidang, yaitu audio retrieval ( pencariankembali informasi yang berkenaan dengan suara), image retrieval ( pencarian kembali informasi
yang berkenaan dengan gambar), dan video retrieval ( pencarian kembali informasi yangberkenaan dengan video ). Audio retrieval terbagi menjadi speech retrieval (pencarian kembali
informasi yang berkenaan dengan suara manusia) dan music retrieval ( pencarian kembaliinformasi yang berkenaan dengan musik). Music Retrieval mencakup kegiatan menyimpan,
mengorganisasikan, melacak dan mengambil informasi dari suatu musik. Pengguna dapat
mencari musik yang diinginkan dengan mengetikkan judul lagu ataupun potongan lagu,
menyiulkan ataupun menyenandungkan lagu yang dicari. Selanjutnya informasi dari pengguna
ini ( yang biasa disebut pertanyaan atau query) digunakan untuk mencari lagu dalam koleksimusik yang ada sehingga pengguna dapat memperoleh judul ataupun lembaran musik dari lagu
tersebut. Jenis-jenis musik yang beragam dan jumlah koleksi musik yang besar juga memerlukanpenanganan yang baik. Oleh sebab itu music retrieval juga mempelajari cara untuk melakukan
klasifikasi lagu-lagu dengan tepat, misalkan lagu pop, klasik, ataupun jazz sehingga hasilnyadapat memudahkan pengguna untuk melakukan pencarian suatu lagu.
Copyleft tsetiaji 2015
-
7/26/2019 08.SistemMultimedia-SimpanBuka
7/14
Sistem Multimedia
7
Selama ini banyak dilakukan penelitian dalam bidang music retrieval dengan mengelolaberbagai aspek informasi dalam musik. Penelitian yang sudah pernah dilakukan diantaranya
adalah klasifikasi musik latin ballroom dance, penelitian efektifitas dari informasi durasi nada
untuk music retrieval dengan koleksi lagu pop, klasifikasi lagu berdasarkan jenis suarapenyanyinya dengan koleksi lagu pop, dan lain sebagainya. Namun sampai saat ini, belum adayang melakukan penelitian untuk mengklasifikasikan musik daerah Indonesia.
Penelitian tentang multimedia database terutama untuk indexing dan retrieval data sudah
memasuki proses produksi software yang sudah dikomersilkan di pasar diantaranya : QBICproduk IBM, Virage produk Virage Inc, Excalibur Technologies, Informedia produk Informedia
Technologie, Surfimage product Europen CBIR Technology, Netra produk, Synapse.
Produk-produk tersebut di atas pada umumnya menggunakan retrieval berdasarkan
kategori content dan warna. Dimana user mendeskripsikan image apa yang akan dicari dengan
cara memilih kategori misalnya jenis image, Negara, tahun pembuatan, pembuat dsb atau denganmendeskripsikan warna atau bentuk.
Penerapan CBIR antara lain untuk pencegahan kejahatan, militer, hak milik intelektual,
arsitektural dan desain rancang-bangun, fashion and interior desain, iklan dan jurnalistik,
diagnosa medis, Informasi geografis dan sistem remote sensing, pusaka budaya, pendidikan dan
lalihan, hiburan,web searching.
CBIR ( Content-based Image Retrieval ) adalah salah satu metodologi untk pemanggilankembali data gambar berdasarkan content sebuah gambar. Teknik CBIR yang banyak digunakan
adalah teknik warna, teknik tekstur, teknik bentuk ( perceptual atribut ). Menjadi suatu object
penelitian yang cukup menantang untuk atribut interpreter dan reaktif.
Gambar 2 memperlihatkan bentuk umum system Content Base Image Retrieval. Pada
gambar ini terlihat ada dua jalur utama, Query dan database pada kedua lajur ini terdapat visualcontent description ( adanya ekstraksi informasi image ) yang akan digunakan untuk proses
similarity comparison dan indexing dan retrieval.
Copyleft tsetiaji 2015
-
7/26/2019 08.SistemMultimedia-SimpanBuka
8/14
Sistem Multimedia
8
Gambar 2. Sistem CBIR Retrieval
Standard yang digunakan untuk CBIR saat ini meliputi standard Network Protokol
(TCP/IP), format penyimpanan (TIFF, JPEG), compresi (JPEG, MPEG-2), Database command(SQL), Metadata (RDF).
Gambar 3 menggambarkan framework CBIR yang disusun berdasarkan hasil diskusi
yang membahas tentang jurnal dan artikel tentang CBIR sepuluh tahun terakhir. Pada frame
work CBIR terdapat empat modul yakni : Modul Interaksi Pemakai, Modul Knowledge, ModulSimpanan Data, Modul Observasi. Penelitian yang penulis akan lakukan menitik beratkan padatiga modul pertama yakni modul interaksi pemakai, knowledge dan simpanan data.
Indexing, retrieval dan database tiga hal yang tidak dapat dipisahkan ketika
membicarakan data dan informasi. Indexing yang baik akan sangat menentukan kecepatan danketepatan retrieval data yang secara phisik juga sangat ditentukan oleh model database yang
digunakan.
Copyleft tsetiaji 2015
-
7/26/2019 08.SistemMultimedia-SimpanBuka
9/14
Sistem Multimedia
9
Gambar 3. Framework CBIR
Gambar di bawah ini menggambarkan hubungan antara data, struktur index dan retrieval.
Secara umum metode indexing dibagi dalam dua bagian yakni :
Copyleft tsetiaji 2015
-
7/26/2019 08.SistemMultimedia-SimpanBuka
10/14
Sistem Multimedia
10
1. Indexing berdasarkan deskripsi teks ( Caption indexing, keyword, standard subyekheading, klasifikasi dsb )
2. Indexing berdasarkan image content (warna, bentuk, arah, tekstur, relasi spasial dsb )
Copyleft tsetiaji 2015
-
7/26/2019 08.SistemMultimedia-SimpanBuka
11/14
Sistem Multimedia
11
Untuk pemanggilan kembali data image dengan index berdasarkan teks digunakan textualQuery sedangkan untuk pemanggilan kembali data Image dengan index berdasarkan image content
digunakan visual query. Di dalam textual query, kata-kata digunakan untuk mendapatkan kembali
gambar, sedangkan dalam query visual ( perolehan kembali berdasarkan content-based) image didapat
kembali berdasarkan karakteristik visual seperti warna, tekstur, bentuk atau sample. Kedua metode di
atas memiliki keterbatasan, diantaranya untuk metode textual query karena dilakukan oleh manusia
dalam mendeskripsikan gambar yang akan disimpan mengakibatkan ketergantungan pada manusia
sebagai pendeskripsi image sangat tinggi. Hal ini akan menyebabkan biaya tinggi. Di samping itu, jikadata dalam ukuran besar ( jumlah ) dalam pendeskripsian data dapat terjadi pendeskripsian yang tidakkonsisten, meluas dan sangat tergantung pada pemahaman dan penafsiran terhadap image yang dilihat.
Retrieval berdasarkan content based memiliki masalah pada penafsiran gambar secara efisiendan benar berdasarkan formulasi tertentu. Hal ini terjadi karena proses dilakukan oleh komputer yang
memiliki keterbatasan dalam menilai rasa, suasan, keindahan. Hal ini disebabkan karena adanya dua
gap yang ada:
1. Sensory gap, adanya keterbatasan komputer sebagai alat bantu dalam menangkap semua
informasi yang ada dalam sebuah image2. Semantic Gap, adanya perbedaan interpretasi karakteristik sebuah image yang dilakukan
oleh user pad awaktu dan suasana yang berbeda
Desain Content Based Image Information Retrieval
Ada tiga bagian desain utama yang ada pada content based image information retrieval yakni:(1). Ekstraksi karakteristik dan pengindeksan; (2). Karakateristik dan retrieval; (3). Aplikasi untuk
menampilkan hasil query.
1. Ekstraksi karakteristik dan pengindeksan
Proses ekstraksi dan pengindexan adalah proses ekstraksi image yang akan digunakan sebagaidasar indexing dan pengembangan metode index. Tahap ini mencakup penentuan proses smoothing
sebagai bagian dari pra proses, proses ekstraksi, proses pembuatan index untuk image yang akandisimpan dalam database multimedia.
Copyleft tsetiaji 2015
-
7/26/2019 08.SistemMultimedia-SimpanBuka
12/14
Sistem Multimedia
12
Ada tiga proses ekstraksi yang dilakukan yakni ekstraksi kata kunci, ekstraksi karakteristik
global dan ekstraksi detail.
a. Ektraksi kata kunci, Ektraksi ini dilakukan secara manual berdasarkan interpretasi dari user
terhadap suatu image. Ekstrasi yang dilakukan ditekankan pada karakteristik abstrak seperti
suasana, perasaan, dan selain itu pad atahap ini diharapkan juga mendapatkan informasi
tentang pemilik gambar, tanggal pembuatan, tanggal pengeditan, metode pengambilan gambar,lokasi dsb. Proses ini tidak memerlukan praproses karena dilakukan secara manual
b. Ekstraksi karakteristik global, ekstraksi ini merupakan ekstraksi berdasarkan karakateristik
warna, shape, dan teksturc. Ektraksi karakateristik detail, ekstraksi ini merupakan ekstraksi dalam histogram warna,
histogram shape dan tekstur.
Sebelum dilakuam proses ektraksi karakteristik global atau proses ekstraksi karakteristik detailperlu dilakukan praproses yakni proses smoothing untuk menghilangkan noise yang ada. Proses ini
dilakukan untuk mendapatkan image dengan kualitas yang lebih baik agar proses ekstraksi dapatberjalan dengan baik sebagai contoh untuk mendeteksi shape diperlukan proses edge detection. Pada
proses ini memerlukan 3 tahapan proses : pertama noise smoothing ( Mean Gaussian distribution ),edge enhancement ( filtering), Edge localozation ( menentukan edge/shape). Disini terlihat bahwa
proses smoothing diperlukan agar proses ektraksi akan mendapat hasil yang benar-benar
mencerminkan karakteristik dari image ybs.
Hasil ekstraksi kata kunci dan ektraksi karakteristik global akan digunakan untuk
penyusunan/pembuatan index. Sedangkan hasil ekstraksi karakateristik global digunakan sebagaipembanding/filter pada saat tetrievak data. Jadi hasil retrieval yang sudah diperoleh berdasarkan
index yang ada akan di filter kembali dengan hasil karakteristik detailnya sehingga diharapkan di
dapat image yang paling sesuai dengan kriteria atau karakteristik yang diminta/ditentukan oleh user.
Database multimedia. Tabel index dan karakateristik detail akan disimpan dalam database
multimedia. Sedangkan image tidak disimpan dalam database tersebut ( secar afisik ) namun image
tetap tersimpan dalam bentuk satuan file yang diletakkan pada sebuah direktori yang sudah
Copyleft tsetiaji 2015
-
7/26/2019 08.SistemMultimedia-SimpanBuka
13/14
Sistem Multimedia
13
ditetapkan. Jadi secara fisik database multimedia tidak menyimpan file image namun menyimpan
tabel index dan karakteristik detail. Hal ini sengaja di desain seperti ini dengan harapan prosesretrieval yang nanti akan dilakukan tidak langsung membandungkan kriteria pencarian ( baik
deskripsi teks maupun contoh image ) pada image, namun cukup melakukan pencarian danpencocokan pada index yang telah ada. Hal ini diharapkan akan mempercepat proses karena tida
kdiperlukan kerja prosesor dan alokasi memori yang besar jika langsung dilakukan pembandingandan pencarian pada image secara langsung.
2. Ekstraksi Karakteristik dan Retrieval
Proses Ekstraksi Karakteristik dan Retrieval adalah proses penentuan index dan retrieval
berdasarkan karakteristik index ( Query Teks ) serta ekstraksi Karakteristik Global untuk penentuanindex, Sedangkan untuk proses query image dilakukan proses praproses, proses ekstraksi
karakteristik global untuk penentuan index yang akan digunakan untuk retrieval berdasarkan
karakteristik index. Proses karakteristik detail yang akan digunakan untuk retrieval berdasarkankarakteristik detail dari hasil image retrieval berdasarkan karakteristik index.
Query berdasarkan teks tidak memerlukan proses ektraksi namun langsung pada penentuan
indeks dan retrieval data sesuai dengan krakateristik index ybs. Proses ini diawali dengan penentuan
diskrisi secara teks oleh user kemudian system akan mencari/menentukan index yang sesuai,
kemudian berdasarkan tabel index yang sudah ada dilakukan pencocokan karakteristik. Dari proses
ini diperoleh image yang sesuai dengan yang dicari. Query berdasarkan image perlu dilakukan
praproses diantaranya smoothing untuk menghilangkan noise yang ada. Proses ini dilakukan untukmendapatkan image dengan kualitas yang lebih baik agar proses ekstraksi dapat berjalan dengan
baik. Kemudian diekstraksi sama halnya pada proses pengindeksan yakni ektraksi karakteristik
global dan ektraksi karakteristik detail.
Proses ekstraksi karakteristik global (ektraksi berdasarkan karakteristik warna, shape dan
tekstur) untuk dapat menentukan index sesuai yang akan digunakan untuk proses retrieval
berdasarkan index yang telah ada. Dari proses ini diperoleh satu atau beberapa image yang sesuai.Proses ekstraksi karakteristik detail (ektraksi ini merupakan ektraksi dalam histogram warna,
histogram shape dan tekstur) untuk mendapatkan karakteristik berdasarkan histogram yang akandibandingkan dengan krakateristik detail yang sudah ada yang tersimpan dalam database
image/multimedia. Hasil yang diperoleh akan dibandingkan dengan hasil yang diperoleh dariretrieval karakteristik index. Dengan proses ini diharapkan akan didapat image yang paling relevan.
Proses retrieval yang dilakukan pada query ini tidak dengan cara membandingkan gambarsecara langsung namun dengan pencarian dan pencocokan hasil ektraksi image yang dimaksud
berdasarkan nomor index yang telah ada. Multimedia retrieval merupakan bidang lintas sektor.
Memperluas dan melampaui dari batas-batas budaya, seni, dan ilmu pengetahuan, pencarianinformasi digital adalah salah satu tantangan besar pada saat ini. Perpustakaan digital, bio-
komputasi, ilmu kedokteran, internet dan situs jaringan sosial, streaming video, multimedia database,
koleksi warisan budaya dan jaringan P2P telah menciptakan kebutuhan di seluruh dunia dan teknik
paradigma baru tentang bagaimana untuk mencari, pencarian dan merangkum koleksi multimedia
dan lebih umum lagi bagaimana menkonsumsi materi multimedia secara efisien (Wei dan Chang,2009). Pemahaman tentang multimedia retrieval menekankan pada temu kembali data/ informasi
Copyleft tsetiaji 2015
-
7/26/2019 08.SistemMultimedia-SimpanBuka
14/14
Sistem Multimedia
14
yang sesuai dengan keyword/ kata kunci yang diminta dan dibatasi oleh proses pencarian yang
interaktif.
Referensi:http://jeje.staff.gunadarma.ac.id/
Copyleft tsetiaji 2015