08.sistemmultimedia-simpanbuka

Upload: a-triono-setiaji

Post on 03-Mar-2018

244 views

Category:

Documents


4 download

TRANSCRIPT

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    1/14

    Sistem Multimedia

    Copyleft tsetiaji 2015 1

    Pertemuan VIII

    Penyimpanan dan Pengambilan Data Multimedia

    A.Pencarian (search) data multimedia

    Kebanyakan pengaturan dan pencarian citra digital dilakukan secara konvensional

    dengan metode berbasis teks (text-based) dan penjelasan dalam bentuk teks (text-annotated).Sehingga hasil dari pencarian citra didasarkan pada pencarian dengan keyword nama file atau

    metadata citra. Text-annotated pada citra digital sangat sederhana dan mudah dimanipulasi.

    Terdapat dua persoalan dalam metode text-annotated. Pertama, membuat keyword untuk

    sejumlah besar citra merupakan pekerjaan yang memakan banyak waktu. Kedua, keyword yang

    diberikan inherently subjective dan tidak unik. Untuk mengatasi inefisiensi dan keterbatasan

    metode tersebut, maka dikembangkan metode pengambilan informasi multimedia (multimedia

    information retrieval) seperti citra dan video berdasarkan isi data visual berupa warna, tekstur

    dan bentuk objek citra. Proses pengindeksan dan pengambilan citra dapat dilakukan secaraotomatis berdasarkan pada isi visual citra (content based) dan dapat dikembangkan untuk

    aplikasi pencarian citra dengan jumlah data yang besar.

    Content-based image retrieval system (CBIRS) adalah sistem dan teknik untuk

    melakukan pencarian citra (image retrieval) berdasarkan isi visualnya (content-based) antara lain

    seperti warna, tekstur, bentuk, tepian, dan karakteristik citra lainnya. Sedangkan MPEG-7 Color

    Descriptor digunakan untuk mengekstrak fitur citra secara otomatis berdasarkan deskripsi

    content yang terdapat dalam citra. Untuk proses pengindeksan dilakukan dengan memanfaatkan

    library Apache Lucene. Lucene menangani pengindeksan dan pencarian berbasis full-text. Untuk

    mengintegrasikan Lucene dengan aplikasi yang akan dibangun hanya perlu memahami perintahdan aturan class yang tersedia pada library Lucene yang dibangun dalam bahasa pemrograman

    Java (Hatcher, 2005).

    Ide aplikasi pencarian citra yang dibangun terinspirasi oleh kelebihan Lucene yang

    mampu menerima segala jenis data untuk diindekskan terlebih dahulu. Untuk itu dalam aplikasi

    pencarian citra, harus dibuat dahulu suatu cara untuk mengubah citra dengan merepresentasikan

    citra ke dalam bilangan vektor. Kemudian membandingkan vektor citra dengan data yang telahdiindekskan, lalu akan dihitung perbandingannya. Proses selanjutnya adalah mencari relevansidari query citra dengan indeks yang ada. Hasil yang didapat berupa jarak vektor citra yang

    menunjukkan kesamaan dengan data yang sebelumnya diindeks terlebih dahulu. Semakin kecil

    jarak yang didapat dari proses perbandingan maka tingkat kesamaan semakin tinggi denganquery yang diberikan. Aplikasi pencarian citra ini dapat dimanfaatkan dalam pengidentifikasianarsip digital image, pencocokan warna, pencarian duplikasi image, bidang disain grafis dan lain-

    lain.

    Pencarian citra dapat dilakukan dengan menggunakan atribut yang melekat pada citraseperti tanggal pembuatan, lokasi penyimpanan, ukuran atau dengan atribut-atribut yang telah

    didefinisikan sebelumnya. Namun hasil pencarian dengan cara ini sangat tergantung padakepiawaian user dalam mendeskripsikan citra. Selain itu pencarian tidak bisa didasarkan pada isi

    visual pada citra. Teknologi pencarian citra berkembang kearah pencarian data citra berdasarkan

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    2/14

    Sistem Multimedia

    2

    isi visual dari citra. Pendekatan ini didasarkan pada fitur-fitur yang dimiliki oleh citra sepertifitur warna, bentuk, tekstur atau kombinasi dari unsur-unsur tersebut. Salah satu penerapan

    pencarian citra berdasarkan isi visual adalah untuk mendeteksi apakah suatu citra itu termasuk

    suatu citra porno atau bukan, dengan terlebih dahulu dilakukan training terhadap sistemmengenai ciri-ciri citra yang termasuk kategori porno dan tidak porno.

    Citra digital adalah citra yang disimpan dalam format digital (dalam bentuk file). Citradigital dapat didefinisikan sebagai fungsi f(x,y), dimana x dan y adalah koodinat spasial dan nilai

    f(x,y) adalah intensitas citra pada koordinat tersebut. Pencarian citra berbasis isi, Cari citra daridatabase yang mirip dengan citra x. Pencarian ini didasarkan pada informasi visual dari citra.

    Ada 3 modul utama dalam pencarian citra berbasis isi, yaitu:1. Ekstraksi fitur

    2. Pengideks-an multidimensi

    3. Pencarian citra-citra dalam database citra diindeks berdasarkan informasi yang

    melekat secara visual seperti warna, tekstur, bentuk, pola, topologi citra, layout, dll.

    Sebuah citra dapat direpresentasikan dengan vektor multidimensi dari fitur citra. Vektor

    fitur sebenarnya berperan sebagai tanda tangan dari citra. Sebuah vektor fitur dapat diasosiasikan

    sebagai sebuah titik dalam ruang multidimensi. Sebagai contoh sebuah citra direpresentasikan

    dalam n-dimensi vektor fitur dimana komponen n1 adalah warna, n2 adalah bentuk, n3 topologi

    citra dan n4 adalah tekstur dari citra. Dengan demikian ada N = n1+n2+n3+n4 komponen.

    Dengan demikian citra contoh dapat disederhanakan dengan menggunakan pengindeks-an

    berbasis isi visual dari citra.

    Fitur citra yang terekstrak disimpan sebagai metadata dan citra digenerate indeksnya

    berdasarkan informasi metadata ini. Informasi metadata dapat berisi beberapa ukuran dari fitur-fitur citra yang terekstrak. Vektor fitur-vektor fitur yang mirip akan dicluster dalam ruang N-dimensi. Pencarian citra dilakukan dengan mencari vektor fitur mana dalam N-dimensi yang

    memiliki derajat kedekatan yang mirip dengan vektor fitur query citra. content-based adalahpengambilan data dengan merujuk pada fitur image seperti warna, tekstur, bentuk, atau

    kombinasi atau yang biasa desebut dengan Content Based Image Retrieval (CBIR). Padaperkembangannya teknik context based menjadi tidak praktis dikarenakan adanya ukuran basis

    data yang besar dan penilaian subjektif dalam mengartikan image dengan text. Untukmenghindari teknik ini, maka digunakan pendekatan lain dalam image retrieval yaitu content

    based. CBIR adalah salah satu metodologi untuk pemanggilan kembali data image berdasarkancontent sebuah image. Teknik CBIR yang banyak digunakan adalah teknik warna, teknik tekstur,

    dan teknik bentuk. Pada sistem CBIR, content visual dari image akan diekstraksi dan diuraikanmenggunakan metode pengekstrakan ciri. Untuk mendapatkan kembali image, user

    menginputkan query image. Kemudian sistem akan mengekstrak image tersebut sehinggamenghasilkan fitur ciri image. Fitur ciri image query dan image dalam database akan dicari

    similaritynya. Image yang memiliki nilai similarity yang paling tinggi akan muncul diurutanteratas.

    Arsitektur CBIR dibagi menjadi 2 bagian. Dalam bagian pertama citra dalam database

    citra diproses secara offline. Fitur dari database citra diekstrak ke bentuk informasi metadata.

    Hal ini menggambarkan citra menggunakan fitur isi visual. Selanjutnya fitur digunakan untuk

    Copyleft tsetiaji 2015

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    3/14

    Sistem Multimedia

    3

    mengindeks citra dan kemudian indeks ini disimpan dalam database metadata bersama dengancitranya. Pada bagian kedua dilakukan proses pencarian. Query image dianalisis untuk diekstrak

    fitur visualnya. Fitur visual ini digunakan untuk mencari citra yang mirip dengan yang ada dalam

    database. Ekstraksi Fitur Warna, Warna merupakan fitur visual yang paling banyak digunakandalam CBIR. Warna sudah sukses diaplikasikan dalam pencarian image karena memilikihubungan yang kuat dengan obyek dalam citra. Selain itu fitur warna robust dalam komplikasi

    background, perskalaan, orientasi, perspektif dan ukuran dari citra.

    Sistem temu kembali citra merupakan bidang yang mengintegrasikan berbagai disiplinilmu yaitu antara lain temu kembali informasi (information retrieval), pemrosesan citra (digital

    image processing) dan basisdata. Penelitian dalam bidang sistem temu kembali citra ini dipicuoleh semakin pesatnya perkembangan internet dan website, semakin murahnya teknologi

    peralatan akuisisi citra (imaging), aplikasi perpustakaan digital (digital libraries), pengarsipan

    citra (image archieve) dan video-on-demand. Menurut Smeulders (2000), tantangan terbesar

    adalah pemanfaatan hasil-hasil penelitian dalam bidang ini tidak hanya terbatas untuk keperluancomputer vision dan basis data, tetapi harus juga bisa digunakan untuk aplikasi dibidang lain

    seperti permodelan biologi, peramalan cuaca, citra medis, citra satelit dan lain-lain dalam bentukinteractive image understanding. Masalah utama dalam pengembangan sistem temu kembali

    citra adalah bagaimana mengintegrasikan antara konsep representasi visual low-level yang tidak

    ada korelasinya dengan konsep semantik high-level untuk mendapatkan informasi dari basis data

    citra (Jiang et al 2006). Menurut Smeulder et al (2000), terdapat tiga jenis pendekatan spesifikasi

    query citra yaitu :

    1. Query dengan bentuk spasial, menghasilkan bentuk spasial yang berhubungan dengannilai citra secara literal.

    2. Query dengan citra contoh yang memberikan masukan pada sistem berupa array of

    pixel dan melakukan query pada basisdata sehingga menghasilkan urutan nominasicitra.

    3. Query dengan grup citra contoh yaitu melakukan seleksi citra sesuai dengan

    spesifikasi yang didefinisikan secara semantik.

    Hasil dari pendekatan ini adalah kumpulan citra dengan klasifikasi yang sama.Perkembangan pesat penelitian dalam bidang ini pada umumnya lebih difokuskan pada metode

    untuk merepresentasikan ciri citra yaitu warna, tekstur dan bentuk. Ditambah lagi dengan adopsilogika fuzzy dalam sistem temu kembali citra yang bertujuan untuk meningkatkan kinerja sistem

    temu kembali yaitu keakuratan sistem temukembali citra. Rancangan sistem temu kembali citra(Gambar 1) dibagi menjadi dua proses utama yaitu pengindeksan dan temu kembali. Proses

    pengindeksan adalah proses melakukan segmentasi berdasarkan ciri citra yaitu ciri warnamenggunakan metode adaptive histogram dan ciri bentuk menggunakan metode citra binary.

    Sedangkan untuk mengurutkan ciri citra proses pengimplementasian algoritma Fagin danTreshold yang terdiri dari tahapan fuzzyfikasi nilai crisp ciri citra, agregasi serta visualisasi

    nominasi citra yang relevan.

    Copyleft tsetiaji 2015

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    4/14

    Sistem Multimedia

    4

    Gambar 1. Rancangan Sistem Temu Kembali Citra

    Penelitian ini terdiri dari tiga tahap yaitu ekstraksi ciri, pembuatan basis kaidah fuzzy dan

    pengukuran kinerja sistem. Tahap ekstraksi ciri merupakan proses segmentasi citra berdasarkanwarna dan bentuk atau pengindeksan citra. Metode yang digunakan untuk segmentasi warna

    adalah histogram dengan bin warna yang sudah didefinisikan (warna referensi) dan metodeuntuk segmentasi bentuk adalah momen invarian. Hasil ekstraksi ciri ini selanjutnya digunakan

    untuk pembuatan file indeks citra. Validasi dan verifikasi yaitu penilaian kinerja sistemdilakukan dengan mengukur nilai presisi dan recall keluaran sistem. Basisdata citra yang

    digunakan dalam penelitian ini adalah citra dengan tema yang beragam. Hal ini dimaksudkanuntuk menguji secara lebih mendetil keakuratan dan efisiensi algoritma Fagin dan Treshold.

    Pengukuran Kinerja Sistem

    Pemilihan temu citra yang beragam ini didasari karena banyak sekali faktor-faktor yang

    mempengaruhi warna dan bentuk citra saat perekaman oleh kamera adalah sudut pandang danpencahayaan. Perbedaan sudut pandang dan pencahayaan menyebabkan citra yang dihasilkan

    bervariasi warna dan bentuknya untuk setiap tema citra. Database citra yang digunakan dalam

    penelitian ini adalah citra dengan tema yang beragam. Hal ini dimaksudkan untuk mengujisecara lebih mendetil keakuratan dan efisiensi algoritma Fagin dan Treshold. Pemilihan tema

    citra yang beragam ini didasari karena banyak sekali faktor-faktor yang mempengaruhi warna

    dan bentuk citra, pada saat perekaman oleh kamera, atau sudut pandang dan pencahayaan.

    Perbedaan sudut pandang dan pencahayaan menyebabkan citra yang dihasilkan bervariasi warna

    dan bentuknya untuk setiap tema citra. Dalam penelitan ini penulis memfokuskan kepada Citrabuah terhadap faktor warna dan bentuk yang dimiliki Citra buah.

    Dalam menentukan kinerja sistem temu kembali pada citra yang berdasarkan bentuk dan

    warna dengan menggunakan Algoritma Fagin dan Threshold, akan menjadi benar dan akurat,

    Copyleft tsetiaji 2015

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    5/14

    Sistem Multimedia

    5

    jika jumlah citra yang berhasil diidentifikasi dengan benar oleh sistem. Pengukuran kinerjasistem ini dapat menggunakan persamaan sebagai berikut:

    Basis data multimedia merupakan salah satu media penyimpanan dalam berbagai format,

    salah satunya adalah format citra atau image. Dalam pencarian data multimedia terdapat kendalauntuk pencarian data yang sesuai dengan input query yang diberikan. Sebagai salah satu contoh

    sederhana adalah bagaimana mencari obyek yang memiliki obyek lingkaran dan segitiga. Padaawal image retrieval dilakukan menggunakan pendekatan pengindeksan dan informasi citra

    berbasis teks. Teknik pencarian berbasis teks menjadi tidak praktis karena dua alasan, yaitu:ukuran basis data citra yang besar dan subyektif dalam mengartikan citra dengan teks. Kata

    kunci yang dikodekan orang adalah terbatas pada beberapa istilah yang dihasilkan untuk masing-masing referensi gambar. Lebih lanjut beberapa gambar yang dihasilkan akan tampak sangat

    berbeda dibandingkan dengan keinginan user dari otomatisasi pencarian menggunakan kata

    kunci, sebagai contoh pada gambar di bawah dengan memasukkan kata kunci bunga putih padaGoogle Search Engine akan dihasilkan gambar yang ada gambar penari berlatar belakang bunga,dan gambar vas bunga.

    Copyleft tsetiaji 2015

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    6/14

    Sistem Multimedia

    6

    Proses temu kembali yang akan dilakukan dengan mensegmentasi citra menjadi 4x4bagian sub blok yang diekstrak dalam format ruang warna HSV, kemudian dijadikan fitur baru.

    Setelah proses ekstraksi warna, langkah selanjutnya mengekstrak tekstur dengan metode DWT

    Haar Wavelet dengan 2 (dua) tingkat dekomposisi yang sebelumnya memroses histogram warna,kemudian juga dijadikan fitur baru. Sehingga terdapat 6 fitur baru yang akan dijadikan acuanbaru untuk pembobotan, guna mengukur jarak kesamaan tiap piksel pada citra yang akan di-

    retrieve. Tahap selanjutnya adalah nilai dari 6 fitur baru diambil rata ratanya dan diukurjumlah tiap piksel yang terdapat pada sampling image. Kemudian data diolah dengan software

    HCE[11] untuk mendapatkan nilai minimum similarity

    B.Pengambilan (retrieval) data multimedia

    Information Retrieval berkaitan dengan representasi, penyimpanan, pengorganisasian,dan perolehan informasi. Pengorganisasian dari informasi tersebut harus memungkinkan

    pemakai mendapatkan informasi sesuai dengan yang diinginkan. Informasi yang diorganisir

    tersebut disimpan dalam bentuk data yang dapat berupa teks maupun multimedia. Jika data yang

    digunakan berupa data teks, maka dapat digolongkan ke dalam text retrieval, sedangkan jika data

    yang digunakan berupa data multimedia maka dapat digolongkan ke dalam multimedia retrieval.

    Multimedia retrieval mempelajari cara representasi, penyimpanan, pengorganisasian, dan

    perolehan informasi dari data multimedia. Multimedia itu sendiri adalah penggunaan beberapa

    media yang berbeda yang menyampaikan informasi. Media-media tersebut adalah teks, suara

    (audio), gambar, dan video, yang biasanya dikombinasikan untuk membentuk suatu aplikasi

    multimedia. Kombinasi dari berbagai media tersebut meningkatkan kemudahan bagi pemakai

    aplikasi multimedia untuk mendapatkan informasi yang diinginkan. Aplikasi multimediadigunakan dalam berbagai bidang, yang antara lain mencakup seni, pendidikan, adalah aplikasi

    ensiklopedi elektronik, yang memungkinkan pemakai untuk memperoleh informasi dalambentuk teks, yang disertai dengan animasi suara dan gambar yang mengilustrasikan topik yang

    diinginkan.

    Multimedia retrieval terbagi menjadi beberapa bidang, yaitu audio retrieval ( pencariankembali informasi yang berkenaan dengan suara), image retrieval ( pencarian kembali informasi

    yang berkenaan dengan gambar), dan video retrieval ( pencarian kembali informasi yangberkenaan dengan video ). Audio retrieval terbagi menjadi speech retrieval (pencarian kembali

    informasi yang berkenaan dengan suara manusia) dan music retrieval ( pencarian kembaliinformasi yang berkenaan dengan musik). Music Retrieval mencakup kegiatan menyimpan,

    mengorganisasikan, melacak dan mengambil informasi dari suatu musik. Pengguna dapat

    mencari musik yang diinginkan dengan mengetikkan judul lagu ataupun potongan lagu,

    menyiulkan ataupun menyenandungkan lagu yang dicari. Selanjutnya informasi dari pengguna

    ini ( yang biasa disebut pertanyaan atau query) digunakan untuk mencari lagu dalam koleksimusik yang ada sehingga pengguna dapat memperoleh judul ataupun lembaran musik dari lagu

    tersebut. Jenis-jenis musik yang beragam dan jumlah koleksi musik yang besar juga memerlukanpenanganan yang baik. Oleh sebab itu music retrieval juga mempelajari cara untuk melakukan

    klasifikasi lagu-lagu dengan tepat, misalkan lagu pop, klasik, ataupun jazz sehingga hasilnyadapat memudahkan pengguna untuk melakukan pencarian suatu lagu.

    Copyleft tsetiaji 2015

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    7/14

    Sistem Multimedia

    7

    Selama ini banyak dilakukan penelitian dalam bidang music retrieval dengan mengelolaberbagai aspek informasi dalam musik. Penelitian yang sudah pernah dilakukan diantaranya

    adalah klasifikasi musik latin ballroom dance, penelitian efektifitas dari informasi durasi nada

    untuk music retrieval dengan koleksi lagu pop, klasifikasi lagu berdasarkan jenis suarapenyanyinya dengan koleksi lagu pop, dan lain sebagainya. Namun sampai saat ini, belum adayang melakukan penelitian untuk mengklasifikasikan musik daerah Indonesia.

    Penelitian tentang multimedia database terutama untuk indexing dan retrieval data sudah

    memasuki proses produksi software yang sudah dikomersilkan di pasar diantaranya : QBICproduk IBM, Virage produk Virage Inc, Excalibur Technologies, Informedia produk Informedia

    Technologie, Surfimage product Europen CBIR Technology, Netra produk, Synapse.

    Produk-produk tersebut di atas pada umumnya menggunakan retrieval berdasarkan

    kategori content dan warna. Dimana user mendeskripsikan image apa yang akan dicari dengan

    cara memilih kategori misalnya jenis image, Negara, tahun pembuatan, pembuat dsb atau denganmendeskripsikan warna atau bentuk.

    Penerapan CBIR antara lain untuk pencegahan kejahatan, militer, hak milik intelektual,

    arsitektural dan desain rancang-bangun, fashion and interior desain, iklan dan jurnalistik,

    diagnosa medis, Informasi geografis dan sistem remote sensing, pusaka budaya, pendidikan dan

    lalihan, hiburan,web searching.

    CBIR ( Content-based Image Retrieval ) adalah salah satu metodologi untk pemanggilankembali data gambar berdasarkan content sebuah gambar. Teknik CBIR yang banyak digunakan

    adalah teknik warna, teknik tekstur, teknik bentuk ( perceptual atribut ). Menjadi suatu object

    penelitian yang cukup menantang untuk atribut interpreter dan reaktif.

    Gambar 2 memperlihatkan bentuk umum system Content Base Image Retrieval. Pada

    gambar ini terlihat ada dua jalur utama, Query dan database pada kedua lajur ini terdapat visualcontent description ( adanya ekstraksi informasi image ) yang akan digunakan untuk proses

    similarity comparison dan indexing dan retrieval.

    Copyleft tsetiaji 2015

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    8/14

    Sistem Multimedia

    8

    Gambar 2. Sistem CBIR Retrieval

    Standard yang digunakan untuk CBIR saat ini meliputi standard Network Protokol

    (TCP/IP), format penyimpanan (TIFF, JPEG), compresi (JPEG, MPEG-2), Database command(SQL), Metadata (RDF).

    Gambar 3 menggambarkan framework CBIR yang disusun berdasarkan hasil diskusi

    yang membahas tentang jurnal dan artikel tentang CBIR sepuluh tahun terakhir. Pada frame

    work CBIR terdapat empat modul yakni : Modul Interaksi Pemakai, Modul Knowledge, ModulSimpanan Data, Modul Observasi. Penelitian yang penulis akan lakukan menitik beratkan padatiga modul pertama yakni modul interaksi pemakai, knowledge dan simpanan data.

    Indexing, retrieval dan database tiga hal yang tidak dapat dipisahkan ketika

    membicarakan data dan informasi. Indexing yang baik akan sangat menentukan kecepatan danketepatan retrieval data yang secara phisik juga sangat ditentukan oleh model database yang

    digunakan.

    Copyleft tsetiaji 2015

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    9/14

    Sistem Multimedia

    9

    Gambar 3. Framework CBIR

    Gambar di bawah ini menggambarkan hubungan antara data, struktur index dan retrieval.

    Secara umum metode indexing dibagi dalam dua bagian yakni :

    Copyleft tsetiaji 2015

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    10/14

    Sistem Multimedia

    10

    1. Indexing berdasarkan deskripsi teks ( Caption indexing, keyword, standard subyekheading, klasifikasi dsb )

    2. Indexing berdasarkan image content (warna, bentuk, arah, tekstur, relasi spasial dsb )

    Copyleft tsetiaji 2015

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    11/14

    Sistem Multimedia

    11

    Untuk pemanggilan kembali data image dengan index berdasarkan teks digunakan textualQuery sedangkan untuk pemanggilan kembali data Image dengan index berdasarkan image content

    digunakan visual query. Di dalam textual query, kata-kata digunakan untuk mendapatkan kembali

    gambar, sedangkan dalam query visual ( perolehan kembali berdasarkan content-based) image didapat

    kembali berdasarkan karakteristik visual seperti warna, tekstur, bentuk atau sample. Kedua metode di

    atas memiliki keterbatasan, diantaranya untuk metode textual query karena dilakukan oleh manusia

    dalam mendeskripsikan gambar yang akan disimpan mengakibatkan ketergantungan pada manusia

    sebagai pendeskripsi image sangat tinggi. Hal ini akan menyebabkan biaya tinggi. Di samping itu, jikadata dalam ukuran besar ( jumlah ) dalam pendeskripsian data dapat terjadi pendeskripsian yang tidakkonsisten, meluas dan sangat tergantung pada pemahaman dan penafsiran terhadap image yang dilihat.

    Retrieval berdasarkan content based memiliki masalah pada penafsiran gambar secara efisiendan benar berdasarkan formulasi tertentu. Hal ini terjadi karena proses dilakukan oleh komputer yang

    memiliki keterbatasan dalam menilai rasa, suasan, keindahan. Hal ini disebabkan karena adanya dua

    gap yang ada:

    1. Sensory gap, adanya keterbatasan komputer sebagai alat bantu dalam menangkap semua

    informasi yang ada dalam sebuah image2. Semantic Gap, adanya perbedaan interpretasi karakteristik sebuah image yang dilakukan

    oleh user pad awaktu dan suasana yang berbeda

    Desain Content Based Image Information Retrieval

    Ada tiga bagian desain utama yang ada pada content based image information retrieval yakni:(1). Ekstraksi karakteristik dan pengindeksan; (2). Karakateristik dan retrieval; (3). Aplikasi untuk

    menampilkan hasil query.

    1. Ekstraksi karakteristik dan pengindeksan

    Proses ekstraksi dan pengindexan adalah proses ekstraksi image yang akan digunakan sebagaidasar indexing dan pengembangan metode index. Tahap ini mencakup penentuan proses smoothing

    sebagai bagian dari pra proses, proses ekstraksi, proses pembuatan index untuk image yang akandisimpan dalam database multimedia.

    Copyleft tsetiaji 2015

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    12/14

    Sistem Multimedia

    12

    Ada tiga proses ekstraksi yang dilakukan yakni ekstraksi kata kunci, ekstraksi karakteristik

    global dan ekstraksi detail.

    a. Ektraksi kata kunci, Ektraksi ini dilakukan secara manual berdasarkan interpretasi dari user

    terhadap suatu image. Ekstrasi yang dilakukan ditekankan pada karakteristik abstrak seperti

    suasana, perasaan, dan selain itu pad atahap ini diharapkan juga mendapatkan informasi

    tentang pemilik gambar, tanggal pembuatan, tanggal pengeditan, metode pengambilan gambar,lokasi dsb. Proses ini tidak memerlukan praproses karena dilakukan secara manual

    b. Ekstraksi karakteristik global, ekstraksi ini merupakan ekstraksi berdasarkan karakateristik

    warna, shape, dan teksturc. Ektraksi karakateristik detail, ekstraksi ini merupakan ekstraksi dalam histogram warna,

    histogram shape dan tekstur.

    Sebelum dilakuam proses ektraksi karakteristik global atau proses ekstraksi karakteristik detailperlu dilakukan praproses yakni proses smoothing untuk menghilangkan noise yang ada. Proses ini

    dilakukan untuk mendapatkan image dengan kualitas yang lebih baik agar proses ekstraksi dapatberjalan dengan baik sebagai contoh untuk mendeteksi shape diperlukan proses edge detection. Pada

    proses ini memerlukan 3 tahapan proses : pertama noise smoothing ( Mean Gaussian distribution ),edge enhancement ( filtering), Edge localozation ( menentukan edge/shape). Disini terlihat bahwa

    proses smoothing diperlukan agar proses ektraksi akan mendapat hasil yang benar-benar

    mencerminkan karakteristik dari image ybs.

    Hasil ekstraksi kata kunci dan ektraksi karakteristik global akan digunakan untuk

    penyusunan/pembuatan index. Sedangkan hasil ekstraksi karakateristik global digunakan sebagaipembanding/filter pada saat tetrievak data. Jadi hasil retrieval yang sudah diperoleh berdasarkan

    index yang ada akan di filter kembali dengan hasil karakteristik detailnya sehingga diharapkan di

    dapat image yang paling sesuai dengan kriteria atau karakteristik yang diminta/ditentukan oleh user.

    Database multimedia. Tabel index dan karakateristik detail akan disimpan dalam database

    multimedia. Sedangkan image tidak disimpan dalam database tersebut ( secar afisik ) namun image

    tetap tersimpan dalam bentuk satuan file yang diletakkan pada sebuah direktori yang sudah

    Copyleft tsetiaji 2015

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    13/14

    Sistem Multimedia

    13

    ditetapkan. Jadi secara fisik database multimedia tidak menyimpan file image namun menyimpan

    tabel index dan karakteristik detail. Hal ini sengaja di desain seperti ini dengan harapan prosesretrieval yang nanti akan dilakukan tidak langsung membandungkan kriteria pencarian ( baik

    deskripsi teks maupun contoh image ) pada image, namun cukup melakukan pencarian danpencocokan pada index yang telah ada. Hal ini diharapkan akan mempercepat proses karena tida

    kdiperlukan kerja prosesor dan alokasi memori yang besar jika langsung dilakukan pembandingandan pencarian pada image secara langsung.

    2. Ekstraksi Karakteristik dan Retrieval

    Proses Ekstraksi Karakteristik dan Retrieval adalah proses penentuan index dan retrieval

    berdasarkan karakteristik index ( Query Teks ) serta ekstraksi Karakteristik Global untuk penentuanindex, Sedangkan untuk proses query image dilakukan proses praproses, proses ekstraksi

    karakteristik global untuk penentuan index yang akan digunakan untuk retrieval berdasarkan

    karakteristik index. Proses karakteristik detail yang akan digunakan untuk retrieval berdasarkankarakteristik detail dari hasil image retrieval berdasarkan karakteristik index.

    Query berdasarkan teks tidak memerlukan proses ektraksi namun langsung pada penentuan

    indeks dan retrieval data sesuai dengan krakateristik index ybs. Proses ini diawali dengan penentuan

    diskrisi secara teks oleh user kemudian system akan mencari/menentukan index yang sesuai,

    kemudian berdasarkan tabel index yang sudah ada dilakukan pencocokan karakteristik. Dari proses

    ini diperoleh image yang sesuai dengan yang dicari. Query berdasarkan image perlu dilakukan

    praproses diantaranya smoothing untuk menghilangkan noise yang ada. Proses ini dilakukan untukmendapatkan image dengan kualitas yang lebih baik agar proses ekstraksi dapat berjalan dengan

    baik. Kemudian diekstraksi sama halnya pada proses pengindeksan yakni ektraksi karakteristik

    global dan ektraksi karakteristik detail.

    Proses ekstraksi karakteristik global (ektraksi berdasarkan karakteristik warna, shape dan

    tekstur) untuk dapat menentukan index sesuai yang akan digunakan untuk proses retrieval

    berdasarkan index yang telah ada. Dari proses ini diperoleh satu atau beberapa image yang sesuai.Proses ekstraksi karakteristik detail (ektraksi ini merupakan ektraksi dalam histogram warna,

    histogram shape dan tekstur) untuk mendapatkan karakteristik berdasarkan histogram yang akandibandingkan dengan krakateristik detail yang sudah ada yang tersimpan dalam database

    image/multimedia. Hasil yang diperoleh akan dibandingkan dengan hasil yang diperoleh dariretrieval karakteristik index. Dengan proses ini diharapkan akan didapat image yang paling relevan.

    Proses retrieval yang dilakukan pada query ini tidak dengan cara membandingkan gambarsecara langsung namun dengan pencarian dan pencocokan hasil ektraksi image yang dimaksud

    berdasarkan nomor index yang telah ada. Multimedia retrieval merupakan bidang lintas sektor.

    Memperluas dan melampaui dari batas-batas budaya, seni, dan ilmu pengetahuan, pencarianinformasi digital adalah salah satu tantangan besar pada saat ini. Perpustakaan digital, bio-

    komputasi, ilmu kedokteran, internet dan situs jaringan sosial, streaming video, multimedia database,

    koleksi warisan budaya dan jaringan P2P telah menciptakan kebutuhan di seluruh dunia dan teknik

    paradigma baru tentang bagaimana untuk mencari, pencarian dan merangkum koleksi multimedia

    dan lebih umum lagi bagaimana menkonsumsi materi multimedia secara efisien (Wei dan Chang,2009). Pemahaman tentang multimedia retrieval menekankan pada temu kembali data/ informasi

    Copyleft tsetiaji 2015

  • 7/26/2019 08.SistemMultimedia-SimpanBuka

    14/14

    Sistem Multimedia

    14

    yang sesuai dengan keyword/ kata kunci yang diminta dan dibatasi oleh proses pencarian yang

    interaktif.

    Referensi:http://jeje.staff.gunadarma.ac.id/

    Copyleft tsetiaji 2015