penjanaan fitur tigaan bagi imej bersaiz besar di kolam condor

65
PENJANAAN FITUR TIGAAN BAGI IMEJ BERSAIZ BESAR DENGAN MENGGUNAKAN JELMAAN SURIH DI KOLAM CONDOR Nurrunnuhaa All Bakry GP00339 UKM Bangi

Upload: nuhaa-bakry

Post on 09-Jul-2015

179 views

Category:

Technology


1 download

DESCRIPTION

Translation: Generation of triple feature for large images using Condorthe slides are in malay - what i did for my 9 credit masters thesis

TRANSCRIPT

Page 1: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

PENJANAAN FITUR TIGAAN BAGI IMEJ BERSAIZ BESAR DENGAN

MENGGUNAKAN JELMAAN SURIH DI KOLAM CONDOR

Nurrunnuhaa All BakryGP00339

UKM Bangi

Page 2: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Sistem berprestasi tinggi

• Digunakan untuk kajian di institusi pengajian tinggi dan makmal-makmal kajian. Ia juga sering digunakan di dalam reka bentuk kejuruteraan

• Contoh aplikasi:o kajian cuaca o pengecaman polao penyelidikan ketenteraano penerokaan minyak dan gaso simulasi mekanikal o simulasi kewangan

Page 3: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Pengenalan - Sistem berprestasi tinggi

 

Page 4: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Pengenalan - Sistem Teragih

• Pelbagai usaha untuk memperkenalkan sistem teragih telah dilakukan oleh banyak pihak, termasuklah SETI@Home

• Komputer super mungkin lebih berkuasa tetapi sebarang ralat atau kerosakan akan menjejaskan proses yang sedang dilaksanakan di komputer super

• Sebarang kerosakan di satu mesin tidak akan memberikan impak yang tinggi kepada proses yang sedang berjalan di sistem teragih

Page 5: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Kebaikan Sistem teragihFaedah:• Melaksanakan operasi yang memakan masa yang panjang

dalam masa yang singkat• Melaksanakan operasi di dalam tempoh yang singkat

dengan kadar yang tinggiIni kerana, sistem teragih:• Mendapatkan kuasanya daripada sumber yang tidak

digunakan daripada mesin yang sedang idle• Mudah untuk diskala

Satu kajian yang dilakukan oleh Bing Yean (2011) telah menunjukkan peningkatan kelajuan dengan penggunaan sistem teragih untuk masalah Mandelbrot

Page 6: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Contoh Middleware

Condor• Memaksimakan penggunaan mesin-mesin yang idle ataupun

tidak aktif• Universiti Wisconsin-Madison

Legion• Aplikasi-aplikasi selari yang besar dan kompleks• University of Virginia

BOINC• Membolehkan kuasa mesin ketika ia tidak aktif

disumbangkan kepada projek sains• University of California

Page 7: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Jelmaan surih

• Satu kaedah di dalam analisis imej untuk pengecaman pola• Digunakan untuk pengecaman aksara jawi 

o kajian oleh Mohammad Faidzul et al. (2008)• Kaedah analisis imej lain:

o rangkaian Neural Rekuren Bama oleh Mazani (2002)o pengkelas multiaras oleh Khairuddin (2000)

• Jelmaan surih akan menghasilkan satu fitur tigaan untuk sesuatu imej yang dikaji

Page 8: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Permasalahan kajian

 

Page 9: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Makmal HPC belum dilengkapi Condor

• Makmal HPC dilengkapi beberapa mesin-mesin masih belum dilengkapi dengan sistem berprestasi tinggi yang menggunakan Condor

• Penjanaan fitur tigaan dengan menggunakan jelmaan surih belum pernah dijalankan di makmal tersebut

Page 10: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Jelmaan surih untuk pengecaman aksara jawi• Kajian Mohammad Faidzul et al. (2008) menggunakan imej

aksara jawi bersaiz 63.6 KB dengan resolusi 255x255 pikselo Imej yang bersaiz lebih besar?o Sekumpulan imej bersaiz lebih besar?

• Surihan dilakukan dengan melawat setiap piksel di setiap baris piksel di dalam imej dan di setiap 1.8125º sudut putarano Kecilkan sudut putaran?

Page 11: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Tujuan Kajian

 

Page 12: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Tujuan Kajian

a) mendapatkan nisbah fitur tigaan bagi imej bersaiz lebih daripada 100 MB dengan menggunakan sudut putaran 1º

b) menganalisa masa yang diambil untuk melaksanakan dua jelmaan surih bagi mendapatkan nisbah fitur tigaan bagi satu imej bersaiz besar di satu mesin dan kolam Condor

c) menganalisa masa yang diambil untuk melaksanakan dua jelmaan surih (untuk setiap imej) bagi mendapatkan nisbah fitur tigaan (untuk setiap imej) bagi sekumpulan imej bersaiz besar di satu mesin dan kolam Condor

Page 13: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Skop Kajian

 

Page 14: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Skop Kajian

• Aplikasi jelmaan surih dan fungsian yang akan digunakan di dalam kajian ini adalah sama dengan yang digunakan di dalam kajian Mohammad Faidzul et al. (2008)

• Penjanaan fitur tigaan untuk 40 imej bersaiz besar -> 40 nisbah fitur tigaan

• Tidak meliputi penjanaan fitur tigaan tak-ubah, keputusan akan dibandingkan tanpa membincangkan ketepatannya

• 19 mesin digunakan di makmal HPC (kolam heterogen) untuk kolam Condor

• Kajian memberikan perhatian kepada prestasi masa yang diambil untuk pelaksanaan jelmaan surih di satu mesin dan di kolam Condor

Page 15: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Kajian Kesusateraan

 

Page 16: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Condor Sebagai Sistem Teragih

Berfungsi dengan mengenalpasti mesin-mesin yang idle dan memaksimakan sumber yang idle ini dengan menjadualkan

tugasan-tugasan untuk dilaksanakan di mesin tersebut

Page 17: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Kolam Condor    

• Setiap mesin mempunyai peranan• Perlu ada 3 peranan di dalam sesuatu kolam:

o Pengurus Pusato Penghantaro Pelaksana

Page 18: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Contoh Senibina Kolam Condor

Page 19: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Peranan mesin

Interaksi antara mesin di dalam kolam Condor

Mesin boleh mempunyai lebih daripada 1 peranan

Page 20: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Alam Semesta Condor

Untuk menakrifkan persekitaran pelaksanaan sesuatu tugasan

Alam semesta yang digunakan oleh Condor:• Standard• Vanilla• Grid • Java• Scheduler• Local• Parallel • VM

Page 21: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Penghantaran Tugasan ke Kolam CondorMenggunakan fail penghantar

Hantar ke kolam Condor

Page 22: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Pemadanan Tugasan dan Sumber

Page 23: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Pelaksanaan Tugasan di Kolam Condor

Page 24: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Penjanaan Fitur Tigaan untuk Aksara Jawi Menggunakan Jelmaan Surih

Kajian Mohammad Faidzul et al (2008) mendapati jelmaan surih telah memberikan skor pengecaman yang lebih tinggi

berbanding kaedah momen afin tak-ubah.

Kajian jelmaan surih mereka dilakukan ke atas aksara terpencil dan meliputi transformasi imej putaran, translasi

dan penskalaan sahaja.

Page 25: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Aksara Jawi

Page 26: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Jelmaan Surih

Jelmaan surih berasal daripada perbincangan mengenai pengecaman oleh Kadyrov et al. (2001) yang telah

menunjukkan bahawa jelmaan surih telah mengatasi prestasi pengecaman fitur momen afin tak-ubah. Jelmaan surih boleh digambarkan sebagai pengitlakan jelmaan Radon seperti yang

dibincangkan dalam kajian beliau.

Jelmaan Radon hanya mengira kamiran untuk fungsian. Fungsian yang digunakan dalam jelmaan surih tidak

semestinya menggunakan kamiran.

Page 27: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Jelmaan Surih (smbg)

Jelmaan Radon boleh diterangkan sebagai satu jelmaan surih yang khusus. 

Pertimbangkan apabila satu imej f (x, y) disilang- menyilangkan dengan garis-garis l(r, θ, t) pada semua arah dengan L(r, θ) ialah set bagi semua garis. Jelmaan surih adalah satu fungsi g(T, f, r, θ) yang ditakrif pada L(r, θ) dengan bantuan fungsian surih T. Maka 

g (T, f, r, θ) = T [f (r, θ, t)]

Page 28: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Jelmaan Surih (smbg)

Definisi parameter pada imej f (x, y) dan garis surih l(r, θ, t) 

Page 29: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Fitur Tigaan

Fitur tigaan yang boleh menggambarkan sifat imej f (x, y) dapat dijanakan dengan bantuan dua fungsian tambahan yang dipanggil diametrik (diametric) dan putaran (circus), yang masing-masing ditandai dengan P dan Ф (Kadyrov & Petrou, 2001) .

Fitur tigaan П ditakrifkan sebagai:

П(f) = Φ[P[T[f(r,θ,t)]]]   

Page 30: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Fungsian untuk Fitur Tigaan

Fitur tigaan yang diekstrak sangat bergantung kepada sifat fungsian yang telah dipilih, iaitu T (fungsian surih), P (fungsian diametrik) dan Ф (fungsian putaran). 

Kajian Mohammad Faidzul et al. (2008) telah mengemukakan cadangan fungsian yang telah dipilih untuk menjana fitur tigaan tak-ubah kepada putaran, translasi, dan penskalaan.

Page 31: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Penjanaan Fitur Tigaan untuk Aksara Jawi 

Page 32: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Fitur Tigaan Tak-Ubah untuk Aksara Jawi (samb)

Fungsian yang digunakan untuk pengecaman aksara jawi

Page 33: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Fitur Tigaan Tak-Ubah untuk Aksara Jawi (samb)

Nisbah fitur tigaan untuk aksara jawi

Page 34: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Metodologi Kajian

 

Page 35: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Kaedah

Kajian menggunakan aplikasi yang digunakan di dalam kajian Mohammad Faidzul et al. (2008). 

Kajian melihat hasil penjanaan fitur tigaan menggunakan sudut putaran 1º. 

Penjanaan fitur tigaan akan dilakukan ke atas satu mesin dan juga kolam Condor.• Satu imej sebagai permulaan • Bilangan imej ditambah kepada 10, 20, 30 dan 40

Page 36: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Aplikasi Penjanaan Fitur Tigaan

Paparan output untuk aplikasi diubahsuai untuk mengandungi keputusan fitur tigaan

Penggunaan alam semesta Vanilla tidak memberikan kemudahan Remote System Call (mesin Pelaksana tidak mempunyai kemudahan untuk membaca dan menulis struktur direktori sama seperti mesin Penghantar).

Page 37: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Senibina Kolam Condor

Terdiri daripada mesin-mesin di

makmal HPC dan makmal

pembangunan web

Page 38: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Senarai Mesin di Kolam Condor

Page 39: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Penyediaan Imej

Imej bersaiz 63.6 KB dengan resolusi 255x255 piksel

Page 40: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Imej bersaiz besar

608 MB dengan resolusi 32768x19456 piksel

Page 41: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Skrip Bash

Ditulis untuk memudahkan penghantaran tugasan ke kolam Condor.

Skrip Bash (tt-submit-multiple-jobs) akan menulis satu fail penghantar Condor berdasarkan pilihan set Π dan seterusnya akan di hantar ke kolam Condor.

Page 42: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Fail Penghantar 

Fail penghantar bagi set Π = 4 untuk dua imej

Page 43: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Pemerhatian Masa Pelaksanaan

Masa direkodkan di:• satu mesin  • kolam Condor 

Masa (purata) diambil daripada ketika arahan dihantar sehingga dua fitur tigaan diperolehi daripada dua fungsian yang menghasilkan sesuatu set Π. 

Page 44: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Cartalir

Kolam Condor vs satu mesin

Page 45: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Kebolehsandaran Penggunaan Condor untuk Penjanaan Fitur

Tigaan Tak-ubah

Page 46: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

n = 128 (sudut = 1.8125º) dan n = 360 (sudut = 1º)

Nilai fitur tigaan adalah sama seperti yang diperolehi di dalam kajian Mohammad Faidzul et al. (2008). Ini bermaksud kolam Condor boleh digunakan untuk penjanaan fitur tigaan.

Page 47: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

n = 360 (sudut = 1º)

Ini bermakna apabila nilai n = 360 digunakan ke atas aksara jawi Shin, aplikasi mampu mengenalpasti tiga imej tambahan sebagai imej yang sama.

Page 48: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Pemerhatian Masa

Masa yang diambil untuk penjanaan fitur tigaan di kolam Condor melonjak hampir satu kali ganda berbanding penjanaaan yang sama di satu mesin.

Page 49: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Pemerhatian Masa (smbg)

Ini disebabkan oleh komunikasi di antara mesin-mesin di dalam rangkaian kolam Condor dan juga proses pemindahan fail input dan output yang mempengaruhi keseluruhan masa penjanaan.

Penjanaan fitur tigaan di satu mesin tidak mengambil masa yang lama. Ini adalah kerana saiz imej yang kecil. Oleh yang demikian, penjanaan fitur tigaan di kolam Condor untuk imej yang bersaiz kecil adalah tidak sesuai.

Page 50: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Penjanaan Fitur Tigaan Bagi Satu Imej Bersaiz Besar

Page 51: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

n = 360

Fitur tigaan bagi 40 imej bersaiz besar telah di perolehi di dalam kajian ini.

Hanya set Π2, Π3 dan Π 4 yang mempunyai perbezaan kurang daripada 10%. Oleh itu, fitur tigaan tak-ubah hanya untuk tiga set tersebut.

Page 52: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Penjimatan Masa

~48 hingga ~56 minit

     vs

~25 hingga ~35 minit 

Page 53: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Prestasi Masa Bagi Sekumpulan Imej Bersaiz Besar

 

Page 54: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Pemerhatian Masa

Penggunaan Condor dapat menjimatkan masa lebih daripada 89%.

Page 55: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Pemerhatian Masa di Satu Mesin

 

Page 56: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Pemerhatian Masa di Kolam Condor

 

Page 57: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Perbandingan Masa

Kolam Condor:10 imej - 43 minit20 imej - 1 jam30 imej - 1 jam40 imej - 1.3 jam

Berbanding dengan keputusan di satu mesin, purata masa yang diambil kolam Condor masih lebih rendah.

Satu mesin:10 imej - 8.7 jam20 imej - 17.2 jam30 imej - 25.9 jam40 imej - 34.7 jam

Page 58: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Penjimatan Masa

Meningkat daripada 10 imej ke 20 imej. Ia meningkat sedikit ke 30 imej dan tidak begitu banyak beza daripada 30 ke 40 imej.

Page 59: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Kelajuan Kolam Condor (speedup)

Penjimatan masa adalah paling tinggi untuk 40 imej. 

Kelajuan yang ideal adalah apabila S38 = 38. Tahap ideal boleh dicapai dengan menambah bilangan pemproses.

Page 60: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Kecekapan Kolam Condor (efficiency)

Sejauh mana pemproses digunakan sepenuhnya untuk melaksanakan penjanaan dua fitur tigaan bagi setiap imej. Kecekapan untuk 1 imej adalah yang paling rendah manakala kecekapan untuk 30 dan 40 imej adalah hampir sama iaitu kedua-duanya berada di dalam linkungan 60% hingga 76%.

Page 61: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Rumusan Kajian

 

Page 62: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Penemuan & Sumbangan Kajian

Kajian telah menunjukkan nisbah fitur tigaan untuk imej yang bersaiz lebih daripada 100 MB dengan menggunakan sudut putaran 1° boleh diperolehi dengan menggunakan kolam Condor. 

Masa yang diambil untuk mendapatkan dua fitur tigaan bagi sesuatu imej bersaiz besar dengan menggunakan jelmaan surih di kolam Condor adalah lebih pantas daripada di satu mesin. Ia menunjukkan penjimatan masa di dalam lingkungan 32.68% sehingga 47.03%. 

Page 63: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Penemuan & Sumbangan Kajian (smbg)

Untuk sekumpulan imej pula, kajian mendapati peratusan masa yang dapat dijimatkan adalah lebih tinggi iaitu di dalam lingkungan 89.35% sehingga 96.52%.

Kelajuan paling tinggi dicapai untuk penjanaan dua fitur tigaan bagi 40 imej.

Page 64: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Penutup

Kajian ini telah mengetengahkan Condor sebagai satu pilihan yang sesuai untuk sistem teragih. Diharapkan dengan kajian ini membuka mata dan menggalakkan lagi penggunaan Condor sama ada di dalam bidang penyelidikan mahupun implementasi pada masa akan datang.

Page 65: Penjanaan fitur tigaan bagi imej bersaiz besar di kolam Condor

Sekian

Terima Kasih