web semantik husni [email protected] husni.trunojoyo.ac.id komputasi.wordpress
DESCRIPTION
Web Engineering 2010 Pertemuan ke-14. Web Semantik Husni [email protected] Husni.trunojoyo.ac.id Komputasi.wordpress.com. Outline. Dari Web ke Web Semantik Pendekatan Web Semantik Arsitektur Web Semantik Contoh-contoh Implementasi Roadmap Aplikasi Web (1990 – 2030) Rangkuman. - PowerPoint PPT PresentationTRANSCRIPT
Outline
• Dari Web ke Web Semantik• Pendekatan Web Semantik• Arsitektur Web Semantik• Contoh-contoh Implementasi• Roadmap Aplikasi Web (1990 – 2030)• Rangkuman
DARI WEB KE WEB SEMANTIKMengapa kita memerlukan Web Semantik?
Web Hari Ini
• Web kini mendeskripsikan informasi menggunakan– Bahasa alami (Inggris, Jerman, Indonesia,…)– Gambar, multimedia, layout halaman
• Orang dapat memroses ini dengan mudah– Dapat menarik kesimpulan fakta dari informasi parsial– Dapat membuat asosiasi mental– Digunakan untuk berbagai informasi yang
berhubungan dengan panca-indera• (… orang dengan keterbatasan mungkin punya masalah
serius pada web yang kaya media!)
Web Hari Ini
• Kita sering harus memadukan banyak data pada Web– Informasi hotel dan travel mungkin datang dari
situs berbeda– Pencarian dalam pustaka digital berbeda– Dll...
• Lagi, orang menggabungkan informasi ini dengan mudah– Bahkan jika digunakan terminologi berbeda!
Namun…
• Mesin itu bodoh!– Informasi parsial tak dapat dimanfaatkan– Sulit untuk membangun pengertian dari, misal:
suatu gambar (image)– Penggambaran analogi secara otomatis sulit– Susah memadukan informasi secara otomatis
• Apakah <foo:creator> sama denga <bar:author>?• Bagaimana menyatukan hirarki XML berbeda?
– …
Bagaimana Meningkatkan Web Kini?
• Meningkatkan linking otomatis antar data• Menaikkan recall & precision pencarian• Meningkatkan otomasi dalam integrasi data• …
• Menyertakan semantika ke data dan layanan adalah solusi!
5 Pendekatan Semantika
• Tagging• Statistics • Linguistics • Semantic Web• Artificial Intelligence
Pendekatan Tagging
• Pro & Kontra– Pengguna mudah menambahkan
& membaca tag– Tag hanya berupa string– Tak ada algoritma atau ontologi
yang perlu ditangani– Tak ada teknologi yang harus
dipelajari
• Del.icio.us• Flickr• Wikipedia
Pendekatan Statistik
• Pro – Algoritma matematika murni– Sangat Scalable– Tak tergantung bahasa
• Kontra – Tak ada pemahaman dari content– Sulit merumuskan query yang bagus– Paling baik untuk mendapatkan hal yang benar-
benar popular – tidak baik untuk memperoleh yang penting dalam tumpunan
– Tidak bagus bagi data terstruktur
• Google• Lucene• Autonomy
Pendekatan Linguistik
• Pro– Pemahaman bahasa sejati– Mengekstrak pengetahuan dari teks– Paling baik untuk mencari fakta atau
hubungan tertentu– Query lebih tepat
• Kontra– Intensif secara komputasional– Sulit diskalakan (unscalable)– Banyak errornya– Tergantung pada bahasa
• Powerset • Hakia• Inxight• Attensity• …
Pendekatan Web Semantik
• Pro– Query lebih tepat– Aplikasi lebih cerdas, kerja lebih sedikit– Tidak sebagai komputasional intensif– Share & link data antar aplikasi– Bekerja terhadap data terstruktur maupun tidak
• Kontra– Kurangnya perangkat (tool)– Sulit diskalakan– Who makes all the metadata?
• FOAF Project• DBpedia Project• Metaweb• …
Kontra akan terpecahkan, hanya
masalah waktu!
Pendekatan Kecerdasan Buatan
• Pro– Cerdas dalam domain yang sempit– Menjawab pertanyaan secara cerdas– Penalasan dan pembelajaran
• Kontra– Intensif secara komputasional– Sulit diskalakan– Sangat sulit diprogram– Tidak bekerja baik diluar dari domain yang sempit– Traning mengambil banyak pekerjaan
• Cycorp
ARSITEKTUR WEB SEMANTIKAyo kita nikmati “daging” sebenarnya hari ini!
Apa itu Web Semantik?
• “The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.”
T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”, Scientific American, May 2001
… “well-defined meaning” …
• “An ontology is an explicit specification of a conceptualization”Gruber, “Toward principles for the design of ontologies used for knowledge sharing?” , Int. J. Hum.-Comput. Stud., vol. 43, no. 5-6,1995.
• Ontologi adalah fondasi pemodelan untuk Web Semantik– Menyediakan pengertian yang terdefinisi baik
bagi informasi
… explicit, … specification, … conceptualization, …
Ontologi adalah...• Konseptualisasi: Model dari konsep yang paling relevan dari
suatu fenomena dari dunia nyata• Explicit: Model secara eksplisit menyatakan jenis dari konsep,
hubungan antar konsep dan batasan yang digunakan• Formal: Ontologi harus bersifat machine readable (tidak
memanfaatkan natural language)• Shared: Pengetahuan yang terkandung dalam ontologi
bersifat consensual, yaitu telah diterima oleh kelompok orang.
Studer, Benjamins, D. Fensel, “Knowledge engineering: Principles and methods”, Data Knowledge Engineering, vol. 25, no. 1-2, 1998.
Web Semantik adalah mengenai....
• Anotasi data Web– Menghubungkan (sintaktis) obyek Web, seperti potongan
teks, image, … ke maksud semantiknya (Misal: ini ini mengenai Innsbruck, Dieter Fensel adalah professor)
• Linking Data di Web (Web Data)– Jaringan pengetahuan global melalui URI, RDF dan
SPARQL (Misal: menghubungkan kalender saya dengan rss feed saya, gambar-gambar saya, ...)
• Integrasi data di Web– Integrasi data berdasarkan model konseptual yang
berbeda (misalnya, mengintegrasikan data yang berasal dari dua penjual buku favorit saya )
Menganotasi Data Web
http://www.ontoprise.de/
Data Linking pada Web
Linking Open Data Project: http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
As of Septemer 2007
Integrasi Data di Web
URI Sama = Resource sama
http://www.w3.org/People/Ivan/CorePresentations/RDFTutorial
Arsitektur Web
• Sesuatu dilambangkan dengan URI.• Gunakan URI untuk menunjukkan sesuatu.• Sajikan informasi yang berguna pada URI.• Dereference-kan URI.
Arsitektur Web Semantik
• Memberikan konsep penting URI.• Setiap URI memperkenalkan satu konsep.• Share simbol-simbol ini antara banyak bahasa• Dukung URI lookup
Stack pada Web Semantik
Topik yang sering dibahas!
URI dan XML
• Uniform Resource Identifier (URI) adalah dual dari URL di Web Semantik– Sasarannya adalah untuk mengidentifikasi sumber daya
• eXtensible Markup Language (XML) adalah suatu bahasa markup yang digunakan untuk menstrukturkan informasi– Landasan darirepresentasi data pada Web Semantik– Tag tidak menyampaikan informasi semantik
RDF dan OWL
• Resource Description Framework (RDF) adalah dual dari HTML dalam Web Semantik– Cara sederhana mendeskripsikan sumber daya di Web– Jenis bahasa ontologu sederhana (RDF-S)– Berpijak pada triple (subject; predicate; object)– Serialisasi adalah berbasis XML
• Ontology Web Language (OWL) adalah suatu bahasa ber-layer berdasarkan pada DL– Bahasa ontologi yang jauh lebih kompleks– Mengatasi beberapa batasan pada RDF(S)
SPARQL & Bahasa Rule
• SPARQL– Bahasa Query bagi triple RDF– Suatu protokol untuk mengquery data RDF di Web
• Bahasa Rule (Misal: SWRL) – Mengextend predikat dasar dalam bahasa ontologi
dengan predikat proprietary– Berpijak pada logika berbeda
• Logika deskripsi• Logika pemrograman
Tidak Hanya Tentang Data Publik
• Web Semantic tidak hanya tentang data publik.
• Juga data tentang pribadi, kelompok, instansi dan perusahaan.
• Secara historis, server intranet mendahului server ekstranet
Dari Halaman Web ke Layanan Web
Static WWWURI, HTML, HTTP
Semantic WebRDF, RDF(S), OWL
Dynamic Web ServicesUDDI, WSDL, SOAP
Intelligent WebServices
Syntactic Semantic
Industri & Web Semantik
• Perusahaan besar menawarkan (atau akan menawarkan) Sistem atau tool Web Semantik: Adobe, Oracle, IBM, HP, Software AG, GE, Northrop Gruman, Altova, Microsoft, Dow Jones, …
• Pihak lain menggunakannya (atau mempertibangkan untuk menggunakannya) sebagai bagian dari operasinya : Novartis, Boeing, Pfizer, Telefónica, …
• Beberapa nama aktif dalam W3C SW: ILOG, HP, Agfa, SRI International, Fair Isaac Corp., Oracle, Boeing, IBM, Chevron, Siemens, Nokia, Pfizer, Sun, Eli Lilly, …
Contoh IMenemukan Pakar yang tepat di NASA
• Hampir 20.000 pegawai NASA menggunakan teknik RDF yang mengintegrasikan lebih dari 6 atau 7 database, sumber data dan layanan web yang terdistribusi secara geografis…
From Kendall Clark, Clark & Parsia, LLC
Contoh IIVodafone live!
• Mengintegrasikan deskripsi produk berbagai vendor via RDF– ring tone, game, wallpaper– Mengelola kompleksitas handset,
format biner
• Portal dibuat untuk menawarkan content yang tepat
• Download content naik signifikan setelah diperkenalkan
From Kevin Smith, Vodafone Group R&D
Annotated Content
Select one or more concepts from the ontology…… send the currently loaded web page to the Annotation Server
Contoh IIIKIM Browser Plugin
• Content web dianotasi menggunakan ontologi
• Content dapat dicari & dijelajah secara cerdas
33
Deferenceable URI
Contoh IVDisco Hyperdata Browser
• Menavigasi Web Semantik sebagai himpunan sumber data yang tidak terikat
Contoh VFaceted DBLP
Kategorisasi topik otomatis berdasarkan pada keyword yang disediakan dalam
anotasi metadata
Contoh Lain
• Studi kasus dan kasus pemanfaatan Web Semantik dapat dilihat di: http://www.w3.org/2001/sw/sweo/public/UseCases– Cultural Heritage– Health Care– Life Sciences– eCommerce– B2B integration– …
Roadmap Web (Nova Spivack)
Koneksi Antar Orang
Ko
nek
si A
nta
r In
form
asi
Social Networking
Groupware
JavascriptWeblogs
Databases
File Systems
HTTPKeyword Search
USENET
Wikis
Websites
Directory Portals
2010 - 2020
Web 1.0
2000 - 2010
1990 - 2000
PC Era1980 - 1990
RSSWidgets
PC’s
2020 - 2030
Office 2.0
XML
RDF
SPARQLAJAX
FTP IRC
SOAP
Mashups
File Servers
Social Media Sharing
Lightweight Collaboration
ATOM
Web 3.0
Web 4.0
Semantic SearchSemantic Databases
Distributed Search
Intelligent personal agents
JavaSaaS
Web 2.0 Flash
OWL
HTML
SGML
SQLGopher
P2P
The Web
The PC
Windows
MacOS
SWRL
OpenID
BBS
MMO’s
VR
Semantic Web
Intelligent Web
The Internet
Social Web
Web OS
37
RINGKASANThat’s almost all for day…
Rangkuman
• Semantic Web bukanlah suatu replacement dari web kini, tetapi suatu evolution-nya
• Bertujuan mengotomatiskan tugas yang saat ini dilakukan oleh manusia
• Semantic Web bukanlah AI 2.0• Web Semantik menjadi real (mungkin tidak seperti
yang awalnya direncanakan, tetapi begitulah)
Referensi
• Bacaan Utama– Bab 14– Grigoris Antoniou and Frank van Harmelen,
A Semantic Web Primer, MIT Press• Bab 1
• Bacaan lanjutan– Meletakkan Web kembali ke dalam Web Semantik
• http://www.w3.org/2005/Talks/1110-iswc-tbl
Pertanyaan?