web semantik husni [email protected] husni.trunojoyo.ac.id komputasi.wordpress

41
Web Semantik Husni [email protected] Husni.trunojoyo.ac.id Komputasi.wordpress.com Web Engineering 2010 Pertemuan ke-14

Upload: danica

Post on 11-Jan-2016

74 views

Category:

Documents


7 download

DESCRIPTION

Web Engineering 2010 Pertemuan ke-14. Web Semantik Husni [email protected] Husni.trunojoyo.ac.id Komputasi.wordpress.com. Outline. Dari Web ke Web Semantik Pendekatan Web Semantik Arsitektur Web Semantik Contoh-contoh Implementasi Roadmap Aplikasi Web (1990 – 2030) Rangkuman. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Web SemantikHusni

[email protected]

Komputasi.wordpress.com

Web Engineering 2010Pertemuan ke-14

Page 2: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Outline

• Dari Web ke Web Semantik• Pendekatan Web Semantik• Arsitektur Web Semantik• Contoh-contoh Implementasi• Roadmap Aplikasi Web (1990 – 2030)• Rangkuman

Page 3: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

DARI WEB KE WEB SEMANTIKMengapa kita memerlukan Web Semantik?

Page 4: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Web Hari Ini

• Web kini mendeskripsikan informasi menggunakan– Bahasa alami (Inggris, Jerman, Indonesia,…)– Gambar, multimedia, layout halaman

• Orang dapat memroses ini dengan mudah– Dapat menarik kesimpulan fakta dari informasi parsial– Dapat membuat asosiasi mental– Digunakan untuk berbagai informasi yang

berhubungan dengan panca-indera• (… orang dengan keterbatasan mungkin punya masalah

serius pada web yang kaya media!)

Page 5: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Web Hari Ini

• Kita sering harus memadukan banyak data pada Web– Informasi hotel dan travel mungkin datang dari

situs berbeda– Pencarian dalam pustaka digital berbeda– Dll...

• Lagi, orang menggabungkan informasi ini dengan mudah– Bahkan jika digunakan terminologi berbeda!

Page 6: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Namun…

• Mesin itu bodoh!– Informasi parsial tak dapat dimanfaatkan– Sulit untuk membangun pengertian dari, misal:

suatu gambar (image)– Penggambaran analogi secara otomatis sulit– Susah memadukan informasi secara otomatis

• Apakah <foo:creator> sama denga <bar:author>?• Bagaimana menyatukan hirarki XML berbeda?

– …

Page 7: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Bagaimana Meningkatkan Web Kini?

• Meningkatkan linking otomatis antar data• Menaikkan recall & precision pencarian• Meningkatkan otomasi dalam integrasi data• …

• Menyertakan semantika ke data dan layanan adalah solusi!

Page 8: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

5 Pendekatan Semantika

• Tagging• Statistics • Linguistics • Semantic Web• Artificial Intelligence

Page 9: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Pendekatan Tagging

• Pro & Kontra– Pengguna mudah menambahkan

& membaca tag– Tag hanya berupa string– Tak ada algoritma atau ontologi

yang perlu ditangani– Tak ada teknologi yang harus

dipelajari

• Del.icio.us• Flickr• Wikipedia

Page 10: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Pendekatan Statistik

• Pro – Algoritma matematika murni– Sangat Scalable– Tak tergantung bahasa

• Kontra – Tak ada pemahaman dari content– Sulit merumuskan query yang bagus– Paling baik untuk mendapatkan hal yang benar-

benar popular – tidak baik untuk memperoleh yang penting dalam tumpunan

– Tidak bagus bagi data terstruktur

• Google• Lucene• Autonomy

Page 11: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Pendekatan Linguistik

• Pro– Pemahaman bahasa sejati– Mengekstrak pengetahuan dari teks– Paling baik untuk mencari fakta atau

hubungan tertentu– Query lebih tepat

• Kontra– Intensif secara komputasional– Sulit diskalakan (unscalable)– Banyak errornya– Tergantung pada bahasa

• Powerset • Hakia• Inxight• Attensity• …

Page 12: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Pendekatan Web Semantik

• Pro– Query lebih tepat– Aplikasi lebih cerdas, kerja lebih sedikit– Tidak sebagai komputasional intensif– Share & link data antar aplikasi– Bekerja terhadap data terstruktur maupun tidak

• Kontra– Kurangnya perangkat (tool)– Sulit diskalakan– Who makes all the metadata?

• FOAF Project• DBpedia Project• Metaweb• …

Kontra akan terpecahkan, hanya

masalah waktu!

Page 13: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Pendekatan Kecerdasan Buatan

• Pro– Cerdas dalam domain yang sempit– Menjawab pertanyaan secara cerdas– Penalasan dan pembelajaran

• Kontra– Intensif secara komputasional– Sulit diskalakan– Sangat sulit diprogram– Tidak bekerja baik diluar dari domain yang sempit– Traning mengambil banyak pekerjaan

• Cycorp

Page 14: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

ARSITEKTUR WEB SEMANTIKAyo kita nikmati “daging” sebenarnya hari ini!

Page 15: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Apa itu Web Semantik?

• “The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.”

T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”, Scientific American, May 2001

Page 16: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

… “well-defined meaning” …

• “An ontology is an explicit specification of a conceptualization”Gruber, “Toward principles for the design of ontologies used for knowledge sharing?” , Int. J. Hum.-Comput. Stud., vol. 43, no. 5-6,1995.

• Ontologi adalah fondasi pemodelan untuk Web Semantik– Menyediakan pengertian yang terdefinisi baik

bagi informasi

Page 17: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

… explicit, … specification, … conceptualization, …

Ontologi adalah...• Konseptualisasi: Model dari konsep yang paling relevan dari

suatu fenomena dari dunia nyata• Explicit: Model secara eksplisit menyatakan jenis dari konsep,

hubungan antar konsep dan batasan yang digunakan• Formal: Ontologi harus bersifat machine readable (tidak

memanfaatkan natural language)• Shared: Pengetahuan yang terkandung dalam ontologi

bersifat consensual, yaitu telah diterima oleh kelompok orang.

Studer, Benjamins, D. Fensel, “Knowledge engineering: Principles and methods”, Data Knowledge Engineering, vol. 25, no. 1-2, 1998.

Page 18: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Web Semantik adalah mengenai....

• Anotasi data Web– Menghubungkan (sintaktis) obyek Web, seperti potongan

teks, image, … ke maksud semantiknya (Misal: ini ini mengenai Innsbruck, Dieter Fensel adalah professor)

• Linking Data di Web (Web Data)– Jaringan pengetahuan global melalui URI, RDF dan

SPARQL (Misal: menghubungkan kalender saya dengan rss feed saya, gambar-gambar saya, ...)

• Integrasi data di Web– Integrasi data berdasarkan model konseptual yang

berbeda (misalnya, mengintegrasikan data yang berasal dari dua penjual buku favorit saya )

Page 19: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Menganotasi Data Web

http://www.ontoprise.de/

Page 20: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Data Linking pada Web

Linking Open Data Project: http://esw.w3.org/topic/SweoIG/TaskForces/CommunityProjects/LinkingOpenData

As of Septemer 2007

Page 21: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Integrasi Data di Web

URI Sama = Resource sama

http://www.w3.org/People/Ivan/CorePresentations/RDFTutorial

Page 22: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Arsitektur Web

• Sesuatu dilambangkan dengan URI.• Gunakan URI untuk menunjukkan sesuatu.• Sajikan informasi yang berguna pada URI.• Dereference-kan URI.

Page 23: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Arsitektur Web Semantik

• Memberikan konsep penting URI.• Setiap URI memperkenalkan satu konsep.• Share simbol-simbol ini antara banyak bahasa• Dukung URI lookup

Page 24: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Stack pada Web Semantik

Topik yang sering dibahas!

Page 25: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

URI dan XML

• Uniform Resource Identifier (URI) adalah dual dari URL di Web Semantik– Sasarannya adalah untuk mengidentifikasi sumber daya

• eXtensible Markup Language (XML) adalah suatu bahasa markup yang digunakan untuk menstrukturkan informasi– Landasan darirepresentasi data pada Web Semantik– Tag tidak menyampaikan informasi semantik

Page 26: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

RDF dan OWL

• Resource Description Framework (RDF) adalah dual dari HTML dalam Web Semantik– Cara sederhana mendeskripsikan sumber daya di Web– Jenis bahasa ontologu sederhana (RDF-S)– Berpijak pada triple (subject; predicate; object)– Serialisasi adalah berbasis XML

• Ontology Web Language (OWL) adalah suatu bahasa ber-layer berdasarkan pada DL– Bahasa ontologi yang jauh lebih kompleks– Mengatasi beberapa batasan pada RDF(S)

Page 27: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

SPARQL & Bahasa Rule

• SPARQL– Bahasa Query bagi triple RDF– Suatu protokol untuk mengquery data RDF di Web

• Bahasa Rule (Misal: SWRL) – Mengextend predikat dasar dalam bahasa ontologi

dengan predikat proprietary– Berpijak pada logika berbeda

• Logika deskripsi• Logika pemrograman

Page 28: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Tidak Hanya Tentang Data Publik

• Web Semantic tidak hanya tentang data publik.

• Juga data tentang pribadi, kelompok, instansi dan perusahaan.

• Secara historis, server intranet mendahului server ekstranet

Page 29: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Dari Halaman Web ke Layanan Web

Static WWWURI, HTML, HTTP

Semantic WebRDF, RDF(S), OWL

Dynamic Web ServicesUDDI, WSDL, SOAP

Intelligent WebServices

Syntactic Semantic

Page 30: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Industri & Web Semantik

• Perusahaan besar menawarkan (atau akan menawarkan) Sistem atau tool Web Semantik: Adobe, Oracle, IBM, HP, Software AG, GE, Northrop Gruman, Altova, Microsoft, Dow Jones, …

• Pihak lain menggunakannya (atau mempertibangkan untuk menggunakannya) sebagai bagian dari operasinya : Novartis, Boeing, Pfizer, Telefónica, …

• Beberapa nama aktif dalam W3C SW: ILOG, HP, Agfa, SRI International, Fair Isaac Corp., Oracle, Boeing, IBM, Chevron, Siemens, Nokia, Pfizer, Sun, Eli Lilly, …

Page 31: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Contoh IMenemukan Pakar yang tepat di NASA

• Hampir 20.000 pegawai NASA menggunakan teknik RDF yang mengintegrasikan lebih dari 6 atau 7 database, sumber data dan layanan web yang terdistribusi secara geografis…

From Kendall Clark, Clark & Parsia, LLC

Page 32: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Contoh IIVodafone live!

• Mengintegrasikan deskripsi produk berbagai vendor via RDF– ring tone, game, wallpaper– Mengelola kompleksitas handset,

format biner

• Portal dibuat untuk menawarkan content yang tepat

• Download content naik signifikan setelah diperkenalkan

From Kevin Smith, Vodafone Group R&D

Page 33: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Annotated Content

Select one or more concepts from the ontology…… send the currently loaded web page to the Annotation Server

Contoh IIIKIM Browser Plugin

• Content web dianotasi menggunakan ontologi

• Content dapat dicari & dijelajah secara cerdas

33

Page 34: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Deferenceable URI

Contoh IVDisco Hyperdata Browser

• Menavigasi Web Semantik sebagai himpunan sumber data yang tidak terikat

Page 35: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Contoh VFaceted DBLP

Kategorisasi topik otomatis berdasarkan pada keyword yang disediakan dalam

anotasi metadata

Page 36: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Contoh Lain

• Studi kasus dan kasus pemanfaatan Web Semantik dapat dilihat di: http://www.w3.org/2001/sw/sweo/public/UseCases– Cultural Heritage– Health Care– Life Sciences– eCommerce– B2B integration– …

Page 37: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Roadmap Web (Nova Spivack)

Koneksi Antar Orang

Ko

nek

si A

nta

r In

form

asi

Email

Social Networking

Groupware

JavascriptWeblogs

Databases

File Systems

HTTPKeyword Search

USENET

Wikis

Websites

Directory Portals

2010 - 2020

Web 1.0

2000 - 2010

1990 - 2000

PC Era1980 - 1990

RSSWidgets

PC’s

2020 - 2030

Office 2.0

XML

RDF

SPARQLAJAX

FTP IRC

SOAP

Mashups

File Servers

Social Media Sharing

Lightweight Collaboration

ATOM

Web 3.0

Web 4.0

Semantic SearchSemantic Databases

Distributed Search

Intelligent personal agents

JavaSaaS

Web 2.0 Flash

OWL

HTML

SGML

SQLGopher

P2P

The Web

The PC

Windows

MacOS

SWRL

OpenID

BBS

MMO’s

VR

Semantic Web

Intelligent Web

The Internet

Social Web

Web OS

37

Page 38: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

RINGKASANThat’s almost all for day…

Page 39: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Rangkuman

• Semantic Web bukanlah suatu replacement dari web kini, tetapi suatu evolution-nya

• Bertujuan mengotomatiskan tugas yang saat ini dilakukan oleh manusia

• Semantic Web bukanlah AI 2.0• Web Semantik menjadi real (mungkin tidak seperti

yang awalnya direncanakan, tetapi begitulah)

Page 40: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Referensi

• Bacaan Utama– Bab 14– Grigoris Antoniou and Frank van Harmelen,

A Semantic Web Primer, MIT Press• Bab 1

• Bacaan lanjutan– Meletakkan Web kembali ke dalam Web Semantik

• http://www.w3.org/2005/Talks/1110-iswc-tbl

Page 41: Web Semantik Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress

Pertanyaan?