dezvoltarea aplicațiilor web (7/12): arhitectura aplicaţilor rdf. linked open data

136
Dr. Sabin Buragawww.purl.org/net/busaco Linked Open Data Dezvoltarea aplica ț iilor Web

Upload: sabin-buraga

Post on 13-May-2015

223 views

Category:

Technology


5 download

DESCRIPTION

Dezvoltarea aplicațiilor Web (7/12) — detalii la http://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.html

TRANSCRIPT

Page 1: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Linked Open Data

Dezvoltarea aplicațiilor Web

Page 2: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“E mai ușor să negi lucrurile,decât să te informezi despre ele.”

Mariano José de Larra

Page 3: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Web attitude (Tim Berners-Lee)

anyone can say anything about anything

no one knows everything about anything

my system is most valuablebecause of its interconnection to its peers

Page 4: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Centrate pe documentepagini statice, situri de companii

Interactiveexpoziţii virtuale, ştiri, e-travel

Tranzacționalee-banking, soluţii B2B, workflow-uri

Colaborativechat, e-learning, servicii peer-to-peer, wiki,…

Orientate spre portaluricomunități, pentru afaceri, Web cetățenesc etc.

De tip ubicuuservicii bazate pe locație, multi-platformă, în timp-realcloud computing

Web socialspații virtuale, activități colaborative, tagging de resurse,volum mare de date (big data)

Web semantic (Web of data)date structurate, recomandare & mediatizare,servicii contextuale, aplicații smartmanagement de cunoștințe + raționament automat

evolu

țiaîn

timp

a com

plexității

Page 5: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

disponibilitatea datelor la nivel de Web

A fi stocat pe Web(“on the Web”)

ca document “opac”– disponibil într-un format proprietar sau nu –

fără a referi, pe baza standardelor Web,alte resurse de interes

Page 6: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

disponibilitatea datelor la nivel de Web

A fi descoperibil pe baza standardelor Web(“in the Web”)

folosind modele/formate de date deschise(e.g., HTML, XML, JSON, RDF etc.)

aliniate principiilor hipertextului/hipermedia,procesabile independent de platformă

Page 7: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Necesitatea modelării cunoștințelor

knowledge modeling

Page 8: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Necesitatea modelării cunoștințelor

knowledge modeling

“instrumente” cognitive umane:formal logic, rules, concepts, analogies,

images, neural connections

Page 9: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Apare necesitatea managementului acestora

knowledge management

Page 10: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Aspecte privind managementul cunoștințelorShadbolt & O’Hara, 2004

achiziția (acquiring)modelarea (modelling)obținerea (retrieving)reutilizarea (reusing)

publicarea (publishing)mentenanța (maintaining)

Page 11: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Achiziția (acquiring)aplicațiile Web trebuie să preia

informații și/sau cunoștințe,nu date brute – lipsite de semnificație

Page 12: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Achiziția (acquiring)aplicațiile Web trebuie să preia

informații și/sau cunoștințe,nu date brute – lipsite de semnificație

e.g., texte (formatate) preluate din formulare

Page 13: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Achiziția (acquiring)aplicațiile Web trebuie să preia

informații și/sau cunoștințe,nu date brute – lipsite de semnificație

utilizatorii obișnuiți nu vor marca dateleîn formate precum HTML sau JSON, XML, RDF etc.

Page 14: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

de la limbaj natural la modele conceptuale modelate via RDF – proiectul FRED (F. Draicchio et al., 2012)

http://wit.istc.cnr.it/stlab-tools/fred

Page 15: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

framework-ul Semarglextragerea datelormodelate cu RDFa

(Lev Khomich, 2013)http://semarglproject.org/

Page 16: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Modelarea (modelling)

conceptele trebuie stocate ca date structurate

ideal, fiecare fragment de informație trebuie modelatriguros la nivel semantic

conform expresivității dorite

Page 17: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Modelarea (modelling)

conceptele trebuie stocate ca date structurate

ideal, fiecare fragment de informație trebuie modelatriguros la nivel semantic

în practică, acest aspect este aproape imposibil(vezi dificultățile de dezambiguizare a limbajului natural)

Page 18: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

existența modelelor și formatelor eterogene

Page 19: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Modelarea (modelling)

pași de urmat:identificarea categoriilor (claselor) de resurse,

definirea proprietăților + restricțiilor,completarea – (semi)automată a – datelor despre indivizi:

input explicit, data mining, tagging, microdate HTML5, RDFa etc.

detalii în cursurile viitoare

Page 20: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Obținerea (retrieving)

mecanisme de interogare și filtrare a cunoștințelor

Page 21: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Obținerea (retrieving)

oferirea de suport pentru efectuarea de agregări,procesări și extrageri de date/informații/cunoștințe,

în manieră (semi)automată,pe baza meta-datelor și relațiilor dintre entități

Page 22: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Reutilizarea (reusing)

fiecare entitate trebuie definită doar o singură dată

identificată printr-un URI

Page 23: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

De ce este mai „bun” un URL precum http://business.data.gov.uk/id/company/04285910

decât înregistrarea

Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/

SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST

Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F

managementul cunoștințelor

Page 24: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

De ce este mai „bun” un URL precum http://business.data.gov.uk/id/company/04285910

decât înregistrarea

“because you can look it up; because you can refer to a URI in any context, unlike 'Q30' which only means something

in a specific context”

Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/

SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST

Q30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F

managementul cunoștințelor

Page 25: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Reutilizarea (reusing)

datele trebuie să poată fi accesate la nivel global

oferirea seturilor de date (data sets) deschise

Page 26: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Reutilizarea (reusing)

datele trebuie să poată fi accesate la nivel global

oferirea seturilor de date (data sets) deschise

aspecte importante:disponibilitate în formate standardizate

politici de acces – copyright, proveniență, licențiereconfidențialitate (privacy)

Page 27: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Reutilizarea (reusing)

depinde și de utilizabilitatea sistemului

formate alternative oferind o sintaxă simplă, standardizatăquery by example

interacțiune naturalăflexibilitate – e.g., oferirea de sugestii

etc.

Page 28: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Publicarea (publishing)

datele/informațiile/cunoștintele trebuie să poată fipublicate în formate standardizate deschise,care să încurajeze refolosirea în alte contexte

Page 29: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Publicarea (publishing)

datele/informațiile/cunoștintele trebuie să poată fipublicate în formate standardizate deschise,care să încurajeze refolosirea în alte contexte

de considerat atât utilizatorii umani, cât și aplicațiile

Page 30: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

managementul cunoștințelor

Mentenanță (maintaining)

necesitatea existenței unor servicii care să asigureconsistența datelor/cunoștințelor

serviciile automate se pot baza pe instrumentede efectuare a raționamentelor (reasoners)

Page 31: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

realitate

Existența unei/unor suite de formalisme, specificații, limbaje, instrumente, servicii specifice

Page 32: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

realitate

Existența unei/unor suite de formalisme, specificații, limbaje, instrumente, servicii specifice

cu grade de maturitate & adoptie diferite

Page 33: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

realitate

Benjamin Nowack, 2009

Page 34: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Care este arhitectura aplicațiiloraliniate problematicilor Web-ului semantic?

Page 35: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Arhitectura aplicațiilor bazate pe RDF(Allemang & Hendler, 2011)

Page 36: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Lassila & Hendler (2007)

Page 37: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

exemplificare:arhitectura

framework-uluiApache Jena

Page 38: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: SWAML

Extragerea datelor din mesaje de e-mail, în vedereainterogării, reutilizării & publicării ulterioare

(Sergio Fernández et al., 2009)

procesează datele în format mailbox (RFC 4155) șioferă descrieri RDF ale mesajelor, listelor de distribuție

și persoanelor, bazându-se pe SIOC

interogări via SPARQL, publicare folosind RDFa

Page 39: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: SWAML

export în format KML pentru realizarea de mash-up-uripe baza Google Maps (Fernández et al., 2009)

Page 40: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: semantic mediawiki

Management colaborativ al conținutuluimodelat semantic (semantic wikis)

Semantic MediaWiki

extensie a sistemului MediaWiki:permite adnotarea semantică a conținutului unui wiki

http://semantic-mediawiki.org/

Page 41: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: semantic mediawiki

Idee: asocierea de perechi proprietate—valoare

fiecărui fragment de informație dintr-un wiki

The title of this book is '''[[Has Title::Cloud Atlas]]'''

Page 42: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: semantic mediawiki

Utilizări în special în e-science(arheologie, biologie, biomedicină,…)

și în domeniul guvernamental, inclusiv în e-learning

http://semantic-mediawiki.org/wiki/Semantic_MediaWiki_publications

Page 43: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: dbpedia

De la conținut colaborativ la adnotare semantică(Christian Bizer et al.)

constituie o bază de cunoștințe

versiunea în limba engleză: descrieri a peste 4 milioane de „lucruri” (things) via RDF

conținut disponibil în 119 limbi – 25 milioane de „things”

Page 44: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: dbpedia

De la conținut colaborativ la adnotare semantică(Christian Bizer et al.)

recurge la diverse modele conceptuale vizând mai multe domenii

acces via SPARQL: http://wiki.dbpedia.org/OnlineAccess?v=d8c

Page 45: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicatii rdf: exemplificari

surse de date care referă alte entități DBpediaconform Bizer et al., 2009

Page 46: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: dbpedia

Extractori pentru procesarea tipurilor de conținuturioferite de Wikipedia

labelsrdfs:label, interlanguage links, redirects,imagesfoaf:depiction, geo-coordinates,disambiguationdbpedia:disambiguates,

external linksdbpedia:reference, pagelinksdbpedia:wikilink etc.

DBpedia Information Extraction Frameworkimplementat inițial în PHP, actualmente în Scala

Page 47: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicatii rdf: exemplificari

OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)

Page 48: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

DBpedia Liveresponsabil cu sincronizarea datelor Wikipedia↔DBpedia

(implementare Java)

Page 49: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicații rdf: freebase

Freebase (preluat de Google în 2011)

model de date specificat semantic, în mod colaborativ

expune seturi de triple RDF

oferă un API deschis + limbaj de interogare propriu: MQL

utilizatorii finali nu trebuie să aibă cunoștințeprivitoare la Web-ul semantic

Page 50: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicatii reale

detalii pentru dezvoltatorii de aplicații la https://developers.google.com/freebase/

restaurantele din preajma Bucureștiului

Page 51: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

studii de caz: www.w3.org/2001/sw/sweo/public/UseCases/

Page 52: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Cum publicăm datele pe Webastfel încât să fie asigurate

reutilizarea și interoperabilitatea?

Page 53: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Paradigmă de publicare a datelor pe Webcare recurge la tehnologiile Web existente

Tom Heath & Christian Bizer, Linked Data: Evolving the Web into a Global Data Space, Morgan & Claypool, 2011

http://linkeddatabook.com/book

Page 54: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Paradigmă de publicare a datelor pe Webcare recurge la tehnologiile Web existente

reducerea redundanțeifacilitarea reutilizării

permiterea descopeririimaximizarea inter-conectivității între “lucruri” înrudite

adoptarea unei viziuni pragmatice

Page 55: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Viziune:

Use the Web of Data as a Content Management System

Use the community at large as content editors

Ivan Herman (2013) – http://www.w3.org/2013/Talks/0902-Lisbon-IH/

Page 56: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Ingrediente de bază:

identificare – URIacces – HTTP

modelare – RDFstructurare – schema.org, RDFa, RDF Schema, OWL

Page 57: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

un „nor” al datelor interconectate extrase din DBpediaexemplu furnizat de R. Meymandpour & J. Davis (2013)

Page 58: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: principii (Berners-Lee)

Utilizarea URI-urilor pentru numirea “lucrurilor”

specificarea via URI a oricăror resurse– informaționale sau non-informaționale –,

nu doar a documentelor

identitate unică la nivel global

http://www.w3.org/DesignIssues/LinkedData.html

Page 59: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: principii (Berners-Lee)

Folosirea de URI-uri ce pot fi vehiculate via HTTP

orice URI are un proprietar:persoană, organizație, specificație,…

utilizatorii/aplicațiile pot localiza resursele(oricine posedă un browser/client Web)

http://www.w3.org/DesignIssues/LinkedData.html

Page 60: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: principii (Berners-Lee)

Oferirea de informații utile în format RDF

atunci când o agent (entitate) accesează un URI,poate “afla” (meta-)date de interes

http://www.w3.org/DesignIssues/LinkedData.html

Page 61: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: principii (Berners-Lee)

Includerea în reprezentarea RDFa unor legături spre alte URI-uri

facilitarea descoperirii de informații înrudite(network effect)

http://www.w3.org/DesignIssues/LinkedData.html

Page 62: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

S. Buraga, „De câte stele sunt datele d-voastră?” (2012)www.slideshare.net/busaco/de-cte-stele-sunt-datele-dvoastra

date de 5 stele (5 ★ Open Data)

Page 63: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

date de 1 stea

conținutul e disponibil pe Web – indiferent de format – conform unei licențe deschise

Page 64: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

utilizatorii pot vizualiza, lista,stoca local și, eventual, modifica documentul

documentul în sine poate fi partajat via Internet

Page 65: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

documentul poate fi publicat rapid & facil pe Web

pentru a refolosi datele incluse în documentsunt necesare uneori procesări suplimentare

Page 66: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

date de 2 stele

suplimentar, conținutul este disponibil pe Webîntr-un format structurat

Page 67: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

utilizatorii pot procesa documentul– folosind, uzual, software proprietar

documentul poate fi exportat în alt format(structurat sau nu)

Page 68: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

documentul poate fi încă publicat facil pe Web

datele sunt în continuare “încuiate” în document,procesarea depinzând de un anumit program

Page 69: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

date deschise de 3 stele

recurgerea la un format deschispentru a pune la dispoziție pe Web date

Page 70: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

datele pot fi gestionate (vizualizate, filtrate, procesate, convertite, refolosite etc.) în orice manieră

asigurarea independenței de platforma software

Page 71: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

în continuare, documentul poate fi publicat facil pe Web

exportarea datelor într-un format proprietarar putea fi problematică

Page 72: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

date deschise de 4 stele

adoptarea identificatorilor de resurse (URI-uri) pentru a desemna “lucruri” de interes

Page 73: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

datele, informațiile și cunoștințele se identifică via URI-uripentru a putea fi ulterior referite și (re)utilizate

uzual, se recurge la modelul RDF

Page 74: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

publicarea poate fi relativ mai dificilă,necesitând de obicei adoptarea de instrumente și

metodologii specifice tehnologiilor Web-ului semantic

“data in the Web”implicații pe termen lung

Page 75: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

date deschise de 5 stele

în plus, datele sunt inter-relaționateconform principiilor inițiativei linked data

Page 76: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

posibilitatea descoperirii altor date de interes (înrudite)direct la momentul procesării

se oferă premisele efectuării de raționamente automate direct la nivel de Web pe baza modelelor conceptuale

exprimate standardizat via SKOS, OWL,…

Page 77: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

dificultăți:consistența & reconcilierea datelor și cunoștințelor

probleme legate de adopția lentă de către industrie

Page 78: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Publicarea pe Web a datelor interconectatereferitoare la whisky – conform (Tom Heath, 2009)

Page 79: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Publicarea pe Web a datelor interconectatereferitoare la whisky – conform (Tom Heath, 2009)

existența unui magazin virtual destinat connoisseur-uluiafacere online – wiskii.com – fondată de Jeff

informații furnizate de experți ai domeniuluicontribuții realizate și de către utilizatori obișnuițiimplementare bazată pe un server de aplicații Web

date stocate relaționalacces simultan la date în HTML și RDF

Page 80: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

1. înțelegerea principiilor linked data2. înțelegerea (conceptualizarea) datelor3. alegerea URI-urilor pentru “lucrurile” de interes4. stabilirea infrastructurii5. relaționarea cu alte seturi de date existente6. descrierea & publicarea datelor

Page 81: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Care sunt aspectele principale care trebuiesurprinse privind datele aplicației Web?

Page 82: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Care sunt aspectele principale care trebuiesurprinse privind datele aplicației Web?

persoane? locații geografice?

artefacte culturale?comentarii? evaluări?

etc.

Page 83: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Aspecte – concepte – de interes privindbaza de cunoștințe utilizată de aplicația wiskii.com

distilerii, regiuni & locații geografice, fondatori, proprietari, brand-uri, produse, fotografii,

evaluări (review-uri), comentarii, prețuri & oferte

Page 84: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Descrierea datelor pe baza vocabularelor

principii:

reutilizarea, nu inventarea unui alt vocabular

combinarea vocabularelor existente

Page 85: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Descrierea datelor pe baza vocabularelor

în contextul studiului de caz,potențiale modele conceptuale ce pot fi folosite:

Geonames – http://www.geonames.org/ontology

GoodRelationsFOAF (Friend Of A Friend)

Review – http://vocab.org/review/

SIOC (Semantically-Interconnected Online Communities)Whisky – http://vocab.org/whisky/

Page 86: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Term URI Description

Comment http://purl.org/stuff/rev#Comment A comment on a review.

Feedback http://purl.org/stuff/rev#Feedback Feedback on the review.

Review http://purl.org/stuff/rev#Review A review of an work.

commenter http://purl.org/stuff/rev#commenter The commenter on the review.

hasReview http://purl.org/stuff/rev#hasReview Associates a work with a a review.

hasComment http://purl.org/stuff/rev#hasCommentUsed to associate a review with a comment on the review.

hasFeedback http://purl.org/stuff/rev#hasFeedbackAssociates a review with a feedback on the review.

maxRating http://purl.org/stuff/rev#maxRating A numeric value.

minRating http://purl.org/stuff/rev#minRating A numeric value.

positiveVotes http://purl.org/stuff/rev#positiveVotesNumber of positive usefulness votes (integer).

rating http://purl.org/stuff/rev#rating A numeric value.

reviewer http://purl.org/stuff/rev#reviewer The person that has written the review.

text http://purl.org/stuff/rev#text The text of the review.

title http://purl.org/stuff/rev#title The title of the review.

totalVotes http://purl.org/stuff/rev#totalVotes Number of usefulness votes (integer).

type http://purl.org/stuff/rev#type The type of media of a work under review.

concepte & proprietăți definite de vocabularul Review

Page 87: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Descrierea datelor pe baza vocabularelor

vocabularele (tipurile de date) definite pot avea ulterioratașate specificații formale

Page 88: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:recurgerea la schema HTTP pentru facilitarea accesului

http://vocab.org/whisky/terms/Brand

versusurn:whisky-vocab:brand

Page 89: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:evitarea imixtiunii în alte spații de nume

Page 90: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:abstractizare – evitarea detaliilor de implementare

http://dbpedia.org/resource/Romania

versushttp://www4.wiwiss.fu-berlin.de:2020/demos/dbpedia/cgi-bin/

resources.php?id=Romania

Page 91: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:folosirii unei singure convenții de referire

# (hash) sau / (slash)

http://undeva.info/foaf.rdf#me

versushttp://undeva.info/id/me

Page 92: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

șabloane de stabilire a URI-urilor

http://dbpedia.org/resource/Science Thing (concept)

http://dbpedia.org/data/Science Date RDF

http://dbpedia.org/page/Science Pagină HTML

http://revyu.com/people/tom Thing (concept)

http://revyu.com/people/tom/about/rdf Date RDF

http://revyu.com/people/tom/about/html Pagină HTML

http://undeva.info/concept Thing (concept)

http://undeva.info/concept.rdf Date RDF

http://undeva.info/concept.html Pagină HTML

Page 93: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Exemplificări (clasă + instanță):

regiuni http://wiskii.com/regions/speyside

distilerii http://wiskii.com/distilleries/talisker

brand-uri http://wiskii.com/brands/talisker

produse http://wiskii.com/products/talisker-10-yo

persoane http://wiskii.com/people/william-matheson

fotografii http://wiskii.com/photos/58

review-uri http://wiskii.com/reviews/271

Page 94: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Accesul la o anumită reprezentare – exemple:

concept http://wiskii.com/brands/talisker

date RDF http://wiskii.com/brands/talisker/rdf

pagină HTML http://wiskii.com/brands/talisker/html

Page 95: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Stabilirea infrastructurii

HTML RDF

aplicațieWeb

date

Page 96: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

Page 97: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

http://wiskii.com/brands/talisker

Page 98: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

http://wiskii.com/brands/talisker

HTTP GET

Page 99: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

http://wiskii.com/brands/talisker

HTTP GET

HTTP 303 See Other HTTP 303 See Other

content negotiation

Page 100: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Instrumente utile la http://linkeddata.org/tools

a se parcurge și http://www.w3.org/wiki/LinkedData

Page 101: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Relaționarea cu alte seturi de datede revăzut “norul” linked data – http://lod-cloud.net/

Page 102: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Relaționarea cu alte seturi de date

informațiile privitoare la fiecare set de date RDFpot fi explorate via CKAN

(Comprehensive Knowledge Archive Network)

http://ckan.org/

http://thedatahub.org/

Page 103: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Relaționarea cu alte seturi de date

aspecte de interes privind vocabularele publice:gradul de utilizare

mentenanțaaplicabilitateaexpresivitatea

Page 104: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Relaționarea cu alte seturi de date

predicate generice folosite uzual:owl:sameAs

foaf:homepage, foaf:topic, foaf:based_near, foaf:maker,foaf:depiction, foaf:primaryTopic,…

rdfs:seeAlso

Page 105: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

Relaționarea cu alte seturi de date – exemplificare:

Page 106: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Relații între diverse resurse din seturi de date diferite:

<http://dbpedia.org/resource/Kolkata>

owl:sameAs freebase:Kolkata ;

owl:sameAs <http://sws.geonames.org/1275004> ;

owl:sameAs <http://ru.dbpedia.org/resources/Калькутта> ;

...

<http://sws.geonames.org/1275004>

rdfs:seeAlso <http://dbpedia.org/resource/Kolkata>

wgs84_pos:lat "22.56263" ;

wgs84_pos:long "88.36304" ;

gn:parentCountry <http://sws.geonames.org/1269750> ;

...

după Ivan Herman (2013)

Page 107: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Descrierea & publicarea datelor interconectate

voiD (Vocabulary of Interlinked Datasets)

K. Alexander, R. Cyganiak, M. Hausenblas & J. Zhao, 2010

http://www.w3.org/2001/sw/interest/void/

Page 108: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: cerințe (Health & Bizer)

Calitatea datelor

Disponibilitatea și stabilitatea setului de date

Publicarea direct pe situl public

Claritate privind termenii de utilizare (licențiere)

Existența aplicațiilor

don’t repeat yourself

Page 109: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

statistici vizând “norul” linked open data (9 ianuarie 2013)http://stats.lod2.eu/

Page 110: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: studiu de caz

statistici vizând linked open data (12 noiembrie 2013)http://stats.lod2.eu/

639 vs. 2289 seturi de date1,7 miliarde vs. 62 miliarde de triple RDF

49,8% vs. 61,9% date având erori

Page 111: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Aspecte privind cele mai bune practici:

identificarea resurselor – identifier patternsmodelare – modelling patterns

publicare a datelor – publishing patternsmanagement al datelor – data management patterns

dezvoltare de aplicații – application patterns

Page 112: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data

Mai multe detalii:

Leigh Dodds & Ian Davis, Linked Data Patterns. A pattern catalogue for modelling, publishing, and consuming

Linked Data, 2012:http://patterns.dataincubator.org/

a se studia și http://schoolofdata.org/handbook/

Page 113: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: testare & depanare

Verificarea corectitudinii sintaxei RDF

W3C RDF Validator – www.w3.org/RDF/Validator/

Eyeball (instrument bazat pe Apache Jena)

Page 114: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: testare & depanare

Verificarea infrastructurii(e.g., dereferențierea URL-urilor)

RDF:Alerts – http://swse.deri.org/RDFAlerts/

Sindice Inspector – http://inspector.sindice.com/

Vapour Linked Data Validator – idi.fundacionctic.org/vapour

Page 115: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: testare & depanare

Depanarea (inspectarea triplelor) RDF

manuală

eventual, preluând datele – în stilul REST –via cURL sau un instrument similar

Page 116: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: testare & depanare

Depanarea (inspectarea triplelor) RDF

recurgerea la un hyperdata (semantic) browser

e.g., instrumentul OpenLink Data Explorer ca extensiea unui navigator Web actual – http://ode.openlinksw.com/

Page 117: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: testare & depanare

Vizualizarea datelor interconectate

exemplificări:

platforma Callimachus – http://callimachusproject.org/

aplicația Web LodLive – http://en.lodlive.it/

Page 118: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

instrumentul LodLive

Page 119: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Există aplicații Web realealiniate “curentului” linked data?

Page 120: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

aplicația #1

linked dataserver #1

linked dataserver #2

HTTP

aplicația #2

Ivan

Her

man

(20

13

)

Page 121: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

SPARQL / RDF API

arhitectura tratificată a aplicațiilor bazate pe linked data(Tom Heath & Christian Bizer, 2011)

Page 122: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Revyu.comSemantic Web reviewing and rating site

(T. Health & E. Motta, 2008)

permite integrarea datelor evaluate de utilizatori

review-urile sunt stocate + publicate transparent în RDF(utilizatorii finali introduc datele în mod tradițional)

Page 123: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Revyu.com

recurge la vocabulare ca Review, FOAF (Friend Of AFriend), SKOS (Simple Knowledge Organizational System)

interogări pe baza unui punct terminal SPARQL

interconectare cu alte seturi de date:DBpedia, OpenGuides, RDF Book Mashup etc.

Page 124: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Proiectul Europeana

inițiativă de prezervare a conținutul cultural reprezentativ din statele europene

acces deschis la date interconectatevia data.europeana.eu

Page 125: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

definește EDM (Europeana Data Model) bazat pe standardeRDF și OWL + vocabulare ca DCMI, FOAF, Open Archive

Page 126: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

myExperiment (David De Roure et al.)

aplicație Web colaborativă – bazată pe Ruby on Rails –pentru managementul workflow-urilor științifice

și a altor obiecte vizând cercetarea

modelarea datelor se bazează pe RDF:http://rdf.myexperiment.org/

acces la date publice via SPARQL

Page 127: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Page 128: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Inițiativele semantic (open) e-government

linked data în contextul informațiilor publice ale UK:http://data.gov.uk/linked-data

un proiect similar:USA – http://www.data.gov/developers/page/semantic-web

de studiat și prezentările lui Richard Wallis:www.slideshare.net/rjw

Page 129: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

acces la date publice oficiale după gradul de deschidere (openness score)

http://data.gov.uk/data/search?openness_score=5

Page 130: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

SIGMA (SemantIc Government Mashup Application)Claudia Gheorghiu, Radu Nicolescu, Andrei Vasile Bogdan,

Cristian Ochișor, Sabin Buraga, Lenuța Alboaie (2011)

platformă Web extensibilă capabilă să creeze mashup-urioferind acces la date guvernamentale deschise

includerea unei soluții proprii de acces via un end-pointSPARQL la date guvernamentale preluate de la gov.ro

Page 131: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

Page 132: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Alte utilizări – conform Stefan Decker et al., 2012:

mass-mediaBBC, Guardian, New York Times

publicații academiceCrossRef, Nature

biblioteci (digitale)Library of Congress, SUDOC (Franța), Vatican,…

Page 133: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

linked data: aplicații

Pentru diverse exemplificări, a se consulta și lucrările atelierelor de lucru LDOW (Linked Data on the Web)

http://events.linkeddata.org/ldow2013/

http://events.linkeddata.org/ldow2012/

http://events.linkeddata.org/ldow2011/

Page 134: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

“concluzii”

“Software – as a service or not – is just a container.What makes software valuable has always been what

it does to data. Now, in the same spirit of SOA and SaaS,a new concept is emerging, Data-as-a-Service – DaaS.”

Pete Soderling, august 2010http://goo.gl/S4dYy

Page 135: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

rezumat

aplicații bazate pe Web of dataarhitectură, linked data, studii de caz

Page 136: Dezvoltarea aplicațiilor Web (7/12): Arhitectura aplicaţilor RDF. Linked Open Data

Dr.

Sab

in B

ura

ga

www.purl.org/net/busaco

episodul viitor: evaluarea proiectului (D)joi, 21 noiembrie, 10:00 – C308