dezvoltarea aplicațiilor webbusaco/teach/courses/wade/presentations/web07... · ga /~ co web...

160
Dr. Sabin Buragaprofs.info.uaic.ro/~busaco Dezvoltarea aplicațiilor Web Architectura aplica țiilor Web gestionând date RDF. Linked Open Data Dr. Sabin Corneliu Buraga – profs.info.uaic.ro/~busaco/

Upload: others

Post on 31-Dec-2019

4 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Dezvoltarea aplicațiilor Web

⨳Architectura aplicațiilor Web

gestionând date RDF. Linked Open Data

Dr. Sabin Corneliu Buraga – profs.info.uaic.ro/~busaco/

Page 2: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

„E mai ușor să negi lucrurile,decât să te informezi despre ele.”

Mariano José de Larra

Page 3: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Web attitude (Tim Berners-Lee)

anyone can say anything about anything

no one knows everything about anything

my system is most valuablebecause of its interconnection to its peers

Page 4: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

disponibilitatea datelor la nivel de Web

A fi stocat pe Web(“on the Web”)

ca document „opac”– disponibil într-un format proprietar sau nu –

fără a referi, pe baza standardelor Web,alte resurse de interes

Page 5: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

disponibilitatea datelor la nivel de Web

A fi descoperibil pe baza standardelor Web(“in the Web”)

folosind modele/formate de date deschise(e.g., HTML, XML, JSON, RDF etc.)

aliniate principiilor hipertextului/hipermedia,procesabile independent de platformă

Page 6: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Necesitatea modelării cunoștințelor

knowledge modeling

unul dintre aspectele importante ale inteligenței artificiale

S. Russell, P. Norvig, Artificial Intelligence. A Modern Approach

(3rd Edition), Prentice Hall, 2010

Page 7: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Necesitatea modelării cunoștințelor

knowledge modeling

„instrumente” cognitive umane:formal logic, rules, concepts, analogies,

images, neural connections

Page 8: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Apare necesitatea managementului acestora

knowledge management

Page 9: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Aspecte privind managementul cunoștințelorShadbolt & O’Hara, 2004

achiziția (acquiring)modelarea (modelling)obținerea (retrieving)reutilizarea (reusing)

publicarea (publishing)mentenanța (maintaining)

Page 10: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Achiziția (acquiring)aplicațiile Web trebuie să preia

informații și/sau cunoștințe,nu date brute – lipsite de semnificație

e.g., texte (formatate) preluate din formulare

Page 11: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Achiziția (acquiring)aplicațiile Web trebuie să preia

informații și/sau cunoștințe,nu date brute – lipsite de semnificație

utilizatorii obișnuiți nu vor marca dateleîn formate precum HTML sau JSON, XML, RDF etc.

Page 12: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

FRED: de la limbaj natural la modele conceptuale modelate via RDF

(A. Gangemi et al., 2017)wit.istc.cnr.it/stlab-tools/fred/

Page 13: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

“Tim Berners-Lee is the inventor of World Wide Web.”

Page 14: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Modelarea (modelling)

conceptele trebuie stocate ca date structurate

ideal, fiecare fragment de informație trebuie modelatriguros la nivel semantic

conform expresivității dorite

Page 15: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Modelarea (modelling)

conceptele trebuie stocate ca date structurate

ideal, fiecare fragment de informație trebuie modelatriguros la nivel semantic

în practică, acest aspect este aproape imposibil(vezi dificultățile de dezambiguizare a limbajului natural)

Page 16: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

existența modelelor și formatelor eterogene

"Winx Club"@en "Iginio Straffi"@en "1965-05-30"^^xsd:date

"War of the

Planets"@en

"Antonio

Margheriti"@en "1930-09-19"^^xsd:date

"Verginità"@en "Leonardo De

Mitri"@en "1914-08-31"^^xsd:date

"Vergine

moderna"@en

"Marcello

Pagliero"@en "1907-01-15"^^xsd:date

"Un tango dalla

Russia"@en

"Cesare

Canevari"@en "1927-10-13"^^xsd:date

Page 17: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Modelarea (modelling)

pași de urmat:identificarea categoriilor (claselor) de resurse,

definirea proprietăților + restricțiilor,completarea – (semi)automată a – datelor despre indivizi:

input explicit, data mining, tagging, scheme de microdate HTML5, RDFa etc.

detalii în cursurile viitoare

Page 18: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Obținerea (retrieving)

mecanisme de interogare și filtrare a cunoștințelor

Page 19: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Obținerea (retrieving)

oferirea de suport pentru efectuarea de agregări,procesări și extrageri de date/informații/cunoștințe,

în manieră (semi-)automată,pe baza meta-datelor și relațiilor dintre entități

Page 20: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Obținerea (retrieving)

oferirea de suport pentru efectuarea de agregări,procesări și extrageri de date/informații/cunoștințe,

în manieră (semi-)automată,pe baza meta-datelor și relațiilor dintre entități

e.g., recurgerea la instrumente software:Apache Any23, GoodTables.io, OpenRefine, Pandoc,…

Page 21: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Reutilizarea (reusing)

fiecare entitate trebuie definită doar o singură dată

identificată printr-un URI

Page 22: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

De ce este mai „bun” un URL precum http://business.data.gov.uk/id/company/04285910

decât înregistrarea

Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/

SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST

H30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F

managementul cunoștințelor

Page 23: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

De ce este mai „bun” un URL precum http://business.data.gov.uk/id/company/04285910

decât înregistrarea

“because you can look it up; because you can refer to a URI in any context, unlike 'H30' which only means something

in a specific context”

Phil Archer (2013) – www.w3.org/2013/Talks/1016_phila_ldpoint/

SHA PCT PRACTICE BNF CODE BNF NAME ITEMS NIC ACT COST

H30 5D7 A86003 0101010G0AAABAB Co-Magaldrox_Susp 195mg/220mg/5ml S/F

managementul cunoștințelor

Page 24: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Reutilizarea (reusing)

datele trebuie să poată fi accesate la nivel global

oferirea seturilor de date (data sets) deschise

detalii în prezentarea S. Buraga, Why 5-Star Data? (2016)www.slideshare.net/busaco/why-5star-data

Page 25: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Reutilizarea (reusing)

aspecte importante:disponibilitate în formate standardizate

politici de acces – copyright, proveniență, licențiereconfidențialitate (privacy)

Page 26: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Reutilizarea (reusing)

depinde și de utilizabilitatea sistemului

formate alternative cu o sintaxă simplă, standardizatăinterogări bazate pe exemple (query by example)

interacțiune naturalăflexibilitate – e.g., oferirea de sugestii sau exemplificări

etc.

Page 27: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

explorare și filtrare multi-criterialăe.g., date publice deschise vizând USA

catalog.data.gov/dataset

Page 28: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Open Data Monitor vizualizarea și compararea unor indicatori de calitate (licență deschisă, formate procesabile, disponibilitate, meta-date)

privind date despre Europa – opendatamonitor.eu

Page 29: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Publicarea (publishing)

datele/informațiile/cunoștintele trebuie să poată fipublicate în formate standardizate deschise,care să încurajeze refolosirea în alte contexte

de considerat atât utilizatorii umani, cât și aplicațiile

Page 30: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

date/informații/cunoștințe publicate pe Web – interconectate, partajate și reutilizate conform scopurilor

utilizatorilor – și disponibile într-o varietate de formate, pe platforme (hardware/software) eterogene

B. Szekely & A. Meyer (2017)

Page 31: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

managementul cunoștințelor

Mentenanță (maintaining)

necesitatea existenței unor servicii care să asigureconsistența datelor/cunoștințelor

serviciile automate se pot baza pe instrumentede efectuare a raționamentelor (reasoners)

Page 32: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

realitate

Volatilitatea datelor/cunoștințelor

actualizări frecvente

inițial pot respecta o schemă de validare, dar în viitor nu neapărat

dispariție neprevăzutănecesitatea arhivării + managementul versiunilor

Page 33: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

realitate

Dificultăți în validarea datelor/cunoștințelor

de la text (multilingv) nestructurat și date binare (imagini, audio, video,…) la date (semi-)structurate

date similare, dar nu identice

a se consulta și lucrările lui M. Tamer Özsucs.uwaterloo.ca/~tozsu/publications-topic.html#rdf

Page 34: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

realitate

Probleme vizând interogarea datelor/cunoștințelor

în ce limbă va fi oferit rezultatul unei interogări?

cum poate fi specificat contextul?

ce se poate afirma despre credibilitatea conținutului?

(meta-)motoarele de căutare actuale nu-s suficiente?

Page 35: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

realitate

Aspecte vizând scalabilitatea

poate fi exprimată și gestionată „privirea de ansamblu” asupra Web-ului (capturing everything)?

are sens a lua în considerație întregul Web pentru a realiza anumite procesări:

interogarea, verificarea consistenței, monitorizarea,…?

Page 36: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

realitate

Existența unei/unor suite de formalisme, specificații, limbaje, instrumente, servicii specifice

cu grade de maturitate și adopție diferite

Page 37: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

realitate

Benjamin Nowack, 2009

Page 38: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Care este arhitectura aplicațiiloraliniate problematicilor Web-ului semantic?

Page 39: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Arhitectura aplicațiilor bazate pe RDFadaptare după (Allemang & Hendler, 2011)

Query Engine

RDF Store(merger)

fișiere RDF(XML, Turtle, JSON-LD etc.)

pagini Web, foi de calcul, tabele, baze de date, fluxuri de date,…

aplicație

vizualizare, căutare, filtrare, analiză,…

(via UI și/sau API)

convertingscraping

parsingserialization

Page 40: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Web/native

app

dynamiccontent engine

RDF store*

dynamiccontent engine

RDF store*

(micro-)services

e.g., AI techniques

(micro-) services

☁HTTP

Web Sockets

HTMLJSON et al.

SPARQL SPARQL

* data and/or knowledge(meta-data, taxonomy, ontology)

reason, learn, filter, visualize,

aggregate,…

arhitectura – eventual, adoptând (micro-)servicii –a aplicațiilor de gestionare a cunoștințelor

Page 41: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Web/native

app

dynamiccontent engine

RDF store*

dynamiccontent engine

RDF store*

(micro-)services

e.g., AI techniques

(micro-) services

☁HTTP

Web Sockets

HTMLJSON et al.

SPARQL SPARQL

* data and/or knowledge(meta-data, taxonomy, ontology)

reason, learn, filter, visualize,

aggregate,…

pentru un web specific, se poate recurge la o federație de puncte terminale SPARQL (SPARQL federation)

Page 42: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: semantic mediawiki

Management colaborativ al conținutuluimodelat semantic (semantic wikis)

Semantic MediaWiki

extensie a sistemului MediaWiki:permite adnotarea semantică a conținutului unui wiki

semantic-mediawiki.org

Page 43: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: semantic mediawiki

Idee: asocierea de perechi proprietate—valoare

fiecărui fragment de informație dintr-un wiki

The title of this book is '''[[Has Title::Cloud Atlas]]'''

[[Surface area::{{{1}}}e{{{2}}} m²|{{{1}}} × 10<sup>{{{2}}}</sup> m²]]

Page 44: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: semantic mediawiki

Facilități în contextul Web-ului semantic:

export de date RDF

posibilitatea de a expune un punct terminal SPARQL

reutilizarea unor vocabulare consacrate(importuri DCMI, FOAF, BIBO – Bibliographic Ontology)

www.semantic-mediawiki.org/wiki/Help:Semantic_Web

Page 45: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: semantic mediawiki

Utilizări în special în e-science(arheologie, biologie, biomedicină, lingvistică,…)

și în domeniul guvernamental, inclusiv în e-learning

www.semantic-mediawiki.org/wiki/Semantic_MediaWiki_publications

Page 46: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: semantic mediawiki

caz concret: wikichip.org – export RDF de date/cunoștințevizând arhitecturi de microprocesoare pe baza modelului

Semantic Wiki Vocabulary and Terminology (SWiVT)

<http://wikichip.org/wiki/Special:URIResolver/intel/microarchitectures/coffee_lake> a swivt:Subject,

wiki:Category-3Aall_microarchitectures,

wiki:Category-3Acpu_microarchitectures_by_intel,

wiki:Category-3Amicroarchitectures_by_intel ;

rdfs:label "Coffee Lake - Microarchitectures - Intel" ;

swivt:page <https://en.wikichip.org/wiki/intel/microarchitectures/coffee_lake> ;

swivt:wikiPageModificationDate "2019-10-24T02:48:57+00:00"^^xsd:dateTime ;

wiki:Property-3Adesigner "Intel"^^xsd:string ;

wiki:Property-3Afirst_launched "2017-10-05"^^xsd:date ;

wiki:Property-3Ainstruction_set_architecture "x86-64"^^xsd:string ;

wiki:Property-3Amanufacturer "Intel"^^xsd:string ;

wiki:Property-3Amicroarchitecture_type "CPU"^^xsd:string ;

wiki:Property-3Aname "Coffee Lake"^^xsd:string ;

wiki:Property-3Apipeline_stages_-28max-29 1.9e+01 ;

wiki:Property-3Apipeline_stages_-28min-29 1.4e+01 .

<https://en.wikichip.org/wiki/Special:ExportRDF/intel/microarchitectures/coffee_lake>

a owl:Ontology ;

swivt:creationDate "2019-10-28T06:31:59-04:00"^^xsd:dateTime ;

owl:imports <http://semantic-mediawiki.org/swivt/1.0> .

Page 47: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: dbpedia

De la conținut colaborativ la adnotare semantică(Christian Bizer et al.)

constituie o bază de cunoștințe via Wikipedia:seturi de date (datasets) + model conceptual

versiunea în limba engleză: descrieri RDF a peste 4,5 milioane de „lucruri” (things)

conținut disponibil în 125 limbi – 38 milioane de „things”

Page 48: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: dbpedia

De la conținut colaborativ la adnotare semantică(Christian Bizer et al.)

recurge la diverse modele conceptuale (ontologii) vizând mai multe domenii

vezi cursurile viitoare

Page 49: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: dbpedia

De la conținut colaborativ la adnotare semantică(Christian Bizer et al.)

acces via SPARQL: wiki.dbpedia.org/OnlineAccess

versiune pentru download: arhive .bzip2 actualizate lunarwiki.dbpedia.org/develop/datasets/monthly-dataset-releases

disponibilitate în cloud (în stil PAGO – Pay As You Go)vos.openlinksw.com/owiki/wiki/VOS/VirtDBpediaSnapshotPagoAmi

ontology2.com/the-book/dbpedia-2016-04.html

Page 50: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicatii rdf: exemplificari

surse de date care referă alte entități DBpedia(Bizer et al., 2009)

de studiat svn.aksw.org/papers/2013/SWJ_DBpedia/public.pdf

Page 51: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: dbpedia

Extractori pentru procesarea tipurilor de conținuturioferite de Wikipedia

labelsrdfs:label, interlanguage links, redirects,imagesfoaf:depiction, geo-coordinates,disambiguationdbpedia:disambiguates,

external linksdbpedia:reference, pagelinksdbpedia:wikilink etc.

Page 52: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: dbpedia

Extractori pentru procesarea tipurilor de conținuturioferite de Wikipedia

implementare:DBpedia Information Extraction Frameworkconceput inițial în PHP, actualmente în Scala

github.com/dbpedia/extraction-framework/wiki

utilizat și în alte contexte, precum extragerea de fapte:github.com/dbpedia/fact-extractor

Page 53: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicatii rdf: exemplificari

OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)

Page 54: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

DBpedia Liveresponsabil cu sincronizarea datelor Wikipedia↔DBpedia

(implementare Java)wiki.dbpedia.org/online-access/DBpediaLive

Page 55: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

Bază de date structurate (cunoștințe) multilingve

disponibilă în regim deschis și colaborativ

inițiativă a fundației Wikimediape baza proiectelor Wikipedia, Wikimedia Commons,…

utilizează seturile de date/cunoștințe oferite de DBpedia și Freebase (ex-proiect Google)

www.wikidata.org

Page 56: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

Depozitul de cunoștințe e stocat centralizat, fiind compus din items

„lucruri” (things) de interes vizând cunoașterea umană: subiecte, concepte, obiecte,…

www.wikidata.org/wiki/Help:Items

Page 57: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

Un item posedă:

un identificator unicQ urmat de un cod numeric

diverse meta-dateetichetă (label), descriere, alias-uri

Page 58: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

s-au ales identificatori numerici (desemnați de URI-uri)pentru a se evita dependența de limbaj și ambiguitatea

Lih

& F

ern

and

ez (

20

18

): b

it.ly

/ocl

c18w

ikid

ata

Page 59: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

conceptul Earth (Q2) are asociate diverse etichete, descrieri și alias-uri multilingve

la nivel de Web, accesat via URI:https://www.wikidata.org/wiki/Q2

Page 60: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

Despre un item se pot formula anumite afirmații (statements)

pereche proprietate—valoare

proprietățile sunt identificate unic (prefix P + un cod numeric) și au predefinit un tip de date ce restricționează

valorile (unice, multiple sau necunoscute) admise via un vocabular controlat (controlled vocabulary)

www.wikidata.org/wiki/Help:Statements

Page 61: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

Exemple de proprietăți:

P31 – instance ofP279 – subclass of

P569 – date of birthP625 – coordonate location

Page 62: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

via afirmații, proprietățile conectează un item de valori numerice sau alți items

exemplu: Q2 P31 Q3504248

Page 63: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

via afirmații, proprietățile conectează un item de valori numerice sau alți items

exemplu: Q2 P31 Q3504248

item—predicate—objectitem—property—value

thing—relationship—thing

Page 64: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

la rândul lor, proprietățile au asociate etichete, descrieri și alias-uri

lista proprietăților Wikidata:www.wikidata.org/wiki/Wikidata:List_of_properties

Page 65: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

Despre un item se pot formula anumite afirmații (statements)

o afirmație poate fi extinsă și adnotată, plus poate fi plasată într-un context – adăugându-i-se (meta-)date:

calificatori (qualifiers) – www.wikidata.org/wiki/Help:Qualifiers

referințe (references) – www.wikidata.org/wiki/Help:Sources

ranguri (rank) – www.wikidata.org/wiki/Help:Ranking

Page 66: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

contextul specificării unor date de interes(e.g., proveniența – cine, când, cum, de ce)

Page 67: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

Interogările se realizează via SPARQL

cererile se transmit punctului-terminal (doar prin GET)https://query.wikidata.org/sparql?query=SPARQL

implicit, rezultatul e oferit în format XMLalte formate permise: JSON, TSV, CSV, RDF binar

timpul maxim de execuție a unei cereri: 60 de secunde

alte detalii la en.wikibooks.org/wiki/SPARQL/Wikidata_Query_Service

Page 68: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

cele mai frecvent folosite proprietăți ale Wikidataîn funcție de tipul interogărilor SPARQL

(realizate de oameni vs. automat)A. Bielefeldt, J. Gonsior, M. Krötzsch, “Practical Linked Data Access

via SPARQL: The Case of Wikidata”, LDOW 2018ceur-ws.org/Vol-2073/article-03.pdf

Page 69: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: wikidata

Instrumente utile dezvoltatorilor de aplicații:

proiectul Wikibase disponibil liber – wikiba.se

a collection of applications and libraries for creating, managing and sharing structured data

extensii pentru platforma MediaWiki: Wikibase Repository + Wikibase Client

Query Service – oferă SPARQL, folosind BlazeGraph

alte componente reutilizabile: biblioteci PHP și JS

Page 70: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: metaphactory platform

Interacțiunea vocală cu utilizatorul pentru a obține cunoștințe dorite (question answering)

modelare de date și cunoștințe prin RDF + OWLreutilizarea cunoștințelor oferite de Wikidata

interogări SPARQLprocesare de limbaj natural via serviciile Amazon Alexa

tehnici bazate pe rețele neuronale pentru analiza datelorprelucrări statistice cu R

exploatare „în nori”

Page 71: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: metaphactory platform

P. Haase et al., Alexa, Ask Wikidata! Voice Interactionwith Knowledge Graphs using Amazon Alexa, ISWC 2017

www.metaphacts.com/images/PDFs/publications/ISWC2017-Alexa-Ask-Wikidata.pdf

Page 72: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: semantic e-government

Informații publice ale guvernului UK: data.gov.ukde studiat și prezentările lui Richard Wallis: www.slideshare.net/rjw

câteva proiecte similare:Canada – open.canada.ca/en/open-data

Franța – www.data.gouv.fr/fr/dashboard/

USA – www.data.gov/developers/

inițiativa Open Government Partnership: www.opengovpartnership.org

Page 73: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicații rdf: semantic e-government

SIGMA (SemantIc Government Mashup Application)Claudia Gheorghiu, Radu Nicolescu, Andrei Vasile Bogdan,

Cristian Ochișor, Sabin Buraga, Lenuța Alboaie (2011)

platformă Web extensibilă capabilă să creeze mashup-urioferind acces la date guvernamentale deschise

includerea unei soluții proprii de acces via un end-pointSPARQL la date guvernamentale preluate de la gov.ro

Page 74: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

film demonstrativvimeo.com/79785943

Page 75: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Cum publicăm datele pe Webastfel încât să fie asigurate

reutilizarea și interoperabilitatea?

Page 76: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data

Paradigmă de publicare a datelor pe Webcare recurge la tehnologiile Web existente

Tom Heath & Christian Bizer, Linked Data: Evolving the Web into a Global Data Space,

Morgan & Claypool, 2011linkeddatabook.com/book

Page 77: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data

Paradigmă de publicare a datelor pe Webcare recurge la tehnologiile Web existente

reducerea redundanțeifacilitarea reutilizării

permiterea descopeririimaximizarea inter-conectivității între „lucruri” înrudite

adoptarea unei abordări pragmatice

Page 78: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data

Viziune:

Use the Web of Data as a Content Management System

Use the community at large as content editors

Ivan Herman (2013) – www.w3.org/2013/Talks/0902-Lisbon-IH/

Page 79: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data

Ingrediente de bază:

identificare – URIacces – HTTP

modelare – RDFstructurare – schema.org, RDF Schema, OWL

cursurile viitoare

Page 80: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked dataexemplu: un „nor” al datelor

interconectate privitoare la publicații academice creat și oferit de Microsoft

(disponibil public din oct. 2019)ma-graph.org

end-point SPARQL bazat pe Virtuoso la ma-graph.org/sparql

Michael Färber, “The Microsoft Academic Knowledge Graph: A Linked Data Source with 8 Billion Triples of Scholarly Data”, ISWC 2019

Page 81: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: principii (Berners-Lee)

Utilizarea URI-urilor pentru numirea „lucrurilor”

specificarea via URI a oricăror resurse– informaționale sau non-informaționale –,

nu doar a documentelor

identitate unică la nivel global

www.w3.org/DesignIssues/LinkedData.html

Page 82: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: principii (Berners-Lee)

Folosirea de URI-uri ce pot fi vehiculate via HTTP

orice URI are un proprietar:persoană, organizație, specificație,…

utilizatorii/aplicațiile pot localiza resursele(oricine posedă un browser/client Web)

www.w3.org/DesignIssues/LinkedData.html

Page 83: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: principii (Berners-Lee)

Oferirea de informații utile în format RDF

atunci când un agent (software) accesează un URI,poate „afla” (meta-)date de interes

www.w3.org/DesignIssues/LinkedData.html

Page 84: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: principii (Berners-Lee)

Includerea în reprezentarea RDFa unor legături spre alte URI-uri

facilitarea descoperirii de informații înrudite(network effect)

www.w3.org/DesignIssues/LinkedData.html

Page 85: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

S. Buraga, “Towards 5-star Data in the E-university” (2014)www.slideshare.net/busaco/towards-5star-data

date de 5 stele (5 ★ Open Data)

Page 86: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co★make your stuff available on the Web (whatever format) under an open license

★★make it available as structured data e.g., Excel instead of image scan of a table

★★★use non-proprietary formats e.g., CSV instead of Excel

★★★★use Web addresses (URLs) to denote things, so that people can point at your stuff

★★★★★link your data to other data to provide context

conform Ed Summers (2010)

Page 87: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Publicarea pe Web a datelor interconectatereferitoare la whisky – conform (T. Heath, 2009)

Page 88: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Aspecte de interes:

existența on-line a unui magazin destinat connoisseur-ului

afacere online – wiskii.com – fondată de Jeff

informații furnizate de experți ai domeniului

contribuții realizate și de către utilizatori obișnuiți

implementare bazată pe un server de aplicații Web

date stocate relațional și/sau într-un RDF store

acces simultan la date în HTML și RDF

Page 89: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Metodologie:

1. înțelegerea principiilor linked data2. înțelegerea (conceptualizarea) datelor3. stabilirea de URI-uri pentru entități (things)4. stabilirea infrastructurii5. relaționarea cu alte seturi de date existente6. descrierea și publicarea datelor

Page 90: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Care sunt aspectele principale care trebuieconsiderate privind datele aplicației Web?

Page 91: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Care sunt aspectele principale care trebuieconsiderate privind datele aplicației Web?

persoane? locații geografice?

artefacte culturale?comentarii?

recenzii?

Page 92: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Aspecte – concepte – de interes vizândbaza de cunoștințe utilizată de aplicația wiskii.com

distilerii, regiuni + localități geografice, fondatori, proprietari, brand-uri, produse, fotografii,

recenzii (review-uri), comentarii, prețuri + oferte

Page 93: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Descrierea datelor pe baza vocabularelor

principii:

reutilizarea, nu inventarea unui alt vocabular

combinarea vocabularelor existente

Page 94: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Descrierea datelor pe baza vocabularelor

potențiale modele conceptuale ce pot fi adoptate:Geonames – www.geonames.org/ontology/

FOAF (Friend Of A Friend) – www.foaf-project.org/

Review – vocab.org/review/

Whisky – vocab.org/whisky/

+cel furnizat de schema.org (concepte utile: Brand, Offer,

BusinessEvent, FoodService, LiquorStore, Map, Review, Product,…)

Page 95: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Descrierea datelor pe baza vocabularelor

vocabularele (tipurile de date) definite pot avea ulterioratașate specificații formale

Page 96: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:recurgerea la schema HTTP pentru facilitarea accesului

http://vocab.org/whisky/terms/Brand

versusurn:whisky-vocab:brand

Page 97: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:evitarea imixtiunii în alte spații de nume

Page 98: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:abstractizare – evitarea detaliilor de implementare

http://dbpedia.org/resource/Romania

versushttp://www4.wiwiss.fu-berlin.de:2020/demos/dbpedia/cgi-bin/

resources.php?id=Romania

Page 99: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Alegerea URI-urilor corespunzătoare

principii:folosirii unei singure convenții de referire

# (hash) sau / (slash)

http://undeva.info/graf.rdf#me

versushttp://undeva.info/id/me

Page 100: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

șabloane de stabilire a URI-urilor

http://dbpedia.org/resource/Science Thing (concept)

http://dbpedia.org/data/Science Date RDF

http://dbpedia.org/page/Science Pagină HTML

http://revyu.com/people/tom Thing (concept)

http://revyu.com/people/tom/about/rdf Date RDF

http://revyu.com/people/tom/about/html Pagină HTML

http://undeva.info/concept Thing (concept)

http://undeva.info/concept.rdf Date RDF

http://undeva.info/concept.html Pagină HTML

Page 101: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Exemplificări (clasă + instanță):

regiuni http://wiskii.com/regions/speyside

distilerii http://wiskii.com/distilleries/talisker

brand-uri http://wiskii.com/brands/talisker

produse http://wiskii.com/products/talisker-10-yo

persoane http://wiskii.com/people/william-matheson

fotografii http://wiskii.com/photos/58

recenzii http://wiskii.com/reviews/271

Page 102: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Accesul la o anumită reprezentare – exemple:

concept → http://wiskii.com/brands/talisker

date RDF → http://wiskii.com/brands/talisker/rdf

pagină HTML → http://wiskii.com/brands/talisker/html

Page 103: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Stabilirea infrastructurii

HTML RDF

aplicațieWeb

date

Page 104: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

Page 105: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

http://wiskii.com/brands/talisker

Page 106: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

http://wiskii.com/brands/talisker

HTTP GET

Page 107: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

HTML RDF

aplicațieWeb

date

http://wiskii.com/brands/talisker/html http://wiskii.com/brands/talisker/rdf

http://wiskii.com/brands/talisker

HTTP GET

HTTP 303 See Other HTTP 303 See Other

content negotiation

pentru oameni și pentru mașină

Page 108: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Relaționarea cu alte seturi de date

de (re)considerat „norul” linked datalod-cloud.net

Page 109: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

martie 2019

1239 seturi de date (datasets)

cu 16147 legături(links)

lod-cloud.net

Linking Open Data cloud diagram 2019(J. P. McCrae et al.)

Page 110: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Relaționarea cu alte seturi de date

fiecare set de date RDF pot fi gestionat și interconectat via diverse instrumente software

soluție de referință:CKAN (Comprehensive Knowledge Archive Network)

ckan.org

alternative: OpenDataSoft – help.opendatasoft.com

Socrata Open Data API – dev.socrata.com

Page 111: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Relaționarea cu alte seturi de date

aspecte de interes privind vocabularele publice:gradul de utilizare

mentenanțaaplicabilitateaexpresivitatea

Page 112: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Relaționarea cu alte seturi de date

predicate generice folosite uzual:foaf:homepage, foaf:topic, foaf:based_near, foaf:maker,

foaf:depiction, foaf:primaryTopic,…

owl:sameAs

rdfs:seeAlso

schema:identifier, schema:sameAs, schema:url etc.

Page 113: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

Relaționarea cu alte seturi de date – exemplificări:

distilleries

GeoNames

regions

DBpediaWikidata

brands

Open Food Facts IMGpedia

products

Page 114: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Relații între diverse resurse din seturi de date diferite DBpedia, GeoNames, VIAF (Virtual International Authority File), Wikidata

<http://dbpedia.org/resource/Romania>owl:sameAs <https://www.wikidata.org/wiki/Q218> ;owl:sameAs <http://sws.geonames.org/798549/> ;... <http://sws.geonames.org/798549/>

rdfs:seeAlso <http://dbpedia.org/resource/Romania>wgs84_pos:lat "46" ; wgs84_pos:long "25" ;gn:officialName "Roumanie"@fr , "Rumanïi"@sg ;gn:parentFeature <http://sws.geonames.org/6695072/> .

descoperirea de fapte via seturi de date interconectate

<http://sws.geonames.org/6695072/>rdfs:seeAlso <http://viaf.org/viaf/207634635> ;rdfs:seeAlso <https://www.wikidata.org/wiki/Q458> ; …

# SPARQL: Q458 EU, P571 inception date, P112 founded bySELECT * WHERE { wd:Q458 wdt:P571 ?date ; wdt:P112 ?state . }13 December 2007

Q31 (Belgium) Q38 (Italy) Q142 (France) etc.

Page 115: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked dataAdoptarea principiilor linked data la un domeniu dat

exemplificări:

COLINDA (Conference Linked Data) – www.colinda.org

Drug Encyclopedia – datlowe.org/drug-encyclopedia/

Human Associations in the Semantic Webjoernhees.github.io/associations/

IMGpedia – imgpedia.dcc.uchile.cl

LBD (Linked Brain Data) – www.linked-neuron-data.org

Linked Geo Data – linkedgeodata.org

Linked Life Data – linkedlifedata.com

Listening Experience Database – led.kmi.open.ac.uk

Page 116: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data

Linked Jazz – linkedjazz.org

actualmente, inclus în Wikidata

Page 117: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked dataAdoptarea principiilor linked data la un domeniu dat

exemplificări – continuare:

LOV (Linked Open Vocabularies) – lov.okfn.org/dataset/lov/

Linked Statistics – linked-statistics.gr

LSD (Linked Stream Data) videolectures.net/iswc2012_le_phuoc_processing_engines/

Nobel Prizes Linked Data – data.nobelprize.org

Open PHACTS – openphactsfoundation.org

Scholarly Data – www.scholarlydata.org

The Open University Linked Data – data.open.ac.uk

US Library of Congress Linked Data – id.loc.gov

Page 118: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data

Recurgerea la principiile linked data la nivel local (privat) – i.e., depozite de date disponibile

la nivel organizațional (enterprise)

LLD (Linked Local Data)kidehen.blogspot.com/2014/08/linked-local-data-lld-and-linked-open.html

exemplificări (European Linked Data Award, începând cu 2015):2019.semantics.cc/awards

2017.semantics.cc/awards

semantics.cc/eldc-awards-given

Page 119: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie – necesități

Calitatea datelor (data quality)

acuratețe, precizie, consistență, integritate, validitate, relevanță, granularitate, comprehensibilitate,…

evaluare cantitativă versus calitativă

www.dataversity.net/what-is-data-quality/

Page 120: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie – necesități

Disponibilitatea și stabilitatea setului de date

acces via API-uri (publice)meta-dateversiuni

modele (vocabulare) riguros definite…

Page 121: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie – necesități

Publicarea direct pe un sit Web public

eventual, „în nori”

principiu: DRY (don’t repeat yourself)every piece of knowledge must have a single, unambiguous,

authoritative representation within a systemwiki.c2.com/?DontRepeatYourself

Page 122: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie – necesități

Claritate privind termenii de (re-)utilizare

licențiereproveniență

prezervare – i.e., arhivare

Page 123: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie – necesități

Existența resurselor vizând documentarea și a aplicațiilor concrete

inclusiv, cele demonstrative

Page 124: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie – necesități

amănunte în specificația Data on the Web Best Practices(recomandare W3C, 2017)

www.w3.org/TR/dwbp/

Page 125: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studiu de caz

statistici vizând „norul” datelor interconectate

Jan’13 Nov’14 Nov’15 Dec’16 Nov’17Datasets 639 1048 9960 9960 9960

RDF triples (mld.) 1.7 5.7 85.5 154.6 149.4

Errors (%) 49.8 64.9 65.6 79.8 70.1

Page 126: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie

Aspecte privind cele mai bune practici:

identificarea resurselor – identifier patternsmodelare – modelling patterns

publicare a datelor – publishing patternsmanagement al datelor – data management patterns

dezvoltare de aplicații – application patternsevaluarea calității – e.g., benchmarking

Page 127: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie – ldp

Considerații metodologice și pragmatice

oferite de recomandarea W3C (2015)Linked Data Platform 1.0 – www.w3.org/TR/ldp/

a se studia și metodologia Solid (Social Linked Data)în lucru (8 nov. 2019): solid.github.io/specification/

detalii despre proiect la solidproject.org

Page 128: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie – ldp

Considerații metodologice și pragmatice

Linked Data Platform 1.0

orice client, server sau o combinație a acestoracare se conformează prevederilor LDP pentru a accesa

(containere de) resurse Web – de dorit, reprezentabile prin RDF – via HTTP

Page 129: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie – ldp

Considerații metodologice și pragmatice

Linked Data Platform 1.0

o introducere în articolul lui Cody Burleson (2014)www.dataversity.net/introduction-linked-data-platform/

diverse bune practici și reglementări:www.w3.org/TR/ldp-bp/

Page 130: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Linked Data Platform – implementări

Apache Marmotta (Java) – marmotta.apache.org

Carbon LDP (JS) – carbonldp.com/documentation/

Glutton (Python) – commonsdev.github.io/glutton/

LYRASIS Fedora (Java) – duraspace.org/fedora/

Gold (Go) – github.com/linkeddata/gold

OpenLink Data Spaces (JS) – ods.openlinksw.com/owiki/wiki/ODS

Solid (Node.js) – github.com/solid/node-solid-server

Trellis Linked Data Server (Java) – www.trellisldp.org

alte soluții enumerate dewww.w3.org/wiki/LDP_Implementations

Page 131: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie – ldf

Considerații metodologice și pragmatice

rezolvarea interogărilor SPARQL la nivel de clientLinked Data Fragments (inițiativă în lucru, din 2015)

linkeddatafragments.org

Page 132: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie

acces asincron la fragmente de triple RDF (triple pattern fragments)

aici, instrumentul Comunica (JS): comunica.linkeddatafragments.org

Page 133: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie – ldf

Linked Data Fragments

soluții software (Java, Perl, Python etc.):

linkeddatafragments.org/software/

propunere: GraphQL-LD

alternativă la interogări SPARQL asincronegithub.com/rubensworks/GraphQL-LD.js

Page 134: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie

Considerații metodologice și pragmatice

deservirea datelor via servicii: Linked Data-as-a-Service

date RDF „brute” (data dumps)documente incluzând date interconectate

puncte-terminale (endpoints) SPARQLfragmente de triple obținute asincron

alte API-uri

L. Rietveld et al., “Linked Data-as-a-Service: The Semantic Web Redeployed”, ESWC 2015 – ruben.verborgh.org/publications/rietveld_eswc_2015/

Page 135: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie

Considerații metodologice și pragmatice

notificări: Linked Data Notifications (W3C, 2017)

a protocol that describes how servers (receivers) can have messages pushed to them by applications (senders)

messages are expressed in RDF, and can contain any data

www.w3.org/TR/ldn/

Page 136: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie

Linked Data Notifications (W3C, 2017)

Page 137: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: ingineriecontext mai larg: fluxuri de date RDF (RDF streams)

D. Dell’Aglio et al., “On a Web of Data Streams”,ISWC 2017 DeSemWeb, 2017: dellaglio.github.io/webstreams/

Page 138: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: aplicații

D. Le-Phuoc et al., “Enabling Live Exploration on The Graph of Things”videolectures.net/iswc2014_le_phuoc_live_exploration/

graphofthings.org

Page 139: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie

Considerații metodologice și pragmatice

asigurarea anonimității și intimității (privacy)

partajarea de meta-date fără a expune informații private e.g., show what kind of resources are available

controlul accesului efectiv la (meta-)date via politici de acces, disponibilitate limitată,…

Page 140: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: inginerie

Considerații metodologice și pragmatice

asigurarea anonimității și intimității (privacy)

direcție de cercetare: blockchain în contextul linked data

providing interoperability by modeling blockchains LD can be used to index and search across ledgers

describing terms, rights, and conditions of smart contractsrubenverborgh.github.io/VOGIN-IP-2018/

Page 141: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: demo

studiu: blockchain în cadrul RDF4LED – RDF store destinat dispozitivelor „ușoare”

A. Le-Tuan et al., “Incorporating Blockchain into RDF Store at the Lightweight Edge Devices”, SEMANTiCS 2019

Page 142: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: testare & depanare

Verificarea corectitudinii sintaxei RDF

instrumente software:W3C RDF Validator – www.w3.org/RDF/Validator/

Eyeball (instrument inclus în Apache Jena)

un tutorial privind validarea datelor RDF, inclusiv cu SHACL (Gayo et al., 2016):weso.github.io/RDFValidation_ESWC16/

Page 143: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: testare & depanare

de experimentat și aplicația Web LOD Laundromatlodlaundromat.org

Page 144: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: testare & depanare

Verificarea infrastructurii(e.g., dereferențierea URL-urilor)

redirecționări corecte în funcție de client și tipul de conținut acceptat (MediaTypes)

Page 145: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: testare & depanare

Depanarea (inspectarea triplelor) RDF

manuală

eventual, preluând datele – în stilul REST –via cURL sau un instrument similar

Page 146: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: testare & depanare

Depanarea (inspectarea triplelor) RDF

recurgerea la un hyperdata (semantic) browser

e.g., instrumentul OpenLink Data Explorer ca extensiea unui navigator Web actual – ode.openlinksw.com

Page 147: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Vizualizarea datelor interconectate

exemplificări:LODmilla – lodmilla.sztaki.hu/lodmilla/

LodLive – en.lodlive.it

Page 148: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: asigurarea calității

Măsurarea performanței sistemelor RDF

cadrul general: Graph & RDF benchmark reference – ldbcouncil.org

sisteme existente – exemple: Semantic Publishing Benchmarkgithub.com/ldbc/ldbc_spb_bm_2.0

HOBBIT: Holistic Benchmarking of Big Linked Dataproject-hobbit.eu

Page 149: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: asigurarea calității

Evoluția și arhivarea datelor RDF

considerații teoretice + aplicative:V. Papakonstantinou et al., Versioning for Linked Data, BLINK 2016

ceur-ws.org/Vol-1700/paper-05.pdf

P. Meinhardt, Versioning Linked Datasets, Master’s Thesis (2015)hpi.de/fileadmin/user_upload/fachgebiete/meinel/Semantic-Technologies/theses/Masterthesis-Meinhardt-2015.pdf

exemplu de sistem existent: R43ples (implementare Java) – plt-tud.github.io/r43ples/

Page 150: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: asigurarea calității

exemplificare: LOD-a-lot – lod-a-lot.lod.labs.vu.nl/

acces pe baza cererilor asincrone și a formatului HDT

Page 151: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

Arhitectura generică a aplicațiilor Webaliniate „curentului” linked data

Page 152: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: privire de ansamblu

1. reprezentarea cunoștințelor dintr-un webidentificarea surselor de date

înțelegerea domeniuluimodelare conceptuală

2. producerea datelor RDFextragere/reutilizare surse/formate de datetriplificare

stocare distribuită

3. publicarea pe Webdereferențiere (content negotiation): pentru oameni și software

acces (a)sincron via SPARQL și/sau GraphQL-LDinterconectarea cu alte seturi de date de interes

adaptare după E. Daga et al., “Linked Data for Humanities”, DH2019www.slideshare.net/enricodaga/ld4-dh-tutorial

Page 153: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

aplicația1

linked dataserver1

linked dataserver2

acces (a)sincronHTTP(S), WebSocket,…

aplicația2

adap

tare

du

I.H

erm

an(2

01

3)

Page 154: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

SPARQL / RDF API

arhitectura stratificată a aplicațiilor bazate pe linked data(T. Heath & C. Bizer, 2011)

Page 155: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data: studii de caz & exemple

A se consulta și lucrările atelierelor de lucruLDOW (Linked Data on the Web)

events.linkeddata.org/ldow2018/

events.linkeddata.org/ldow2017/

events.linkeddata.org/ldow2016/

events.linkeddata.org/ldow2015/

events.linkeddata.org/ldow2014/

Page 156: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

linked data

Amănunte în cartea disponibilă liberLeigh Dodds & Ian Davis, Linked Data Patterns. A Pattern Catalogue for Modelling, Publishing,

and Consuming Linked Data (2012)patterns.dataincubator.org

a se studia și School of Data Handbook (2013)schoolofdata.org/handbook/

Page 157: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

„concluzii”

Aspecte importante vizând datele interconectate:

agregarea dinamică a informațiilor/cunoștințelor pe baza datelor externe disponibile public

evitarea dependenței de marcajele HTML (no Web scraping) și de API-uri specializate

acces la (meta-)datele dorite via HTTP clasic

beneficii aduse de interconectare – linked open datae.g., suport pentru descoperire

Page 158: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

„concluzii”

“Software – as a service or not – is just a container.What makes software valuable has always been what

it does to data. Now, in the same spirit of SOA and SaaS,a new concept is emerging, Data-as-a-Service – DaaS.”

Pete Soderling, 2010

Page 159: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

rezumat

⨳aplicații bazate pe Web of data

arhitectură, linked data, studii de cazmulțumiri Claudiei Gheorghiu și lui Ștefan Negru – @blankdots

Page 160: Dezvoltarea aplicațiilor Webbusaco/teach/courses/wade/presentations/web07... · ga /~ co Web attitude (Tim Berners-Lee) anyone can say anything about anything no one knows everything

Dr.

Sab

in B

ura

ga

profs.in

fo.uaic.ro/~busa

co

episodul viitor: modelarea cunoștințelor via RDF Schema