sabin buraga: date de 5 stele
Post on 13-May-2015
751 Views
Preview:
DESCRIPTION
TRANSCRIPT
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
open participation
open data
open software
open app development
open web
open cloud
open (computing) hardware
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
World Wide Web = “a common information space
in which we communicate by sharing information”
Tim Berners-Lee (2013)
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Accesarea resurselor disponibile pe Web
procesarea marcajelor HTML – Web scrapping
versusinterfețe de programare
(API – Application Programming Interface)
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Reutilizarea datelor disponibile pe Web
preluarea datelor via servicii Web
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
servicii WebAPI-uri publicemash-up-uri
www.programmableweb.com
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Reutilizarea datelor disponibile pe Web
necesitatea adoptării unei licențe de (re)utilizare
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Reutilizarea datelor disponibile pe Web
utilizare onestă (fair use)
folosire limitată, dar gratuită, a unei lucrări
protejate de drepturi de autor – e.g., pentru uz educațional
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Reutilizarea datelor disponibile pe Web
domeniul public (public domain)
a expirat copyright-ul, proprietarul deliberat plasează
resursa în domeniul public sau legile nu pot proteja
resursa respectivă
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Reutilizarea datelor disponibile pe Web
copyleft
autorul oferă resursa să fie utilizată
cu anumite restricții
uzual: some rights reserved
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Reutilizarea datelor disponibile pe Web
Creative Commons
oferă licențe de tip copyleftpentru creații disponibile pe Web
reasonable, flexible copyright
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Reutilizarea datelor disponibile pe Web
Creative Commons
vizează maniera de atribuire, caracterul non-comercial,
politica derivării conținutului și modul de partajare
deschidere, transparență, respect
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
www.creativecommons.org
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Disponibilitatea datelor disponibile pe Web
a fi stocat pe Web(“on the Web”)
ca document „opac”
– disponibil într-un format proprietar sau nu –
fără a referi, pe baza standardelor Web,
alte resurse de interes
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Disponibilitatea datelor disponibile pe Web
a fi descoperibil pe baza standardelor Web(“in the Web”)
folosind modele/formate de date deschise
(HTML, CSV, JSON, XML, RDF etc.)
aliniate principiilor hipertextului/hipermedia,
procesabile independent de platformă
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
date deschise
“A piece of content or data is open
if anyone is free to use, reuse, and redistribute it.”
http://opendefinition.org/
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
deși pretind a avea (uneori) un caracter deschis,
aplicațiile Web actuale țin „ostatice” datele
acces (limitat, eventual pe baza unei subscripții
– e.g., taxe) via API
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
> “If you have access to the data,
then you can achieve continuity
even if you don’t have access to
the underlying source of the application.
Open data is more important than open source. […]
Data persists, open data endures.”
Ian Davis, 2009
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Caracterul deschis al datelor e dat de…
disponibilitate & acces
reutilizare & redistribuire
participare universală
inter-operabilitate
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Cum putem evalua caracterul deschis
al resurselor Web?
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Date de 5 stele (5 ★ Open Data)
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
★
date de 1 stea
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
date de 1 stea
conținutul e disponibil pe Web – indiferent de
format – conform unei licențe deschise
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
utilizatorii pot vizualiza, lista,
stoca local și, eventual, modifica documentul
documentul în sine poate fi partajat pe Internet
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
documentul poate fi publicat rapid & facil pe Web
pentru a refolosi datele incluse în document
sunt necesare uneori procesări suplimentare
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
★ ★
date de 2 stele
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
date de 2 stele
suplimentar, conținutul este disponibil pe Web
într-un format structurat
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
utilizatorii pot procesa documentul
folosind, uzual, software proprietar
documentul poate fi exportat în alt format
(structurat sau nu)
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
documentul poate fi încă publicat facil pe Web
datele sunt în continuare „încuiate” în document,
procesarea depinzând de un anumit program
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
★ ★ ★
date deschise de 3 stele
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
date deschise de 3 stele
recurgerea la un format deschis
pentru a pune la dispoziție pe Web date
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
datele pot fi gestionate (vizualizate, filtrate, procesate,
convertite, refolosite etc.) în orice manieră
asigurarea independenței de platforma software
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
în continuare, documentul poate fi publicat facil pe Web
exportarea datelor într-un format proprietar
ar putea fi problematică
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
★ ★ ★ ★
date deschise de 4 stele
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
date deschise de 4 stele
adoptarea identificatorilor de resurse (URI-uri)
pentru a desemna „lucruri” de interes
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
datele, informațiile și cunoștințele se identifică via URI-uri
pentru a putea fi ulterior referite și (re)utilizate
uzual, via modelul RDF (Resource Description Framework)standard al Consorțiului Web (1998, 2004, 2014)
www.w3.org/standards/semanticweb/
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
publicarea poate fi relativ mai dificilă,
necesitând de obicei adoptarea de tehnologii, instrumente
și metodologii specifice Web-ului semantic (Web of Data)
“data in the Web”implicații pe termen lung
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
descrierea conținutului resurselor Web astfel încât să poată fi
procesat „inteligent” – specificarea cunoștințelor direct în HTML
indexarea mai bună de către motoarele de căutare
<li about="/issues/59939" typeof="g:Issue" property="g:hasPublicationDate"
content="2011-10-14" rel="g:hasNotice"><a href="/issues/59939/notices/1457466/…"
about="/issues/59939/notices/1457466" typeof="g:Notice">…</a></li>
utilizări pragmatice: microformate, scheme HTML5, RDFa
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
★ ★ ★ ★ ★
date deschise de 5 stele
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
date deschise de 5 stele
în plus, datele sunt inter-conectate
conform principiilor inițiativei linked data
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
posibilitatea descoperirii altor date de interes (înrudite)
direct la momentul procesării
se oferă premisele efectuării de raționamente automate
direct la nivel de Web
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
dificultăți:
consistența & reconcilierea datelor și cunoștințelor
probleme legate de adopția lentă de către industrie
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
5stardata.info
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
augmentarea căutării resurselor Web
microformats.org schema.org rdfa.info
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
DBpedia – varianta procesabilă a enciclopediei Wikipedia
PREFIX dbo: <http://dbpedia.org/ontology/>
PREFIX dbprop: <http://dbpedia.org/property/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?film ?nume ?regizor ?dataNastere WHERE {
?film a dbo:Film ;
dbo:language <http://dbpedia.org/resource/Japanese_language> ;
dbprop:director ?regizor ;
dbprop:writer ?scenarist ;
foaf:name ?nume .
?regizor dbprop:dateOfBirth ?dataNastere .
FILTER ((?dataNastere >= 1960) && ?regizor = ?scenarist) .
}
ORDER BY ?nume
LIMIT 7interogarea datelor inter-conectate
disponibile în format RDF via SPARQL
Dr.
Sab
in B
ura
ga
www.purl.org/net/busaco
lista filmelor vorbite
în limba japoneză,
regizate și
– totodată – scrise
de persoane născute
după anul 1960
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
vizualizarea structurată a datelor (aici, animale sălbatice)
preluate de la BBC via OpenLink HTML5 Pivot Viewer
DESCRIBE ?s
WHERE {
?s a <http://purl.org/ontology/wo/Species> ;
foaf:depiction ?foto
} LIMIT 150
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
generarea de chart-uri pe baza datelor obținute cu
SPARQL – biblioteca Sgvizler (JavaScript) http://dev.data2000.no/sgvizler/
SELECT *
WHERE {
[ ] w:hasCountryCode ?ID ;
w:hasGNP ?GNP ;
…
}
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
open e-government – acces la date publice oficiale
după gradul de deschiderehttp://data.gov.uk/data/search?openness_score=5
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
“Software – as a service or not – is just a container.
What makes software valuable has always been what
it does to data. Now, in the same spirit of SOA and SaaS,
a new concept is emerging, Data-as-a-Service – DaaS.”
Pete Soderling (2010)
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
S. Buraga, Siturile Web aferente cursurilor predate
la Facultatea de Informatică, UAIC, 2014
http://profs.info.uaic.ro/~busaco/teach/
D. Dietrich et al., The Open Data Handbook,Open Knowledge Foundation, 2012
http://opendatahandbook.org/
T. Heath & C. Bizer, Linked Data: Evolving the Webinto a Global Data Space, Morgan & Claypool, 2011
http://linkeddatabook.com/book
D. Allemang & J. Hendler, Semantic Web for the Working Ontologist (2nd Edition), Morgan Kaufmann, 2011
Open
Sou
rce
Iasi 2
014
· D
r. S
abin
-Cor
nel
iuBura
ga–
ww
w.p
url.o
rg/n
et/b
usa
co
Dr. Sabin Buragawww.purl.org/net/busaco
top related