effektiv länkad data

105
Länkad data Niklas Lindström

Upload: valtech-ab

Post on 14-Jun-2015

962 views

Category:

Documents


1 download

DESCRIPTION

Material från Lunchseminarium om Länkad data "Hur kan vi använda vår data lika effektivt som t.ex. Google? " som hölls 2012-11-30, av Niklas Lindström på Valtechs kontor, Hantverkargatan 5, Stockholm. Vi sysslar med webbdesign och vill du delta på våra gratis seminarium och events inom allt det digitala, anmäl dig gärna här: http://www.valtech.se/sv/Anmalan-till-maillistan/

TRANSCRIPT

Page 1: Effektiv länkad data

Länkad data

Niklas Lindström

Page 2: Effektiv länkad data
Page 3: Effektiv länkad data

I vårt samhälle pågår

Ständig kommunikation

Integration av information

Page 4: Effektiv länkad data
Page 5: Effektiv länkad data
Page 6: Effektiv länkad data
Page 7: Effektiv länkad data
Page 8: Effektiv länkad data

Evolution

.. från en webb av dokument

.. till en webb av data

Page 9: Effektiv länkad data
Page 10: Effektiv länkad data

Vad är data?

Page 11: Effektiv länkad data

10100111001

CREATE TABLE Persons ( id INTEGER NOT NULL, name VARCHAR(40), PRIMARY KEY (id) )

<persons> <person id="94541"><name>Strintmperg</name></person></persons>

<div class="person" id="p-23"> <span class="name">Sutorindoberi</span></div>

{"persons": [{name: "Стриндберг", key: 94541}]}

Page 12: Effektiv länkad data

W.T.F.?!!1

Page 13: Effektiv länkad data

CSV, XML, JSON, APIer, ...

Page 14: Effektiv länkad data

Olika överallt

Lokala begrepp, termer och identifierare

Page 15: Effektiv länkad data

Det skalar inte

Att återuppfinna begrepp

Att tolka innebörd ur fragment

(.. även Google har problem)

Page 16: Effektiv länkad data

Slöseri!

Kunskapen finns hos de somskapar data

och de som kontinuerligt studerar ochanvänder data

Page 17: Effektiv länkad data

Vad saknas?

Gemensamma termer (egenskaper)

Gemensamma namn (IDn) på ting

Namngivna relationer (länkar) mellan ting

Page 18: Effektiv länkad data

En lösning:

Länkad data på webben

Page 19: Effektiv länkad data

Teknikstandarder

Page 20: Effektiv länkad data

Resource

Description

Framework

Page 21: Effektiv länkad data

En datamodell

Uttrycker grafer

Page 22: Effektiv länkad data
Page 23: Effektiv länkad data

Påståenden

August - föddes i → Stockholm

Page 24: Effektiv länkad data

Triples

subjekt -egenskap→ objekt

Page 25: Effektiv länkad data

Globala identifierare: URIer

Page 26: Effektiv länkad data

<http://libris.kb.se/bib/8214323> <http://schema.org/author> <http://dbpedia.org/resource/August_Strindberg>

<http://libris.kb.se/bib/8214323> <http://purl.org/dc/terms/title> "Röda rummet"@sv

Page 27: Effektiv länkad data

Literaler

"Röda rummet"@sv

59.329445

"1912-05-14"^^xsd:date

Page 28: Effektiv länkad data

Tillämpad semantisk webb

Page 29: Effektiv länkad data

● Facebook Open Graph (OGP)● Yahoo SearchMonkey, Google Rich Snippets● Schema.org● Google Knowledge Graph

● DBPedia & relaterade LOD-projekt

Page 30: Effektiv länkad data

Schema.org

Page 31: Effektiv länkad data

Provides a collection of schemas that webmasters can use to markup their pages in ways recognized by major search providers

Page 32: Effektiv länkad data

Google, Bing, Yahoo, Yandex

(W3C)

Page 33: Effektiv länkad data

Webbplatser är fulla av

● Dokument.. som beskriver saker● Nyheter, kalenderhändelser● Platser, personer, organisationer● Produkter, recensioner, butiker● Mat, recept, hälsotips● Kurser, festivaler, intressegrupper● Böcker, konst, kulturarv● Djur och natur, fenomen och vetenskap● Termer och begrepp, ...

Page 34: Effektiv länkad data

Fånga detaljer

EgenskaperTitel, datum, namn/etikett, numeriska värden

Särskilda länkarFörfattare, utgivare, ämne/tema, föremål

Page 35: Effektiv länkad data
Page 36: Effektiv länkad data
Page 37: Effektiv länkad data

För att märka upp

detaljer i webbsidor

så att de blir maskinläsbara

Page 38: Effektiv länkad data
Page 39: Effektiv länkad data
Page 40: Effektiv länkad data
Page 41: Effektiv länkad data

<div vocab="http://schema.org/" typeof="BookStore"> <h1 property="name">Ryös antikvariat</h1> <div property="address" typeof="PostalAddress"> <span property="streetAddress">Hantverkargatan 21</span> <span property="addressLocality">Stockholm</span> </div> <p property="description">Innanför ytterdörren möts besökaren av ett rum fyllt med bågnande hyllor med konst- och fotoböcker.</p> <p>Öppet: <span property="openingHours" content="Mo-Fr 11:00-18:00">vardagar 11-18</span></p></div>

Page 42: Effektiv länkad data

@prefix : <http://schema.org/> .

[] a :BookStore; :address [ a :PostalAddress; :addressLocality "Stockholm"; :streetAddress "Hantverkargatan 21" ]; :description """Innanför ytterdörren möts besökaren av ett rum fyllt med bågnande hyllor med konst- och fotoböcker."""; :name "Ryös antikvariat"; :openingHours "Mo-Fr 11:00-18:00" .

Page 44: Effektiv länkad data

RDFa är en genväg till länkad data

● Ta vanliga webbsidor● Ringa in domändata i dessa● Låt söktjänster indexera denna data

Page 45: Effektiv länkad data

.. men det finns fler vägar..

Page 46: Effektiv länkad data

Webbens arkitektur

Page 47: Effektiv länkad data

Identifikation: URI:er

Åtkomst: HTTP

Representation: öppna format, länkad hypertext

Komposition: länka alla slags resurser

Page 48: Effektiv länkad data

2009

<http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html>

Page 49: Effektiv länkad data

Principer

Använd URIer för att identifiera saker

Använd HTTP-URIer så att de kan hänvisas till och slås upp på webben

Page 50: Effektiv länkad data

Skicka användbar information när URIn slås upp

Inkludera länkar till andra URIer för att stödja upptäckbarhet av relaterad information

Page 51: Effektiv länkad data

Användbar information

Page 52: Effektiv länkad data

★ make your stuff available on the web (whatever format)★★ make it available as structured data (e.g. excel)★★★ use non-proprietary formats (e.g. CSV)★★★★ use URLs to identify things (e.g. an RDF format)★★★★★ link your data to other data to provide context

Page 53: Effektiv länkad data

Format

● RDFa● RDF/XML● Turtle● JSON-LD

Page 54: Effektiv länkad data

The LOD Cloud

Page 55: Effektiv länkad data

2008

Page 56: Effektiv länkad data

2011

Page 57: Effektiv länkad data
Page 58: Effektiv länkad data

DBPedia

2007 – milstolpe för länkad data

● University of Leipzig● Freie Universität Berlin● OpenLink Software

Page 59: Effektiv länkad data

Wikipedia

Page 60: Effektiv länkad data

Use DBPedia to

.. query relationships and properties

associated with Wikipedia resources,

including links to other related datasets

Page 61: Effektiv länkad data

SPARQL

SPARQL Protocol andRDF Query Language

Page 62: Effektiv länkad data

Endpoint

http://dbpedia.org/sparql

Page 63: Effektiv länkad data

Födda i Stockholm före år 1900

prefix foaf: <http://xmlns.com/foaf/0.1/>prefix dbo: <http://dbpedia.org/ontology/>prefix : <http://dbpedia.org/resource/>

select ?person ?name ?birth { ?person foaf:name ?name; dbo:birthPlace :Stockholm; dbo:birthDate ?birth . filter (?birth < "1900-01-01"^^xsd:date) .}order by ?name

Page 64: Effektiv länkad data

Lista svenska kommuner

select * { ?kommun a yago:MunicipalitiesOfSweden; foaf:name ?name; geo:lat ?lat; geo:long ?long .}

Page 65: Effektiv länkad data

201 gifta forskare

select (count(?person) as ?count){ ?person a foaf:Person, dbpedia-owl:Scientist; dbpprop:spouse ?spouse .}

Page 66: Effektiv länkad data

11013 ogifta

select (count(?person) as ?count){ ?person a foaf:Person, dbpedia-owl:Scientist . minus { ?person dbpprop:spouse ?spouse . }}

Page 67: Effektiv länkad data

Google

Page 68: Effektiv länkad data

Origins: Freebase

● by Metaweb● Contains data from various sources (e.g.

Wikipedia)● RDF is a key component● Uppköpta av Google July 16, 2010

Page 69: Effektiv länkad data
Page 70: Effektiv länkad data
Page 71: Effektiv länkad data
Page 72: Effektiv länkad data
Page 73: Effektiv länkad data
Page 74: Effektiv länkad data
Page 75: Effektiv länkad data

"The Google Knowledge Graph is essentially Freebase++... this is

all good Semantic Web stuff"

– Alon Halevy, Google

Page 76: Effektiv länkad data

Vokabulär

Page 77: Effektiv länkad data

Använd befintliga

FOAF — Friend of a Friend

SIOC — Semantically Interlinked Online Communities

SKOS — Simple Knowledge Organization System

GoodRelations

rNews (IPTC)

Schema.org

W3C Geo, MusicOnt, ProgrammesOnt, DOAP, uniProt, OGP, ...

Page 78: Effektiv länkad data
Page 79: Effektiv länkad data
Page 80: Effektiv länkad data

Egna vokabulär?

RDFS — RDF SchemaOWL — Web Ontology Language

Page 81: Effektiv länkad data

Görs också som länkad data!

Termer kan länkas samman (samma betydelse, specialiseringar)

Page 82: Effektiv länkad data

Arbeta konkret med användning

Kontinuerlig utvärdering av sök-/hittbarhet

Stöd för redaktörer och förvaltning!

Minska gapet mellan producent och konsument!

Page 83: Effektiv länkad data

HTTP-URIer som namn på ting

Page 84: Effektiv länkad data
Page 85: Effektiv länkad data

Publicera vistitkort för saker

Beskrivingar i dokument

På webben

Page 86: Effektiv länkad data

Jag

@prefix : <http://xmlns.com/foaf/0.1/> .

<http://neverspace.net/id> a :PersonalProfileDocument; :primaryTopic <http://neverspace.net/id#self> .

<http://neverspace.net/id#self> a :Person; :name "Niklas Lindström"; :homepage <http://neverspace.net/>; :workplaceHomepage <http://www.valtech.se/> .

Page 87: Effektiv länkad data

<http://neverspace.net/id#self> foaf:interest cat:Metafictional_works .

# ...

<http://dbpedia.org/resource/Gödel,_Escher,_Bach> a :Book; dc:subject cat:Metafictional_works .

# ...

<http://www.ryo.se/butik> a :BookStore; :name "Ryös antikvariat"; :makesOffer [ :about <http://dbpedia.org/resource/Gödel,_Escher,_Bach>; :price "29:90"; :priceCurrency "SEK" ]; :address [ :streetAddress "Hantverkargatan 21"; :addressLocality "Stockholm" ] .

Page 88: Effektiv länkad data

Triple Stores

Page 89: Effektiv länkad data

Grafdatabaser

Lagra massiva mängder triples

Quad Stores (union av dokument med grafer)

API: REST + SPARQL

Page 90: Effektiv länkad data

Fuseki, Sesame, 4Store,

Virtuoso, AllegroGraph, Stardog, Neo4J,

Oracle 11G, IBM DB2, Microsoft Trinity...

Page 91: Effektiv länkad data

Federerad SPARQL

Libris + DBPedia + Bibsys.no

Page 92: Effektiv länkad data

PREFIX owl: <http://www.w3.org/2002/07/owl#>PREFIX foaf: <http://xmlns.com/foaf/0.1/>PREFIX dbpedia: <http://dbpedia.org/ontology/>BASE <http://libris.kb.se/resource/>

construct{ <auth/94541> ?p ?o; dbpedia:abstract ?abstract; foaf:depiction ?depiction; owl:sameAs ?bibsysno .} where{{ <auth/94541> ?p ?o . } UNION{ <auth/94541> owl:sameAs ?uri . { SERVICE <http://dbpedia.org/sparql>{ ?uri dbpedia:abstract ?abstract . FILTER(langMatches(lang(?abstract), "en")) ?uri foaf:depiction ?depiction . } } UNION{ SERVICE <http://data.bibsys.no/data/authority>{ ?bibsysno owl:sameAs ?uri . } } }}

Page 93: Effektiv länkad data

Grunden för Länkad Data

Flera datakällor, uttryckta i RDF,sammanlänkade på webben

Page 94: Effektiv länkad data

Webben blir en

GigantiskGlobalGraf

Page 95: Effektiv länkad data

Öppna upp era silon

Gå med i konversationen

Page 96: Effektiv länkad data

Bör det finnas länkad offentlig basdata?

Om svenska kommuner..

Om högskolor/universitet..

.. annat än i DBPedia?

Page 97: Effektiv länkad data

EUPSI-direktivet

E-delegationenNy vägledning för vidareutnyttjande av offentlig information

Page 98: Effektiv länkad data

Vad motiverade att publicera HTML under 90-talet?

Dela data som dokument

För att andra gjorde det

Sedan kom: marknadsföring, annonsering, SEO...

Page 99: Effektiv länkad data

Vad motiverar att publicera länkad data?

Dela data som data

För att andra gör det

Marknadsföring, annonsering, SEO...

Page 100: Effektiv länkad data

Läget idag

Webbsidor med OGP, schema.org..

BBC, data.gov.uk, Library of Congress, KB Libris..

NY Times, AstraZeneca, Boeing, IBM (Watson)...

.. och resten i LOD-molnet

Page 101: Effektiv länkad data

Publicera användbar data

Tydliga egenskaper (gemensamma: RDF)

Många länkar - även till externa resurser

Upptäck inkommande länkar

Page 102: Effektiv länkad data

Sträva efter..

Meningsfull och sammanhängande data på

webben!

Page 103: Effektiv länkad data

Om världen!

Page 104: Effektiv länkad data

Några länkar..

<http://www.w3.org/standards/semanticweb/>

<http://linkeddata.org/>

<http://rdfa.info/>

...

Page 105: Effektiv länkad data

Bildkälloreick arctranLänkad data - förenklat exempelScreenshots from the Google Knowledge Graph intro videoSome icons from OpenClipArt.org"Silos""Walled Gardens" by David Simonds via ISSLOD-DSSN and Design Issues: Socially Aware Cloud Storage (Tim Berners-Lee)"This is Not a Pipe"The LOD CloudLOD Cloud statsW3C LogosHighlighter pen by Guido "random" AlvarezPresentation vs. Semantics (Ivan Herman, RDF 1.1 Primer)Google Rich Snippets imageYahoo SearchMonkey cc-imageYahoo SearchMonkey product-imageLinked Open VocabulariesÌBM WatsonInternet Map"Yet another view from the ArtScience Museum" by William Cho