länkad data

43
Länkad data Länkad data i Sverige, 17 april, 2012 Marie Gustafsson Friberger, Malmö högskola [email protected] twitter: mariegus

Upload: marie-gustafsson-friberger

Post on 22-Apr-2015

920 views

Category:

Technology


1 download

DESCRIPTION

Min introduktion till länkad data från träffen om länkad data i Sverige: http://ldsv.eventbrite.com/

TRANSCRIPT

Page 1: Länkad data

Länkad dataLänkad data i Sverige, 17 april, 2012

Marie Gustafsson Friberger, Malmö högskola [email protected]

twitter: mariegus

Page 2: Länkad data

Översikt

• Länkade data och den semantiska webben

• En kort introduktion till SW-relaterad W3C rekommendationer

• Några exempel

• Vill du tillgängliggöra data och/eller vokabulär?

• Vill du hitta data?

• Vill du bygga?

2

Page 3: Länkad data

Hans Rosling

http://www.flickr.com/photos/23176450@N08/2663925153/

Page 4: Länkad data

Hans Rosling

http://www.flickr.com/photos/23176450@N08/2663925153/

"The database hugging in public institutions is hampering innovation."

Hans Rosling at OECD World Forum in Istanbul, 2007http://www.viddler.com/explore/JesseRobbins/videos/4/

Page 5: Länkad data
Page 6: Länkad data

6

Page 7: Länkad data

• Hur tillhandahålla data så att den går att återanvända?

• Hur möjliggöra upptäckandet av relevanta data bland alla dataset som finns tillgängliga?

• Hur möjliggöra att applikationer kan integrera data från tidigare okända datakällor?

7

Page 8: Länkad data

★ Tillgänglig på webben (oavsett format),

med en öppen licens

★★ Tillgänglig som maskinläsbar strukturerad

data (t ex Excel i stället för scannad tabell)

★★★ som (2) samt ickeproprietärt format

(t ex CSV i stället för Excel)

★★★★ Alla ovan, plus att använda W3C-standarder (RDF

och SPARQL) för beskriva saker

★★★★★ Alla ovan plus att länka din data till andras data

Page 9: Länkad data

Principer för länkade data1. Använd URI:er för att namnge saker

2. Använd HTTP URI:er så att dessa namn kan användas för att få mer information

3. När någon kollar en URI, ge användbar information genom standarder (RDF*, SPARQL)

4. Inkludera länkar till andra URI:er så att fler saker kan upptäckas

http://www.w3.org/DesignIssues/LinkedData.html

Page 10: Länkad data

10

Page 11: Länkad data

Linked data

11Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

Page 12: Länkad data

Semantiska webben

• Data-webb (snarare än dokument-webb).

• Idag kontrollerar applikationer ofta sin egen data och delar inte med sig av den.

• Visionen med den semantiska webben är att göra det möjligt att kombinera data från flera olika källor.

12

Page 13: Länkad data

define the concepts and relationships used to describe and represent an area of concern

13

Main SW components

RDF Linked Data

OWL

SKOSVocabularies

Ontologies

common formats for integration and combination of data drawn from diverse sources

SPARQL

Page 14: Länkad data

En kort introduktion till W3C-rekommendationer

relaterade till den semantiska webben

Page 15: Länkad data

Resource Description Framework

Page 16: Länkad data

“Description”?

Subject - Predicate - Object

Page 17: Länkad data

Subject - Predicate - Object

Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.

Page 18: Länkad data

Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.

Page 19: Länkad data

Flera källor

+

+Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.

Page 20: Länkad data

En graf...

Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.

Page 21: Länkad data

Vad är vad?

• Om två källor använder samma benämningar, avser de då samma ”sak”?

• URI:er to the rescue!

• Två noder avser samma sak om de använder samma URI.

Page 22: Länkad data

SPARQL

• SPARQL Protocol and RDF Query Language

• En fråga består av en uppsättning trippel-mönster (tripple patterns).

• Trippel-mönster är som RDF-tripplar förutom att varje subjekt, predikat och objekt kan vara en variabel.

Page 23: Länkad data

Ontologier – OWL

• Kallas ofta vokabulärer i samband med länkade data

• Används för att beskriva begrepp och relationer mellan begrepp I någon domän

• Kan innehålla allt från en enkel vokabulär till komplexa logiska uttryck för att dra slutsatser baserat på data

23

Page 24: Länkad data

Simple Knowledge Organization System (SKOS)

• RDF vokabulär för att representera semiformella knowledge organization systems (KOSs), exempelvis thesauri o taxonomier.

24

ex:animals rdf:type skos:Concept; skos:prefLabel "animals"@en; skos:narrower ex:mammals.

ex:birds rdf:type skos:Concept; skos:prefLabel "birds"@en; skos:related ex:ornithology.

Page 25: Länkad data

25

Exempel

DBpediaNYTimes

Page 26: Länkad data

• Extraherar strukturerad information från Wikipedia och tillgängliggör den via webben.

• Beskriver över 3,4 miljoner saker, varav 1,5 miljoner är klassificerad i en konsistent ontologi som innehåller 312.000 personer, 413.000 platser, 94.000 musik album, 49.000 filmer, 15.000 videospel, 140.000 organisationer, 146.000 arter och 4.600 sjukdomar.

Page 27: Länkad data

Möjliga frågor

• DBPedia gör det möjligt att ställa frågor där informationen som behövs för att svara finns spridd över flera olika Wikipedia-artiklar.

• Till exempel...

Page 28: Länkad data

28

Personer födda i Köpenhamn innan år 1900.

Page 29: Länkad data

29

Page 30: Länkad data

30

Page 31: Länkad data

NYTimes – Linked Open Data

http://data.nytimes.com/

Page 32: Länkad data

32

Page 33: Länkad data

Example app: Who Went Where?

Page 34: Länkad data

Vill du göra data och/eller vokabulär

tillgängliga?

Page 35: Länkad data

Välja vokabulär

• Hur många använder? Vilka?

• Underhåll och styrning

• Vilka koncept täcker den?

• Hur uttrycksfull är den?

35

Baserat på http://linkeddatabook.com/

Page 36: Länkad data

Verktyg för att utveckla vokabulär

• Protégé

• TopBraid Composer

• NeOn Toolkit

36

Specifikt för SKOS:

• PoolParty Thesaurus Manager

• VocBench (developed by the FAO of the UN)

Page 37: Länkad data

Recept för att publicera länkade data

• Statiska RDF/XML-filer

• Som RDF inbäddad i HTML (RDFa)

• Genom egna server-side scripts

• Från relationsdatabaser

• Från RDF Triple Stores

• Genom att ”wrappa” existerande API:er

37 http://linkeddatabook.com/

Page 38: Länkad data

Vill du hitta data?

Page 39: Länkad data

39

Page 40: Länkad data

40

Page 41: Länkad data

Vill du bygga?

Page 42: Länkad data

42

Page 43: Länkad data

Läs mer!

• Heath and Bizer (2011) Linked Data: Evolving the Web into a Global Data Spacehttp://linkeddatabook.com/editions/1.0/

• Allemang and Hendler (2011) Semantic Web for the Working Ontologisthttp://workingontologist.org/

• http://www.w3.org/2001/sw/wiki/Tools