skos w p guŁce

43

Upload: trinhthuan

Post on 11-Jan-2017

233 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: SKOS W P GUŁCE
Page 2: SKOS W P GUŁCE

PLAN WYSTĄPIENIA

• Wprowadzenie• Semantic Web w 5 minut,• Linked Data.

• Czym jest SKOS?• Dlaczego SKOS?• SKOS w praktyce.• Krytyka SKOS.• Wnioski.

Page 3: SKOS W P GUŁCE

SEMANTIC WEB W 5 MINUT

Tim Berners-Lee (2007)Sukces World Wide Web:

• nieograniczone możliwości łączenia informacji (np. hiperłącza),

• otwarte standardy,• rozdzielenie warstw sieci (komunikacja,

wizualizacja, przetwarzanie).

Page 4: SKOS W P GUŁCE

• dzisiejsza sieć to sieć dokumentów (statyczne, dynamiczne),

• dane w dokumentach zrozumiałe tylko dla ludzi,

• aplikacje sieciowe nie są w stanie przetworzyć danych.

SEMANTIC WEB W 5 MINUT

Page 5: SKOS W P GUŁCE

SEMANTIC WEB W 5 MINUT

Page 6: SKOS W P GUŁCE

• utrzymanie postulatu AAA (Anyone can say Anything about Any topic),

• rozpowszechnienie standardów opisywania treści,

• „zrozumienie” danych przez aplikacje,• możliwość powiązania danych.

SEMANTIC WEB W 5 MINUT

Page 7: SKOS W P GUŁCE

Podstawowe standardy/specyfikacje:

• RDF (Resource Description Framework) - specyfikacja modelu metadanych,

• RDF Schema (RDFS) - język reprezentacji wiedzy,

• OWL (Web Ontology Language) – język modelowania ontologii internetowych, rozszerzenie RDFS.

SEMANTIC WEB W 5 MINUT

Page 8: SKOS W P GUŁCE

Cel• standaryzowany i spójny model danych,• zmiana perspektywy - dane,• dane powiązane (Linked Data).

SEMANTIC WEB W 5 MINUT

Page 9: SKOS W P GUŁCE

• nie model danych, lecz filozofia, • metoda ekspresji, reprezentacji, łączenia

i współdzielenia danych,• Tim Berners-Lee: data hugging,• narzędzia:

– identyfikator URI,– protokół http,– RDF oraz RDFS/OWL.

LINKED DATA

Page 10: SKOS W P GUŁCE

Cztery zasady Linked Data:1. Używaj URI jako nazwy dla obiektów.2. Stosuj protokół http, po to by uzyskać

informacje o tych obiektach.3. Aktywacja poszczególnego URI ma

spowodować pozyskanie użytecznych informacji.

4. Wykorzystuj powiązania z innymi obiektami za pomocą URI, aby zapewnić możliwość eksploracji i odkrywania innych obiektów.

LINKED DATA

Page 11: SKOS W P GUŁCE

• FOAF (Friend Of A Friend),• format reprezentacji danych personalnych,• internetowa tożsamość, • wizytówka sieciowa,• rozszerzenie RDF.

LINKED DATA

Page 12: SKOS W P GUŁCE

FOAF

Page 13: SKOS W P GUŁCE

<rdf:RDF      xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"      xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"      xmlns:foaf="http://xmlns.com/foaf/0.1/"      xmlns:admin="http://webns.net/mvcb/">

</foaf:PersonalProfileDocument><foaf:Person rdf:ID="me"><foaf:name>Marcin Roszkowski</foaf:name><foaf:givenname>Marcin</foaf:givenname><foaf:family_name>Roszkowski</foaf:family_name><foaf:mbox_sha1sum>e59bff904001aa669cc84a983fcbf6e4b97e2299</foaf:mbox_sha1sum><foaf:homepage rdf:resource="http://biblioteka.unipt.pl"/><foaf:based_near rdf:resource="http://sws.geonames.org/3088972/" rdfs:label="Piotrków Trybunalski"/><foaf:depiction rdf:resource="http://4.bp.blogspot.com/_4XgyLS9g-Xg/roszkowski.jpg"/><foaf:workplaceHomepage rdf:resource="http://mroszkowski.blogspot.com"/><foaf:schoolHomepage rdf:resource="Uniwersytet Jana Kochanowskiego. Filia w Piotrkowie Trybunalskim"/></foaf:Person></rdf:RDF>

FOAF

Page 14: SKOS W P GUŁCE
Page 15: SKOS W P GUŁCE

FOAF + GEONAMES

Page 16: SKOS W P GUŁCE

LINKED DATA

Page 17: SKOS W P GUŁCE

Formaty danych / zbiory danych:• FOAF (Friend Of A Friend),• SIOC (Semantically-Interlinked Online Communities)

Project – format danych do opisu społeczności, jej członków, zainteresowań

• DOAP (Description of a Project) - format danych do opisu projektów open source, jego twórców, przebiegu, efektów,

• Kartoteki wzorcowe VIAF (The Virtual International Authority File),

• DBpedia – ustrukturyzowane dane pochodzące z Wikipedii.

• SKOS (Simple Knowledge Organisation System).

LINKED DATA

Page 18: SKOS W P GUŁCE

Czym jest SKOS?• format danych dla systemów

porządkowania pojęć (systemy organizacji wiedzy),

• formalny język reprezentacji struktury SOW,

• rozszerzenie RDF,• rekomendacja World Wide Web

Consortium - W3C (sierpień 2009 r.)

CZYM JEST SKOS?

Page 19: SKOS W P GUŁCE

Systemy organizacji wiedzy (SOW):• systemy porządkowania pojęć,• tradycyjne języki informacyjno-

-wyszukiwawcze,• sieciowe systemy organizacji wiedzy:

– taksonomie internetowe,– ontologie.

CZYM JEST SKOS?

Page 20: SKOS W P GUŁCE

OPIS W SKOS

• opis pojęcia z wykorzystaniem składni RDF,

• Trójki RDF (RDF triples) : – podmiot – predykat – obiekt,– pojęcie – predykat – wartość.

• Przywołanie pojęcia za pomocą indywidualnego URI w opisywanym zbiorze.

Page 21: SKOS W P GUŁCE

OPIS W SKOS

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:skos="http://www.w3.org/2004/02/skos/core#"> <skos:Concept rdf:about="http://www.ukat.org.uk/thesaurus/concept/1750"> <skos:prefLabel>Economic cooperation</skos:prefLabel> </skos:Concept> </rdf:RDF>

Page 22: SKOS W P GUŁCE

Standaryzowany zbiór klas i własności, któresłużą do: • identyfikacji pojęcia: skos:Concept za

pomocą jego URI– http://bn.org.pl/jhp/concept/1750

(pojęcie językoznawstwa)• identyfikacji SOW: skos:ConceptScheme

– np. JHP BN

CECHY SKOS

Page 23: SKOS W P GUŁCE

• ustalenia nazw dla pojęcia i określenie ich statusu:

– skos:prefLabel (w różnych językach etnicznych) Językoznawstwo @pl,

– skos:prefLabel Linguistics @en,– skos:altLabel Lingwistyka,– skos:hiddenLabel Językonzawstwo,

CECHY SKOS

Page 24: SKOS W P GUŁCE

• dodatkowych informacji o znaczeniu pojęcia i jego zmianach:– skos:note,– skos:scopeNote,– skos:definition, – skos:editorialNote,

CECHY SKOS

Page 25: SKOS W P GUŁCE

• ustalenia relacji znaczeniowych pomiędzy pojęciami:– relacja nadrzędności zakresowej

skos:broader, – relacja podrzędności zakresowej

skos:narrower, – relacja skojarzeniowa

skos:related,

CECHY SKOS

Page 26: SKOS W P GUŁCE

JHP W SKOS

Page 27: SKOS W P GUŁCE

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:skos="http://www.w3.org/2004/02/skos/core#">  <skos:Concept rdf:about="http://bn.org.pl/jhp/concept/1750"> <skos:prefLabel>Językoznawstwo</skos:prefLabel> <skos:altLabel>Lingwistyka</skos:altLabel> <skos:hiddenLabel>Językoznwastwo</skos:hiddenLabel><skos:broader rdf:resource="http://bn.org.pl/jhp/concept/4382"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/2108"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/9505"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/15053"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/18987"/> <skos:related rdf:resource="http://bn.org.pl/jhp/concept/3250"/> <skos:inScheme rdf:resource="http://bn.org.pl/jhp"/> </skos:Concept>  </rdf:RDF>

JHP W SKOS

Page 28: SKOS W P GUŁCE

JHP W SKOS

Page 29: SKOS W P GUŁCE

Siła ekspresji SKOS pozwala również na uwzględnienie:

• sztucznego systemu notacyjnego, np. dla klasyfikacji: <skos:notation>81</skos:notation>,

• odwzorowanie fasetowej struktury pola semantycznego: <skos:collection>Procesy</skos:collection>

• odwzorowanie zależności pomiędzy pojęciami z różnych SOW (mapowanie), wykładniki typów zgodności zakresowej: skos:exactMatch, skos:closeMatch.

EKSPRESJA SKOS

Page 30: SKOS W P GUŁCE

ELASTYCZNOŚĆ SKOS

Page 31: SKOS W P GUŁCE

• UK Archival Thesaurus (UKAT),• The General Multilingual Environmental Thesaurus

(GEMET),• Australian Public Affairs Information Service (APAIS)

Thesaurus,• Tezaurus AGROVOC,• Library of Congress Subject Headings (LCSH)• Medical Subject Headings (MeSH),• GeoNames, kartoteka wzorcowa nazw geograficznych,• UNESCO Thesaurus,• ISO639 Codes for the representation of names of

languages.

SOW W SKOS

Page 32: SKOS W P GUŁCE

SOW W SKOS

Page 33: SKOS W P GUŁCE

DLACZEGO SKOS?

• wspólny model danych dla opisu SOW,• opis SOW musi być zrozumiały dla

aplikacji,• SOW muszą być współdzielone,• SOW jako platforma wspólnego

odniesienia.

Page 34: SKOS W P GUŁCE

JAK TO DZIAŁA?

BAZA1 BAZA2

JIW SOW1 SOW2

OPAC

Rezultatywyszukiwania

Rezultatywyszukiwania

Rezultatywyszukiwania

Page 35: SKOS W P GUŁCE

API

JAK TO DZIAŁA?

Page 36: SKOS W P GUŁCE

http://www.flickr.com/photos/dullhunk/639163558/sizes/l/

Page 37: SKOS W P GUŁCE

JAK TO DZIAŁA?

Page 38: SKOS W P GUŁCE

• format danych vs. mechanizmy ich przetwarzania,

• wymiar technologiczny:– aplikacje eksplorujące i przetwarzające linked

data, języki zapytań (np. SPARQL),– mechanizmy wizualizacji RAW DATA,

KRYTYKA SKOS

Page 39: SKOS W P GUŁCE

• wymiar technologiczny:– narzędzia opisu SOW w SKOS (np. Protege,

Tematres)• problemy:

– reprezentacja niesamodzielnych jednostek leksykalnych (symbole pomocnicze, określniki),

– reprezentacja zdań JIW.

KRYTYKA SKOS

Page 40: SKOS W P GUŁCE

• formalizacja umożliwia automatyczne przetwarzanie,

• bariery: odległość, język, granice dyscyplinarne,

• SKOS < Linked Data,• projekt nadal rozwijany,• ocena bibliotekarzy?

PODSUMOWANIE

Page 41: SKOS W P GUŁCE

• SKOS = format danych dla SOW,• potrzeba współdzielonych zbiorów danych,• co z „naszymi” formatami?

PODSUMOWANIE

Page 42: SKOS W P GUŁCE

PODSUMOWANIE

Page 43: SKOS W P GUŁCE