skos w p guŁce

Post on 11-Jan-2017

233 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

PLAN WYSTĄPIENIA

• Wprowadzenie• Semantic Web w 5 minut,• Linked Data.

• Czym jest SKOS?• Dlaczego SKOS?• SKOS w praktyce.• Krytyka SKOS.• Wnioski.

SEMANTIC WEB W 5 MINUT

Tim Berners-Lee (2007)Sukces World Wide Web:

• nieograniczone możliwości łączenia informacji (np. hiperłącza),

• otwarte standardy,• rozdzielenie warstw sieci (komunikacja,

wizualizacja, przetwarzanie).

• dzisiejsza sieć to sieć dokumentów (statyczne, dynamiczne),

• dane w dokumentach zrozumiałe tylko dla ludzi,

• aplikacje sieciowe nie są w stanie przetworzyć danych.

SEMANTIC WEB W 5 MINUT

SEMANTIC WEB W 5 MINUT

• utrzymanie postulatu AAA (Anyone can say Anything about Any topic),

• rozpowszechnienie standardów opisywania treści,

• „zrozumienie” danych przez aplikacje,• możliwość powiązania danych.

SEMANTIC WEB W 5 MINUT

Podstawowe standardy/specyfikacje:

• RDF (Resource Description Framework) - specyfikacja modelu metadanych,

• RDF Schema (RDFS) - język reprezentacji wiedzy,

• OWL (Web Ontology Language) – język modelowania ontologii internetowych, rozszerzenie RDFS.

SEMANTIC WEB W 5 MINUT

Cel• standaryzowany i spójny model danych,• zmiana perspektywy - dane,• dane powiązane (Linked Data).

SEMANTIC WEB W 5 MINUT

• nie model danych, lecz filozofia, • metoda ekspresji, reprezentacji, łączenia

i współdzielenia danych,• Tim Berners-Lee: data hugging,• narzędzia:

– identyfikator URI,– protokół http,– RDF oraz RDFS/OWL.

LINKED DATA

Cztery zasady Linked Data:1. Używaj URI jako nazwy dla obiektów.2. Stosuj protokół http, po to by uzyskać

informacje o tych obiektach.3. Aktywacja poszczególnego URI ma

spowodować pozyskanie użytecznych informacji.

4. Wykorzystuj powiązania z innymi obiektami za pomocą URI, aby zapewnić możliwość eksploracji i odkrywania innych obiektów.

LINKED DATA

• FOAF (Friend Of A Friend),• format reprezentacji danych personalnych,• internetowa tożsamość, • wizytówka sieciowa,• rozszerzenie RDF.

LINKED DATA

FOAF

<rdf:RDF      xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"      xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"      xmlns:foaf="http://xmlns.com/foaf/0.1/"      xmlns:admin="http://webns.net/mvcb/">

</foaf:PersonalProfileDocument><foaf:Person rdf:ID="me"><foaf:name>Marcin Roszkowski</foaf:name><foaf:givenname>Marcin</foaf:givenname><foaf:family_name>Roszkowski</foaf:family_name><foaf:mbox_sha1sum>e59bff904001aa669cc84a983fcbf6e4b97e2299</foaf:mbox_sha1sum><foaf:homepage rdf:resource="http://biblioteka.unipt.pl"/><foaf:based_near rdf:resource="http://sws.geonames.org/3088972/" rdfs:label="Piotrków Trybunalski"/><foaf:depiction rdf:resource="http://4.bp.blogspot.com/_4XgyLS9g-Xg/roszkowski.jpg"/><foaf:workplaceHomepage rdf:resource="http://mroszkowski.blogspot.com"/><foaf:schoolHomepage rdf:resource="Uniwersytet Jana Kochanowskiego. Filia w Piotrkowie Trybunalskim"/></foaf:Person></rdf:RDF>

FOAF

FOAF + GEONAMES

LINKED DATA

Formaty danych / zbiory danych:• FOAF (Friend Of A Friend),• SIOC (Semantically-Interlinked Online Communities)

Project – format danych do opisu społeczności, jej członków, zainteresowań

• DOAP (Description of a Project) - format danych do opisu projektów open source, jego twórców, przebiegu, efektów,

• Kartoteki wzorcowe VIAF (The Virtual International Authority File),

• DBpedia – ustrukturyzowane dane pochodzące z Wikipedii.

• SKOS (Simple Knowledge Organisation System).

LINKED DATA

Czym jest SKOS?• format danych dla systemów

porządkowania pojęć (systemy organizacji wiedzy),

• formalny język reprezentacji struktury SOW,

• rozszerzenie RDF,• rekomendacja World Wide Web

Consortium - W3C (sierpień 2009 r.)

CZYM JEST SKOS?

Systemy organizacji wiedzy (SOW):• systemy porządkowania pojęć,• tradycyjne języki informacyjno-

-wyszukiwawcze,• sieciowe systemy organizacji wiedzy:

– taksonomie internetowe,– ontologie.

CZYM JEST SKOS?

OPIS W SKOS

• opis pojęcia z wykorzystaniem składni RDF,

• Trójki RDF (RDF triples) : – podmiot – predykat – obiekt,– pojęcie – predykat – wartość.

• Przywołanie pojęcia za pomocą indywidualnego URI w opisywanym zbiorze.

OPIS W SKOS

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:skos="http://www.w3.org/2004/02/skos/core#"> <skos:Concept rdf:about="http://www.ukat.org.uk/thesaurus/concept/1750"> <skos:prefLabel>Economic cooperation</skos:prefLabel> </skos:Concept> </rdf:RDF>

Standaryzowany zbiór klas i własności, któresłużą do: • identyfikacji pojęcia: skos:Concept za

pomocą jego URI– http://bn.org.pl/jhp/concept/1750

(pojęcie językoznawstwa)• identyfikacji SOW: skos:ConceptScheme

– np. JHP BN

CECHY SKOS

• ustalenia nazw dla pojęcia i określenie ich statusu:

– skos:prefLabel (w różnych językach etnicznych) Językoznawstwo @pl,

– skos:prefLabel Linguistics @en,– skos:altLabel Lingwistyka,– skos:hiddenLabel Językonzawstwo,

CECHY SKOS

• dodatkowych informacji o znaczeniu pojęcia i jego zmianach:– skos:note,– skos:scopeNote,– skos:definition, – skos:editorialNote,

CECHY SKOS

• ustalenia relacji znaczeniowych pomiędzy pojęciami:– relacja nadrzędności zakresowej

skos:broader, – relacja podrzędności zakresowej

skos:narrower, – relacja skojarzeniowa

skos:related,

CECHY SKOS

JHP W SKOS

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:skos="http://www.w3.org/2004/02/skos/core#">  <skos:Concept rdf:about="http://bn.org.pl/jhp/concept/1750"> <skos:prefLabel>Językoznawstwo</skos:prefLabel> <skos:altLabel>Lingwistyka</skos:altLabel> <skos:hiddenLabel>Językoznwastwo</skos:hiddenLabel><skos:broader rdf:resource="http://bn.org.pl/jhp/concept/4382"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/2108"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/9505"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/15053"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/18987"/> <skos:related rdf:resource="http://bn.org.pl/jhp/concept/3250"/> <skos:inScheme rdf:resource="http://bn.org.pl/jhp"/> </skos:Concept>  </rdf:RDF>

JHP W SKOS

JHP W SKOS

Siła ekspresji SKOS pozwala również na uwzględnienie:

• sztucznego systemu notacyjnego, np. dla klasyfikacji: <skos:notation>81</skos:notation>,

• odwzorowanie fasetowej struktury pola semantycznego: <skos:collection>Procesy</skos:collection>

• odwzorowanie zależności pomiędzy pojęciami z różnych SOW (mapowanie), wykładniki typów zgodności zakresowej: skos:exactMatch, skos:closeMatch.

EKSPRESJA SKOS

ELASTYCZNOŚĆ SKOS

• UK Archival Thesaurus (UKAT),• The General Multilingual Environmental Thesaurus

(GEMET),• Australian Public Affairs Information Service (APAIS)

Thesaurus,• Tezaurus AGROVOC,• Library of Congress Subject Headings (LCSH)• Medical Subject Headings (MeSH),• GeoNames, kartoteka wzorcowa nazw geograficznych,• UNESCO Thesaurus,• ISO639 Codes for the representation of names of

languages.

SOW W SKOS

SOW W SKOS

DLACZEGO SKOS?

• wspólny model danych dla opisu SOW,• opis SOW musi być zrozumiały dla

aplikacji,• SOW muszą być współdzielone,• SOW jako platforma wspólnego

odniesienia.

JAK TO DZIAŁA?

BAZA1 BAZA2

JIW SOW1 SOW2

OPAC

Rezultatywyszukiwania

Rezultatywyszukiwania

Rezultatywyszukiwania

API

JAK TO DZIAŁA?

http://www.flickr.com/photos/dullhunk/639163558/sizes/l/

JAK TO DZIAŁA?

• format danych vs. mechanizmy ich przetwarzania,

• wymiar technologiczny:– aplikacje eksplorujące i przetwarzające linked

data, języki zapytań (np. SPARQL),– mechanizmy wizualizacji RAW DATA,

KRYTYKA SKOS

• wymiar technologiczny:– narzędzia opisu SOW w SKOS (np. Protege,

Tematres)• problemy:

– reprezentacja niesamodzielnych jednostek leksykalnych (symbole pomocnicze, określniki),

– reprezentacja zdań JIW.

KRYTYKA SKOS

• formalizacja umożliwia automatyczne przetwarzanie,

• bariery: odległość, język, granice dyscyplinarne,

• SKOS < Linked Data,• projekt nadal rozwijany,• ocena bibliotekarzy?

PODSUMOWANIE

• SKOS = format danych dla SOW,• potrzeba współdzielonych zbiorów danych,• co z „naszymi” formatami?

PODSUMOWANIE

PODSUMOWANIE

top related