skos, nuovo soggettario e wikidata

Post on 29-Jun-2015

159 Views

Category:

Technology

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

SKOS, Nuovo Soggettario e Wikidata appunti per l'evoluzione dei sistemi di gestione

dell'informazione bibliografica

Giovanni Bergamin, Biblioteca Nazionale Centrale Firenze

Parlerò di

● il punto di partenza:o collegamenti NS - Wikipedia, 2006 -o pubblicazione del NS in SKOS e in Zthes, 2010 -

● cosa sta cambiando con Wikidata, 2012 -● intanto ... schema.org, 2011-

Parlerò di (2)

● qualche appunto di viaggioo equilibrio (non facile) tra visioni dall’alto e soluzioni

che partono da esigenze concreteo noi bibliotecari non siamo più gli unici (o i principali?)

produttori di metadati bibliografici.

Nuovo soggettario e fonti

La fonte è resa come collegamento (link) attivabile (cliccabile) tra tre pagine web

Nuovo soggettario e fruibilità da altre applicazioni (p. es. sistemi di catalogazione)

La proposta Zthes: modello standard Z39.50 con evoluzione del protocollo - http - e sintassi di codifica - xml.Domanda:<http://zthes.it?query=dc.title = “Bioarchitettura”>

http://zthes.bncf.firenze.sbn.it/SRU/servlet/SRU?query=dc.title+%3D+%22Bioarchitettura%22&version=1.1&operation=searchRetrieve&startRecord=1

Nuovo soggettario e fruibilità da altre applicazioni (p. es. sistemi di catalogazione) -2

Risposta:

Risposta Zthes:

Nuovo soggettario e fruibilità da altre applicazioni (p. es. sistemi di catalogazione) - 3

Il successo dell’offerta Zthes … pro:

● evolve uno strumento di successo della tradizione bibliotecaria (Z39.50)

contro:● non fa propriamente parte del mondo del web

semantico e dei linked data

L’offerta SKOS del NS - il contesto

● Stiamo sicuramente andando verso il web dei dati (o web semantico)

● Il web dei dati è in realtà un web dove i metadati hanno un ruolo fondamentale

Il contesto,1: Metadati: 3 definizioni

Wikipedia: data about data P. CAPLAN “structured information about an information resource of any media type or format” dove “structured information” significa che l'informazione “must be recorded in accordance with some documented metadata scheme”.

K. COYLE, “Metadata is: constructed (metadata is wholly artificial, created by human beings.); for a purpose (there is no universal metadata: for metadata to be useful it has to serve a purpose); to facilitate an activity (there's something that you do with metadata.)”

Il contesto,2: open data - linked data - linked open data

Se ne parla dal 2006 con l’obiettivo di affermare nella vita quotidiana le visioni del Web semantico proposte agli inizi di questo secolo:

integrare nel web dei documenti un web dei dati.

Il contesto,3: Web semantico

● Il web dei documenti è basato sulla pubblicazione di documenti contenenti dati strutturati prevalentemente ai fini della loro presentazione e fruizione da parte degli utenti, ma non strutturati per il loro riuso e recupero da parte di applicazioni.

● mancano in questi documenti metadati strutturati che attribuiscono ad una determinata stringa di caratteri il significato di prezzo, titolo di un libro, ricetta ecc

Il contesto,4: RDF e SPARQL

● 1997- la proposta - da parte del World Wide Web Consortium - del linguaggio RDF (Resource Description Framework) per pubblicare su web dati interpretabili senza ambiguità da parte di macchine.

● 2008 - SPARQL (SPARQL Protocol and RDF Query Language) come linguaggio di interrogazione per dati rappresentati tramite RDF

Dal 2010 NS disponibile in SKOS

<tns:33097> <w3:syntax-ns#type>

<w3:skos/core#Concept> .<tns:33097>

<w3:skos/core#prefLabel> "Bioarchitettura"@it .

<tns:33097> <w3:skos/core#broader>

<tns:1076> .

<tns:33097><w3:skos/core#closeMatch>

<wikipedia:Bioarchitettura> .<tns:33097>

<w3:skos/core#editorialNote> "FONTE: BNI 2006-

2013; Treccani.it; DeM; Wikipedia(IT)"

“Architettura”

E’ disponibile anche un endpoint SPQRQL

Domanda: quanti e quali i “collegamenti semantici” del NS ( 51335 voci a marzo 2014)?

20746 “collegamenti semantici”

I risultati dell’offerta SKOS

● - oltre all’aumento dei “collegamenti semantici verso”● - crescono anche i “collegamenti semantici da”,

principalmente:o Wikipedia (attraverso Wikidata)o LCSH (Library of Congress Subject Headings)

● - Avvio in BNCF di un progetto sperimentale di indicizzazione (semi)automatica dei documenti digitali “nativi” (principalmente)

I “collegamenti semantici” da Wikipedia (via Wikidata) - 1

I “collegamenti semantici” da Wikipedia (via Wikidata) - 2

Da Wikidata - 1

Da Wikidata - 2

Da Wikidata - 3

Da Wikidata - 4

BNCF Thesaurus

P508

Wikidata - 5

Wikidata - 6

Wikidata - 7

nasce come punto centrale per ● agevolare i link tra le pagine (relative allo

stesso argomento) delle 287 versioni di Wikipedia

● condividere in unico punto informazioni che possono apparire in pagine diverse (es. la popolazione di Roma)

Wikidata - 8

● è diventato (il | un) nodo centrale per integrare il web dei documenti e il web dei dati (al di la della stessa Wikipedia)

● il progetto ha ricevuto donazioni anche da: Allen Institute for Artificial Intelligence [ai]2; the Gordon and Betty Moore Foundation; Google (~2 mln €)

● ha preferito prima risolvere problemi reali e poi evolvere verso (e contribuire a) RDF/SPARQL ecc

Anche i motori di ricerca stanno lavorando per integrare web dei dati e web dei documenti

la proposta oggi più coerente:schema.org = arricchire le pagine web correnti con metadati strutturati che attribuiscono ad una determinata stringa di caratteri il significato di prezzo, titolo di un libro, ricetta ecc

NB: gli stessi motori di ricerca usano database strutturati sul modello wikidata per rispondere alle richieste degli utenti anche con dati non solo con documenti (p. es Google usa tra gli altri db Freebase e Wikipedia per il suo Knowledge Graph )

Schema.org - 2

Un esempio di ricerca su Google versione inglese che sfrutta schema.org per le ricette

Schema.org - 3

Un esempio con Custom Search Google limitato a Worldcat. Con CS si può limitare la ricerca -tra le altre possibilità - alle sole pagine codificate con schema.org (e/o provenienti da uno o più siti web/cataloghi)

Appunti finali

● Attraverso gli OPAC occorre che i dati bibliografici siano “presenti semanticamente sul web”:o la strutturazione dei dati con schema.org sembra

essere un buon punto di partenzao Si può fare ora senza aspettare la conversione in

RDF (basata su “complesse” ontologie) dei nostri cataloghi

● Interessante la recente decisione di OCLC di pubblicare 197 mln di opere con “the properties defined by the CreativeWork type from the Schema.org vocabulary”

Appunti finali - 2

● Integrare nei sistemi di catalogazione la possibilità di acquisire (e di creare) identificativi URI relativi a entità bibliografiche (autori, opere ecc.) sfruttando anche Wikidata come crocevia fondamentale per il web dei dati

● noi bibliotecari non siamo più gli unici (o i principali?) produttori di metadati bibliografici.

Grazie

top related