skos, nuovo soggettario e wikidata

33
SKOS, Nuovo Soggettario e Wikidata appunti per l'evoluzione dei sistemi di gestione dell'informazione bibliografica Giovanni Bergamin, Biblioteca Nazionale Centrale Firenze

Upload: kohagruppoitaliano

Post on 29-Jun-2015

159 views

Category:

Technology


1 download

TRANSCRIPT

Page 1: SKOS, Nuovo Soggettario e Wikidata

SKOS, Nuovo Soggettario e Wikidata appunti per l'evoluzione dei sistemi di gestione

dell'informazione bibliografica

Giovanni Bergamin, Biblioteca Nazionale Centrale Firenze

Page 2: SKOS, Nuovo Soggettario e Wikidata

Parlerò di

● il punto di partenza:o collegamenti NS - Wikipedia, 2006 -o pubblicazione del NS in SKOS e in Zthes, 2010 -

● cosa sta cambiando con Wikidata, 2012 -● intanto ... schema.org, 2011-

Page 3: SKOS, Nuovo Soggettario e Wikidata

Parlerò di (2)

● qualche appunto di viaggioo equilibrio (non facile) tra visioni dall’alto e soluzioni

che partono da esigenze concreteo noi bibliotecari non siamo più gli unici (o i principali?)

produttori di metadati bibliografici.

Page 4: SKOS, Nuovo Soggettario e Wikidata

Nuovo soggettario e fonti

Page 5: SKOS, Nuovo Soggettario e Wikidata

La fonte è resa come collegamento (link) attivabile (cliccabile) tra tre pagine web

Page 6: SKOS, Nuovo Soggettario e Wikidata

Nuovo soggettario e fruibilità da altre applicazioni (p. es. sistemi di catalogazione)

La proposta Zthes: modello standard Z39.50 con evoluzione del protocollo - http - e sintassi di codifica - xml.Domanda:<http://zthes.it?query=dc.title = “Bioarchitettura”>

http://zthes.bncf.firenze.sbn.it/SRU/servlet/SRU?query=dc.title+%3D+%22Bioarchitettura%22&version=1.1&operation=searchRetrieve&startRecord=1

Page 7: SKOS, Nuovo Soggettario e Wikidata

Nuovo soggettario e fruibilità da altre applicazioni (p. es. sistemi di catalogazione) -2

Risposta:

Risposta Zthes:

Page 8: SKOS, Nuovo Soggettario e Wikidata

Nuovo soggettario e fruibilità da altre applicazioni (p. es. sistemi di catalogazione) - 3

Il successo dell’offerta Zthes … pro:

● evolve uno strumento di successo della tradizione bibliotecaria (Z39.50)

contro:● non fa propriamente parte del mondo del web

semantico e dei linked data

Page 9: SKOS, Nuovo Soggettario e Wikidata

L’offerta SKOS del NS - il contesto

● Stiamo sicuramente andando verso il web dei dati (o web semantico)

● Il web dei dati è in realtà un web dove i metadati hanno un ruolo fondamentale

Page 10: SKOS, Nuovo Soggettario e Wikidata

Il contesto,1: Metadati: 3 definizioni

Wikipedia: data about data P. CAPLAN “structured information about an information resource of any media type or format” dove “structured information” significa che l'informazione “must be recorded in accordance with some documented metadata scheme”.

K. COYLE, “Metadata is: constructed (metadata is wholly artificial, created by human beings.); for a purpose (there is no universal metadata: for metadata to be useful it has to serve a purpose); to facilitate an activity (there's something that you do with metadata.)”

Page 11: SKOS, Nuovo Soggettario e Wikidata

Il contesto,2: open data - linked data - linked open data

Se ne parla dal 2006 con l’obiettivo di affermare nella vita quotidiana le visioni del Web semantico proposte agli inizi di questo secolo:

integrare nel web dei documenti un web dei dati.

Page 12: SKOS, Nuovo Soggettario e Wikidata

Il contesto,3: Web semantico

● Il web dei documenti è basato sulla pubblicazione di documenti contenenti dati strutturati prevalentemente ai fini della loro presentazione e fruizione da parte degli utenti, ma non strutturati per il loro riuso e recupero da parte di applicazioni.

● mancano in questi documenti metadati strutturati che attribuiscono ad una determinata stringa di caratteri il significato di prezzo, titolo di un libro, ricetta ecc

Page 13: SKOS, Nuovo Soggettario e Wikidata

Il contesto,4: RDF e SPARQL

● 1997- la proposta - da parte del World Wide Web Consortium - del linguaggio RDF (Resource Description Framework) per pubblicare su web dati interpretabili senza ambiguità da parte di macchine.

● 2008 - SPARQL (SPARQL Protocol and RDF Query Language) come linguaggio di interrogazione per dati rappresentati tramite RDF

Page 14: SKOS, Nuovo Soggettario e Wikidata

Dal 2010 NS disponibile in SKOS

<tns:33097> <w3:syntax-ns#type>

<w3:skos/core#Concept> .<tns:33097>

<w3:skos/core#prefLabel> "Bioarchitettura"@it .

<tns:33097> <w3:skos/core#broader>

<tns:1076> .

<tns:33097><w3:skos/core#closeMatch>

<wikipedia:Bioarchitettura> .<tns:33097>

<w3:skos/core#editorialNote> "FONTE: BNI 2006-

2013; Treccani.it; DeM; Wikipedia(IT)"

“Architettura”

Page 15: SKOS, Nuovo Soggettario e Wikidata

E’ disponibile anche un endpoint SPQRQL

Domanda: quanti e quali i “collegamenti semantici” del NS ( 51335 voci a marzo 2014)?

Page 16: SKOS, Nuovo Soggettario e Wikidata

20746 “collegamenti semantici”

Page 17: SKOS, Nuovo Soggettario e Wikidata

I risultati dell’offerta SKOS

● - oltre all’aumento dei “collegamenti semantici verso”● - crescono anche i “collegamenti semantici da”,

principalmente:o Wikipedia (attraverso Wikidata)o LCSH (Library of Congress Subject Headings)

● - Avvio in BNCF di un progetto sperimentale di indicizzazione (semi)automatica dei documenti digitali “nativi” (principalmente)

Page 18: SKOS, Nuovo Soggettario e Wikidata

I “collegamenti semantici” da Wikipedia (via Wikidata) - 1

Page 19: SKOS, Nuovo Soggettario e Wikidata

I “collegamenti semantici” da Wikipedia (via Wikidata) - 2

Page 20: SKOS, Nuovo Soggettario e Wikidata

Da Wikidata - 1

Page 21: SKOS, Nuovo Soggettario e Wikidata

Da Wikidata - 2

Page 22: SKOS, Nuovo Soggettario e Wikidata

Da Wikidata - 3

Page 23: SKOS, Nuovo Soggettario e Wikidata

Da Wikidata - 4

BNCF Thesaurus

P508

Page 24: SKOS, Nuovo Soggettario e Wikidata

Wikidata - 5

Page 25: SKOS, Nuovo Soggettario e Wikidata

Wikidata - 6

Page 26: SKOS, Nuovo Soggettario e Wikidata

Wikidata - 7

nasce come punto centrale per ● agevolare i link tra le pagine (relative allo

stesso argomento) delle 287 versioni di Wikipedia

● condividere in unico punto informazioni che possono apparire in pagine diverse (es. la popolazione di Roma)

Page 27: SKOS, Nuovo Soggettario e Wikidata

Wikidata - 8

● è diventato (il | un) nodo centrale per integrare il web dei documenti e il web dei dati (al di la della stessa Wikipedia)

● il progetto ha ricevuto donazioni anche da: Allen Institute for Artificial Intelligence [ai]2; the Gordon and Betty Moore Foundation; Google (~2 mln €)

● ha preferito prima risolvere problemi reali e poi evolvere verso (e contribuire a) RDF/SPARQL ecc

Page 28: SKOS, Nuovo Soggettario e Wikidata

Anche i motori di ricerca stanno lavorando per integrare web dei dati e web dei documenti

la proposta oggi più coerente:schema.org = arricchire le pagine web correnti con metadati strutturati che attribuiscono ad una determinata stringa di caratteri il significato di prezzo, titolo di un libro, ricetta ecc

NB: gli stessi motori di ricerca usano database strutturati sul modello wikidata per rispondere alle richieste degli utenti anche con dati non solo con documenti (p. es Google usa tra gli altri db Freebase e Wikipedia per il suo Knowledge Graph )

Page 29: SKOS, Nuovo Soggettario e Wikidata

Schema.org - 2

Un esempio di ricerca su Google versione inglese che sfrutta schema.org per le ricette

Page 30: SKOS, Nuovo Soggettario e Wikidata

Schema.org - 3

Un esempio con Custom Search Google limitato a Worldcat. Con CS si può limitare la ricerca -tra le altre possibilità - alle sole pagine codificate con schema.org (e/o provenienti da uno o più siti web/cataloghi)

Page 31: SKOS, Nuovo Soggettario e Wikidata

Appunti finali

● Attraverso gli OPAC occorre che i dati bibliografici siano “presenti semanticamente sul web”:o la strutturazione dei dati con schema.org sembra

essere un buon punto di partenzao Si può fare ora senza aspettare la conversione in

RDF (basata su “complesse” ontologie) dei nostri cataloghi

● Interessante la recente decisione di OCLC di pubblicare 197 mln di opere con “the properties defined by the CreativeWork type from the Schema.org vocabulary”

Page 32: SKOS, Nuovo Soggettario e Wikidata

Appunti finali - 2

● Integrare nei sistemi di catalogazione la possibilità di acquisire (e di creare) identificativi URI relativi a entità bibliografiche (autori, opere ecc.) sfruttando anche Wikidata come crocevia fondamentale per il web dei dati

● noi bibliotecari non siamo più gli unici (o i principali?) produttori di metadati bibliografici.

Page 33: SKOS, Nuovo Soggettario e Wikidata

Grazie