Download - RDA e Linked data: un binomio naturale
Convegno delle Stelline – 20ᵃ edizione
RDA e Linked data: un binomio naturale. Linee guida e tecnologie
per gli ILS di nuova generazione
Tiziana Possemato @Cult
Copyright 2008 @CULT. All rights reserved
I dati delle biblioteche nel web semantico
Necessità del cambiamento affinché i dati del catalogo siano del web e non solo
nel web: formulata in varie forme e occasioni, la più significativa delle quali è
On the record, il report della Library of Congress Working Group on the
Future of Bibliographic Control, del 2008, in cui si richiama alla necessità di:
• trasformare la descrizione testuale in set di dati usabili per processi ed
elaborazioni automatiche da parte di macchine;
• rendere gli elementi di dati univocamente identificabili;
• assicurare la compatibilità dei dati con le tecnologie e gli standard del web;
• usare un linguaggio trasversale e interoperabile nella realtà del web.
Copyright 2008 @CULT. All rights reserved
Nuovi modelli catalografici e linked data
Adozione delle logiche e delle tecnologie del web semantico nel contesto
delle biblioteche:
• ripensamento profondo del modello del catalogo finora conosciuto;
• rifondazione dei principi, degli standard e delle normative catalografiche;
RDA (Resource Description and Access): standard internazionale
per la metadatazione delle risorse nell’era digitale => le linee guida si
muovono all’interno della filosofia del web semantico e dei linked data
Copyright 2008 @CULT. All rights reserved
Nuovi modelli catalografici e linked data
Riflessione sul futuro del controllo bibliografico universale:
• Il formato piatto del record MARC è inadeguato ad esprimere le relazioni
tra entità bibliografiche che il modello FRBR e lo standard RDA considerano
fondamentali (MARC must die!)
• Maggio 2011: la Bibliographic Framework Transition Iniziative dichiara:
«The new bibliographic framework project will be focused on the Web
environment, Linked Data principles and mechanisms, and the Resource
Description Framework (RDF) as a basic data model»
21 novembre 2012: Bibliographic Framework as a Web of Data: Linked
Data Model and Supporting Services – BIBFRAME –
Copyright 2008 @CULT. All rights reserved
BIBFRAME
BIBFRAME: il primo passo nella definizione di una road map che dovrebbe
proporre un nuovo ambiente bibliografico, con l’enunciazione di un nuovo
ecosistema bibliografico:
• alto livello di analisi e identificazione del dato
• enfatizzazione delle relazioni
• impiego diffuso dei vocabolari controllati
• accurato dettaglio descrittivo delle risorse
• ampia flessibilità nella gestione delle voci controllate
Copyright 2008 @CULT. All rights reserved
BIBFRAME
BIBFRAME: modello di dati ispirato a FRBR ma semplificato; distingue il contenuto
concettuale (opera) e la manifestazione fisica (istanza); identifica un’entità
in maniera non ambigua; evidenzia le relazioni tra le entità mostrando la natura
della correlazione.
Il modello è strutturato in 4 classi principali:
• Opera: essenza concettuale della risorsa catalogata, il cui concetto è assimilabile
all’opera e all’espressione di FRBR.
• Istanza: materializzazione individuale dell’opera.
• Authority: entità che hanno una relazione con l’opera o con l’istanza, per
esempio persone, famiglie, enti, concetti, luoghi.
• Annotazioni: ciò che decora o arricchisce la risorsa con informazioni aggiuntive,
per esempio dati di esemplare, immagini di copertina, recensioni, TOC
Copyright 2008 @CULT. All rights reserved
BIBFRAME - Esempio
Il rapporto FRBR ha 3 istanze associate a 2 diversi editori
Copyright 2008 @CULT. All rights reserved
BIBFRAME – Linee guida
BIBFRAME definisce alcune linee guida generali, tra cui:
• la prospettiva che gli ILS di nuova generazione si orientino su una architettura a
risorsa, dove cioè l’oggetto catalogato sia il singolo elemento, non l’intero record;
• la possibilità che ciascuna risorsa possa essere collegata ad altre risorse;
• la possibilità che nella metadatazione il catalogatore possa attingere da
informazioni nel web, senza creare ogni volta oggetti nuovi;
• l’impiego di liste controllate di termini e, quindi, l’accesso ai vocabolari e alle
liste di termini pubblicate, per esempio, sull’Open Metadata Registry.
• la possibilità di definire in configurazione del sistema la logica di creazione degli
URI e di permettere, dunque, che a ogni nuova risorsa creata sia attribuibile
automaticamente un URI.
Copyright 2008 @CULT. All rights reserved
BIBFRAME Editor
BIBFRAME editor: http://bibframe.org/tools/editor/#
Copyright 2008 @CULT. All rights reserved
RIMMF – RDA in Many Metadata Formats
RIMMF: un primo esempio di sistema orientato a RDA. È uno strumento illustrativo
e didattico, di editing e visualizzazione dei dati, nato per aiutare i catalogatori a
pensare in RDA e, dunque, in FRBR, anziché in AACR e MARC. RIMMF non è,
quindi, un ILS, né un modulo di catalogazione.
Le funzioni disponibili in RIMMF sono:
• creazione di nuovi modelli di catalogazione;
• creazione di nuove registrazioni catalografiche;
• import di dati da database esterni;
• creazione di relazioni tra entità;
• visualizzazione della struttura gerarchica (ad albero) creata dalle relazioni tra le
varie risorse.
Copyright 2008 @CULT. All rights reserved
RIMMF Editor
RIMMF: http://www.marcofquality.com/wiki/rimmf3/doku.php?id=rimmf
Copyright 2008 @CULT. All rights reserved
RIMMF Editor
Particolarmente interessante è la possibilità di visualizzare o importare dati
provenienti da banche dati esterne: database bibliografici e OPAC (per
esempio, quello della Library of Congress), authority file (per esempio,
VIAF), enciclopedie e repertori online (per esempio, Wikipedia).
Il meccanismo ha un duplice scopo:
• facilitare le operazioni di condivisione dei dati;
• consentire, già in fase di strutturazione del dato, di anticipare l’attività di
creazione di collegamenti esterni.
Copyright 2008 @CULT. All rights reserved
RIMMF Editor
Ricerca dell’entità
Umberto Eco in Wikipedia
Ricerca dell’entità Umberto Eco in VIAF con visualizzazione in MARC21 e importazione in RIMMF
Copyright 2008 @CULT. All rights reserved
RIMMF Editor
Import di record in MARCXML dalla Library of Congress, con mappatura e visualizzazione secondo la struttura RDA
Copyright 2008 @CULT. All rights reserved
Evoluzione degli ILS nel panorama italiano
I software di nuova generazione devono tener conto di RDA, producendo
strumenti che facilitino il passaggio dall’epoca dominata dalla strutturazione
dei dati in formato MARC, a una nuova era che, con BIBFRAME, lascia
intendere che andrà nella direzione dei linked open data, e che esprime
anche nel linguaggio l’evoluzione verso nuovi modelli di metadatazione.
WeCat => il modulo di metadatazione dell’ILS OliSuite:
• assimila integralmente tutti gli aggiornamenti di MARC21
• consente di strutturare i dati secondo RDA
• in una modalità orientata ai linked open data.
Copyright 2008 @CULT. All rights reserved 17
WeCat: MARC21 updates 9-18 per RDA
WeCat assorbe tutti i cambiamenti del MARC21, compresi gli
aggiornamento 9-18, che includono le novità previste per RDA
approvate fino al giugno 2014, e che riguardano:
• Contenuto, media e supporto delle risorse (tipi e
caratteristiche)
• Attributi dei nomi e delle risorse
• Relazioni
• Varie
Copyright 2008 @CULT. All rights reserved
OliSuite/WeCat
WeCat propone codici specifici per identificare le entità FRBR: la
metadatazione parte con la selezione di modelli che propongono al
catalogatore gli attributi previsti da
FRBR per ciascuna specifica entità.
Copyright 2008 @CULT. All rights reserved
OliSuite/WeCat
Il potenziamento delle funzioni per il controllo d’autorità esprime la
necessità, comune a RDA e ai principi dei linked open data, di descrivere
l’entità che si sta analizzando con un alto numero di attributi, creando così
un oggetto perfettamente identificabile e riutilizzabile in molteplici ambiti.
Copyright 2008 @CULT. All rights reserved 20
WeCat – Relazioni nome-risorsa
Relazioni tra nome e risorsa assorbite da RDA – Appendice I: lista di
possibili relazioni tra una risorsa e una persona, famiglia e ente (es.:
autore, editore, artista, cartografo)
Copyright 2008 @CULT. All rights reserved 21
WeCat – Relazioni risorsa-risorsa
Relazioni tra risorsa e risorsa assorbite da RDA – Appendice J: sono
previste più di 400 relazioni che possono esistere tra opere, espressioni,
manifestazioni e item (es.: drammatizzato come opera, sequel di, filmato
come manifestazione, riproduzione dell’item).
Copyright 2008 @CULT. All rights reserved 22
WeCat – Relazioni nome-nome
Relazioni tra nome e nome assorbite da RDA – Appendice K: relazioni
che possono esistere tra persone, famiglie e enti (es.: impiegati, sponsor,
discendenti, predecessori)
Relazione tra l’ente FIAT (gruppo automobilistico) e la persona Giovanni Agnelli
Copyright 2008 @CULT. All rights reserved 23
WeCat – Vocabolari e liste di termini
Le liste di termini provengono da vocabolari controllati, per lo più pubblicati
in RDF sull’Open Metadata Registry: WeCat condivide la finalità di utilizzare
un linguaggio formulato in set di dati e in ontologie comprensibili alle
macchine.
Copyright 2008 @CULT. All rights reserved 24
OliSuite/WeCat – Interlinking
Funzione di ricerca e cattura, a partire da un’entità, degli identificativi
utilizzati per la medesima entità su altri dataset e siti esterni:
predisposizione del meccanismo d’interlinking, che consente ai dati di
acquisire la quinta stella prevista dal sistema di valutazione di Tim
Berners-Lee.
Ricerca e cattura degli identificativi dell’entità persona Collodi, Carlo su tre fonti di dati differenti: SBN, VIAF, Wikipedia
Copyright 2008 @CULT. All rights reserved
RDA come istruzione Linked data come realizzazione
• FRBR: fortemente riconosciuto in tutti i progetti di pubblicazione dei dati;
con l’introduzione di RDA è diventato modello di riferimento anche nella fase
di strutturazione dei dati, determinando un corso nuovo nella evoluzione
degli ILS;
• paradigma dei linked data e del web semantico: la filosofia che
sottende il trattamento del dato in fase di creazione e in fase di
pubblicazione;
• realizzazione di linked open data: ancora di pertinenza della
pubblicazione;
• predisposizione del dato per semplificare il processo di identificazione
delle risorse, di creazione di collegamenti e, quindi, di conversione in linked
open data attiene alla nuova generazione di ILS.
Copyright 2008 @CULT. All rights reserved
RDA come istruzione Linked data come realizzazione
La qualità dei risultati dipende dalla quantità di investimenti economici e
umani:
• identificare e collegare i dati attiene alla teoria della catalogazione,
acquisita e consolidata;
• la traduzione delle realizzazioni in progetti di fruizione, attiene al grado
e alla quantità di investimenti di risorse finanziarie e umane.
RDA e linked data rappresentano un binomio naturale: le linee guida e
la tecnologia sono state pensate per gli ILS di nuova generazione.
RDA è, pertanto, la faccia normativa di ciò che i linked open data
realizzano concretamente.
Copyright 2008 @CULT. All rights reserved
Grazie
Tiziana Possemato – @CULT
[email protected] Cel.: 3485810489
www.atcult.it