evolution des catalogues et des formats de catalogage 2 : web sémantique et bibliothèques
DESCRIPTION
Journée de sensibilisation organisée par Média Centre-Ouest le 12 décembre 2013 à la BU à LimogesTRANSCRIPT
Évolution des catalogues et des formats de catalogage
Limoges, 12 décembre 2013Journée de sensibilisation organisée
par Média Centre-Ouest
par Emilie Liard, SCD de l’Université de Poitiersbasé sur le travail du groupe national de formateurs RDA
disco ball par emmma peel http://www.flickr.com/photos/acracia/337831853
Partie 2 : Web sémantique et bibliothèques
Ce que nous voyons
http://www.culture.gouv.fr/documentation/joconde/fr/pres.htm 1
Ce que voit la machine
Brick wall http://www.flickr.com/photos/markhillary/3774707075/ 2
Les bibliothèques : des silos de données non connectés
Silos http://www.flickr.com/photos/docsearls/5500714140/ 3
Sérendipité...
Yoyogi Koen http://www.flickr.com/photos/runnerone/4659827202/ 4
Que va nous apporter le Web de données ?
• Relier les catalogues de bibliothèques
• Ouverture
• Navigation
• Visibilité
• Tirer parti des données
• Interopérabilité
String beam http://www.flickr.com/photos/h2oalchemist/250768067/5
•Web 1.0 : web de documents–permet aux usagers de naviguer facilement sur Internet en utilisant des liens hypertexte•une page = un document–format : HTML (HyperText Markup Language)•ne permet que la mise en forme•Web 2.0 : web collaboratif / web social•Web 3.0 : web de données / web sémantique–permet aux machines de trouver et d’exploiter les données contenues dans les documents–format : RDF (Resource Description Framework)
Histoire (rapide) du Web
6
Tim Berners-Lee at the BBC http://www.flickr.com/photos/christianpayne/3708792057/ http://www.w3.org/DesignIssues/LinkedData.html
Web sémantique, web de données, linked open data...
7
• Une grammaire RDF
• Des vocabulaires RDFS / OWLontologies
• Des règles d’écriture RDF/XMLN3, TurtleRDFa
• Des moyens de communication SPARQL
D’après Emmanuelle Bermès, Fulbi, 17/01/2013
Un langage pour les machines
8
Être visible
9
Publier des référentiels communs
Modèle « hub and spoke »Plusieurs bases de données partagent le même référentiel
Construire l’interopérabilité (1)
10
Publier des référentiels communs
Construire l’interopérabilité (2)
11
12
Créer des liens entre référentiels différents
Modèle « follow your nose »Interopérabilité fondée sur des liens
Construire l’interopérabilité (3)
13
Exemple :RAMEAU (bibliothèques)et le Thésaurus W (archives)
14
Thesaurus W
RAMEAU
LCSH
GND
Créer un réseau de données
15
Faire travailler les données
Enrichir le catalogue
16
☜
Intégrer de l’information créée ailleurs
Source : notice d’autorité BnF
Source : Académie française
Enrichir le catalogue
17
http://www.bnf.fr/fr/professionnels/modelisation_ontologies/a.opencat.html
Agréger des données
18
Agréger des données
http://www.bbc.co.uk/nature/wildlife19
• Mieux intégrer des données hétérogèneso Description bibliographiqueo Description archivistiqueo Documentation électroniqueo Documentation pédagogiqueo etc.
• « Faire travailler les données » o Frises chronologiqueso Géolocalisationo etc.
De nouvelles interfaces
20
• Moins de catalogage natif
• Évolution du rôle du catalogueur
o Sélection et validation des données auxquelles lier les ressources possédées par la bibliothèque
o Sélection des ressources complémentaires externes destinées à enrichir le catalogue
Source Flickr : http://www.flickr.com/photos/davidgsteadman/4783421742 CC BY-NC
Quel impact sur le travail du catalogueur ?
21
Source Flick : http://www.flickr.com/photos/dullhunk/2071110042 CC-BY
• Des données structurées
• Des vocabulaires normalisés
• Des identifiants pérennes (URI)o pour désigner les ressourceso pour exprimer les relations entre les données
• Une syntaxe normalisée : RDF RDF = Resource Description Framework
Comment arriver à ces résultats ?
22
Des données structurées
23
000 cam 22 3 450 001FRBNF389105810000001003http://catalogue.bnf.fr/ark:/12148/cb38910581f010 $a2-200-26375-9$bbr.100 $a20021112d2002 m y0frey50 ba1010 $afre102 $aFR105 $a||||z 00|||106 $ar2001 $aˆL'‰Orient arabe$bTexte imprimé$earabisme et islamisme de 1798 à 1945 $fHenry Laurens205 $a2ème éd.210 $aParis$cArmand Colin$d2002215 $a1 vol. (336 p.)$d24 cm2250 $aU$iHistoire contemporaine410 0$034244335$tCollection U. Série Histoire contemporaine$x0768-4878$d2002606 $312010387$aNationalisme$yPays arabes$311975999$z19e siècle$2rameau606 $312010387$aNationalisme$yPays arabes$311975995$z20e siècle$2rameau606 $311967291$aPanarabisme$2rameau606 $314612334$aIslamisme$311931634$yPays arabes$311934444$xHistoire$2rameau700 1$312094651$aLaurens$bHenry$f1954-.... $4070801 0$aFR$bFR-751131015$c20021112$gAFNOR$hFRBNF389105810000001$2intermrc
http://catalogue.bnf.fr/ark:/12148/cb34244335j
http://catalogue.bnf.fr/ark:/12148/cb12094651t
24
Laurens, Henry (1954-....) http://catalogue.bnf.fr/ark:/12148/cb12094651t
http://catalogue.bnf.fr/ark:/12148/cb34244335jISSN 0768-4878 = Collection U. Série Histoire contemporaine
http://catalogue.bnf.fr/ark:/12148/cb38910581fL'Orient arabe : arabisme et islamisme de 1798 à 1945 / Henry Laurens. - 2ème éd.. - Paris : Armand Colin, 2002
Des URI pour désigner des ressources
25
pour exprimer les relations entre les données
2001 $aL'Orient arabe$earabisme et islamisme de 1798 à 1945
700 1$312094651$aLaurens$bHenry$f1954-.... $4070
200 $a Titre propreDC : Title ISBD : Title properRDA : Title proper
200 $e Complément du titreISBD : Other title informationRDA : Other title information
700 $4070 Auteur du texteDC : Creator RDA : CreatorRDA : Author
Des vocabulaires normalisés
26
Des URI pour exprimer des relations
27
ISBD : has title proper
DC : Creator
DC : Title
RDA : Authorhttp://rdvocab.info/roles/author
http://purl.org/dc/elements/1.1/title
http://purl.org/dc/elements/1.1/creator
http://iflastandards.info/ns/isbd/elements/P1004 RDA : Title proper http://rdvocab.info/Elements/titleProper
ISBD : has other title information http://iflastandards.info/ns/isbd/elements/P1006RDA : Other title information http://rdvocab.info/Elements/otherTitleInformation
Des URI pour exprimer des relations
28
Cet ouvrage
"L'Orient arabe"a pour titre propre
RDF
sujet
verbe
http://catalogue.bnf.fr/ark:/12148/cb38910581f
"L'Orient arabe" http://iflastandards.info/ns/isbd/elements/P1004
2001 $aL'Orient arabe
prédicat
sujet
Le sujet est toujours une URILe prédicat est toujours une URIL’objet peut êtreun texte (« littéral »)ou une URI
Une syntaxe normalisée
complément d’objet
objet
29
• Une déclaration est composée de 3 éléments qui forment un triplet.
• Un triplet est composé des 3 éléments suivants : sujet – prédicat – objet
Exemple :Honoré de Balzac a écrit « La comédie humaine »
• Sujet = ressource = Honoré de Balzac
• Prédicat = propriété (nature de la relation) = Creator
• Objet = valeur (caractéristique ou ressource liée) = La Comédie humaine
RDF : la notion de triplets
30
est né à
est un
a créé
est une
représente
est mort à
estcontemporain de
est né à
est conservée à
est situé à
1840est né en
est né en
1850 est mort en
RDF : la notion de graphe
31
• Les données des catalogues en MARC sont très structurées, donc ré exploitables.
• Tout le travail effectué jusqu’à présent sera exploité
• Définition d’ontologies en RDF • spécifiques aux données bibliographiques
• FRBRER, FRAD, FRSAD, FRBROO
• ISBD• RDA
• génériques• DC, Schema.org
• Définition de modèles de données en RDF • BIBFRAME
De MARC à RDF ?
32
http://www.slis.wisc.edu/documents/2013-uwisc-webinar-1.pdf
33
http://www.slis.wisc.edu/documents/2013-uwisc-webinar-1.pdf
34
http://www.slis.wisc.edu/documents/2013-uwisc-webinar-1.pdf
35