Studiedag Baas over eigen metadata
21 juni 2012
DEN: Marco Streefkerk, Robert GillesseKB: Reinier DeinumWieWasWie: Tine van Nierop
Workshop verbeteren kwaliteit van metadata
Mand – het vervolg
Zoeken op mandje makkum tichelaar
Opzet workshop• Afbakening• Instrumenten DEN– Kennisbank, DE BASIS, kennisdossiers, standaarden
• Use cases • Interactief gedeelte• Terugkoppeling en reflectie
Afbakening• Beschrijvende metadata• Nodig voor het identificeren en vinden van
objecten• Dus geen structurele, administratieve of
technische metadata• Wat verstaan onder “kwaliteit” in deze
context?• Bepaald door de uitwisselbaarheid en
interoperabiliteit van de metadata
Interoperabiliteit
• Het kunnen uitwisselen van (meta)data tussen verschillende informatiesystemen
• Veel voorkomend probleem: metadata sluit niet goed op elkaar aan
• Kan zowel extern als intern probleem zijn
Doel worshop
• Hoe kun je er voor zorgen dat de metadata wel beter op elkaar aansluit?
Kwaliteit metadata op drie niveau´s
1. Instelling2. Aggregator of portal3. Landelijke richtlijnen of aanbevelingen
Instrumenten DEN
De kennisbank• Kwaliteitscyclus• DE BASIS• Kennisdossiers• Terminologiebronnen
A – Informatiebeleid
B - Plannen
C - Uitvoering
D - Evaluatie
Voorbereiding
Vervaardiging
Beschrijving
Opslag
Toegang
Presentatie
Beheer & gebruik
Interoperabiliteit
DuurzaamheidKwaliteitscyclus Digitaal erfgoed
Kwaliteitscyclus
Beleid • Beschrijvingsconventies worden idealiter
bepaald door beleid en (informatiebeleids)plannen
• Uniforme manier van beschrijven binnen een instelling
• Digitaal Erfgoed: Bouwen Aan Succesvolle ICT-Strategie
• Minimale kwaliteitseisen voor digitalisering• 29 standaarden t.o.v. 176 in het ICT-register• Richtlijnen voor de verschillende fasen
digitalisering• Zelfregulering door de erfgoedsector
Wat is DE BASIS?
http://www.den.nl/debasis
DE BASIS voor beschrijvingen
• Minimale eis “gebruik van een terminologiebron voor onderwerpsontsluiting ”
• Aanbeveling: gebruik van terminologiebronnen voor toekenning van persoons- en instellingsnamen, tijds- en plaatsaanduidingen, materialen en technieken”
• Voorkeur gebruik bestaande gangbare terminologiebron
DE BASIS voor vindbaarheid
• Lijst van standaarden die doorzoekbaarheid, vindbaarheid en uitwisselbaarheid van digitale collecties en objecten stimuleert
• Maakt deelname aan de nationale aggregator en andere portals mogelijk
DE BASIS voor vindbaarheid
•HTTP maakt erfgoedinformatie bereikbaar via het web;•URI zorgt ervoor dat ieder digitaal object in een collectie op een unieke wijze geïdentificeerd kan worden;•XML structureert alle (meta)data op een wijze die computers snel en flexibel kunnen verwerken;•UTF-8 codeert tekst in willekeurig welke internationale tekenset;•Dublin Core beschrijft de erfgoedobjecten in een collectie op een wijze die wereldwijd wordt toegepast;•OAI-PMH kopieert informatie over collectie-items ten behoeve van andere informatiesystemen die de vindbaarheid vergroten;•SRU maakt het eigen informatiesysteem rechtstreeks doorzoekbaar voor anderen.
Binnenkort herzien
Kennisdossiers
• Beschrijving–Metadata– Inhoudelijke ontsluiting
Terminologiebronnen
• Data -> informatie -> kennis• Collecties -> instellingen -> deskundigen ->
sector -> wereld• Specialist versus gebruiker• Presentabel-> Vindbaar -> koppelbaar -> • Je partner (1): CMS leverancier• Je partner (2): DEN
Terminologiebronnen
• Inventarisatie terminologiebronnen• Overzicht van 63 in Nederland en Vlaanderen
gebruikte terminologiebronnen• Gecontroleerde woordenlijsten,
trefwoordenlijsten, taxonomieën, classificaties, ontologieën en thesauri
Gelaagd model
SKOS en Semantisch web
• OPENSKOS.nl• Concepten in plaats van termen• Concepten kunnen over schema’s gelinkt
worden (MATCH):– exact, close, broad, narrow, related
• Voorwaarde: (http)URI• Concepten linken met data op web (LOD)• Inhoudelijke coordinatie
Interactief gedeelte
• Verdelen in groepen van 5 tot 7 personen• Reflectie op eigen praktijk van beschrijven• Hoe die praktijk mogelijk te verbeteren?• Welke rol zouden portal of aggretors
kunnen spelen in mogelijke verbeteringen?• Opstellen lijst van de beste voorstellen
Terugkoppeling en reflectie• Lijsten met voorstellen samensmeden tot
shortlist van 10 punten• Shortlist vormt basis van lijst aanbevelingen
op de DEN website
Kat in ‘t bakkie (of mandje?)
Advies gebruikslicenties metadata
ObjectiefMetadata zijn direct herleidbaar uit het erfgoed(object)
SubjectiefMetadata zijn gebaseerd op kennis of opinie
Metadata vervaardigd door erfgoedinstelling
Metadata vervaardigd door gebruiker
In deze categorie vallen gegevens die nodig zijn voor identificatie en lokalisering van erfgoed(objecten). Het betreft gegevens over vervaardiger(s), uitgevers, de titel of een korte omschrijving, informatie over plaats en tijd van vervaardiging, geo-aanduiding, periodisering en fysieke kenmerken
Advies: deze gegevens dienen beschikbaar gesteld te worden met de Creative Commons Zero Public Domain -verklaring. Dit geldt voor metadata van alle instellingen met een publieke taakstelling.
N.B. Objectieve gegevens voor beheer en behoud vallen hier niet onder (bijv. gegevens over acquisitie, provenance, bewaarplaats, verzekeringswaarde e.d.)
In deze categorie vallen gegevens die een context bieden voor (de interpretatie van) het erfgoed(object). Deze context kan aanvullende informatie zijn op basis van kennis of onderzoek, maar ook een persoonlijke observatie van een erfgoedmedewerker. Ook inhoudelijke ontsluiting op basis van thesauri of andere kennissystemen valt hieronder.
Advies: de licentievorm is een eigen keuze van de instelling. Instellingen die voor meer dan 50% door een overheid worden gefinancierd, worden gestimuleerd deze gegevens met een CC0-verklaring beschikbaar te maken. De eerstvolgende voorkeur heeft de CC-BY-SA-licentie (Naamsvermelding-Gelijk delen).
Tot deze categorie behoren verifieerbare gegevens die gebruikers aandragen ten behoeve van nadere identificatie, zoals personen of gebouwen op een foto en correcties op de beschrijving van de instelling .
Advies: deze aanvullende informatie wordt met een CC0-verklaring vrijgegeven. Dit dient vastgelegd te worden in gebruikersovereenkomsten.
Tot deze categorie behoren persoonlijke reacties en observaties van gebruikers, zoals persoonlijke verhalen, tags, aanvullende foto's etc.,
Advies: voor deze categorie kan vooraf niet één licentievorm worden bepaald. Deze is afhankelijk van de vorm en inhoud van de reactie (tags kunnen vaak als CC0 in het publieke domein komen, voor persoonlijke verhalen kan soms CC BY-NC-ND Naamsvermelding-NietCommercieel-GeenAfgeleideWerken) gepast zijn.