duurzame ontsluiting in archipel
TRANSCRIPT
![Page 1: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/1.jpg)
Archipel: Digitale Lange
Termijn Preservatie
Inge Van Nieuwerburgh (Universiteitsbibliotheek Gent)
Sam Coppens (Multimedia Lab)
![Page 2: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/2.jpg)
Inhoud
•Doelstellingen en Uitdagingen
•Data Model
•PREMIS OWL
•Architectuur
•Voordelen content providers
•Demonstratie
![Page 3: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/3.jpg)
Doelstellingen & Uitdagingen
Doelstellingen:•OAIS Lange termijn preservatie van de data
(metadata en multimedia assets)•Publicatie van alle informatie als Linked Open Data
![Page 4: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/4.jpg)
Doelstellingen & Uitdagingen
Uitdagingen:
•Multi-layered metadata
• Verschillende sector-specifieke metadata
• Gemeenschappelijk metadata model
• Preservatie metadata
• Linked Open Data publicatie
•OAIS in een gedistribueerde, semantische omgeving
![Page 5: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/5.jpg)
Data Model
![Page 6: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/6.jpg)
PREMIS OWL
![Page 7: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/7.jpg)
PREMIS OWL•Semantische implementatie van de PREMIS 2.1 Data Dictionary.
•Kan gebruikt worden om preservatie informatie tepubliceren als Linked Open Data.
•Gelinkt aan de preservatie vocabularies van het LOC.
Namespace:
http://multimedialab.elis.ugent.be/users/samcoppe/ontologies/Premis/premis.owl
Ondergaat een standardisatie proces:
•Archipel – LOC - BNF
•Zal weldra aangekondigd worden door het Library of Congress en naar een LOC namespace verhuizen.
![Page 8: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/8.jpg)
Architectuur
![Page 9: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/9.jpg)
Architectuur
Shared Repositories
![Page 10: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/10.jpg)
Architectuur
LOD Server –Preservatie Platform
![Page 11: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/11.jpg)
ArchitectuurIntegratie Server
![Page 12: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/12.jpg)
Architectuur
Disseminatie modules
![Page 13: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/13.jpg)
Architectuur - Ingest
1) Shared Repository via OAI-PMH:
•Publiceert content online en maakt de content beschikbaar voor harvesting (OAI-PMH)
MediaMosa (http://www.mediamosa.org/)
Andere overwogen tools:Omeka (http://omeka.org)Fedora Islandora (https://wiki.duraspace.org/display/ISLANDORA/Islandora)
![Page 14: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/14.jpg)
Architectuur - Ingest2) BagIts via FTP:
•ZIP-archieven met metadata, data en extra informatie (checksums)BagIt (https://wiki.ucop.edu/display/Curation/BagIt)
exampleBag/
| | manifest-md5.txt | (49afbd86a1ca9f34b677a3f09655eae9 data/27613-h/images/q172.png) | (408ad21d50cef31da4df6d9ed81b01a7 data/27613-h/images/q172.txt) | | bagit.txt| (BagIt-version: 0.96) | (Tag-File-Character-Encoding: UTF-8 ) | \--- data/
| 27613-h/images/q172.png | (... image bytes ...) | 27613-h/images/q172.txt | (... OCR text ...)
![Page 15: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/15.jpg)
Architectuur - LODServer
LODServer & Preservatie Platform:
•Disseminatie van de content als Linked Open Data•Preservatie van de content via semantisch webtechnologieën
![Page 16: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/16.jpg)
Architectuur - LODServer
LODServer & Preservatie Platform:
•Ingest: OAI-PMH of via BagIts
•Characterisatie / Validatie: DROID + PRONOM + Preserv2
•Triple Store: Openlink Virtuoso Open Source
•Transcoding:•Video/sound: FFMpeg•Beeld: ImageMagick•Documenten: JODConverter (OpenOffice converter)
•Disseminatie:•SPARQL•Lucene Indexing Full Text Search
•Linked Open Data•BagIts
![Page 17: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/17.jpg)
Architectuur – Integratie Server
Integratie Server:
•Orchestreert alle preservatie- en disseminatieprocessen.
Porthus .Net Integration Server
![Page 18: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/18.jpg)
Architectuur – Integratie Server
Disseminatie Workflow:
OAI-PMH
Harvest
Enrichment Triple
Store
LOD Ingest SPARQL
Mapping
Service bus
Repository
Site
Service Bus
![Page 19: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/19.jpg)
Architectuur – Integratie Server
Preservatie Workflow:
Ingest services
OAI-PMH
Harvest
SIP (Bagit)
Ingest
SIP
creation
LOD Ingest
Mapping
CharacterisationContent store
Migration/
Transcoding
Enrichment
Triple Store
Workflow
Tracker
Orchestration/
Routing
Cloud
Storage
DIP ExtractSPARQL
Consumer DIPs
Service Bus
![Page 20: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/20.jpg)
Architectuur – Disseminatie Modules
Disseminatie Modules:
•Alle disseminatie modules maken gebruik van het SPARQL endpoint van de LOD Server
SPARQL
DRUPAL
SPARQL Views Module
![Page 21: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/21.jpg)
Voordelen Content Providers
•Lange termijn preservatie van de content.
•Linked Open Data publicatie van de content.
•Reconciled metadata:
•Semantische metadata
•Gelinkte metadata
•Resource based:
•SKOS vocabularies
•Personen- en Organisatie-register
•Verrijkingen
![Page 23: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/23.jpg)
Medewerkers Architectuur
• Descartes (Porthus)
• Inuits
• Krimson
• VTi
• Boekentoren
• Multimedia Lab
![Page 24: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/24.jpg)
Demonstrators
Toneelstof: theater
Ambrosia’s Tafel: mediawijsheid bij jongeren
Constant vzw: Active Archives Video Wiki
Klascement: portaal voor leerkrachten
Boekentoren – UGent: portaal voor Onderzoek en hoger onderwijs
![Page 25: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/25.jpg)
Wensen
Zoveel digitale audiovisuele data, zo moeilijk toegankelijk
1 portaal voor onderzoek en onderwijs UGent: zoveel mogelijk externe bronnen
Data data data data ….
![Page 26: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/26.jpg)
Voorwaarden
Simpele maar krachtige zoekmogelijkheden
Snelheid
Eenvoudige downloadmogelijkheden
Data mining (maar: CR)
![Page 27: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/27.jpg)
Technische voorwaarden
Gebaseerd op standaarden (zie ook onderzoek in BOM_vl)
Mogelijk integratie met andere systemen zoals ELO
Gebaseerd op bestaande technologie
![Page 28: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/28.jpg)
Bestaande technologie
Solr: zoekmachine
Lucene index
Representatie:
Hangt af van bron-interface
Zoomer beelden: IIPimage
Streamer video en audio: CRTMP server
![Page 29: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/29.jpg)
File types
Lokaal beschikbare files:
TIFF = input
Pyramid TIF en JPEG2000 = zoomer (afgeleid van tiff)
mp4 (wordt bijgewerkt), flv, mp3 (dit heeft streamer nodig)
Afgeleiden:
JPEG, GIF, PNG
![Page 30: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/30.jpg)
Search&find
Krachtige search: Google-like, los van velden
Fuzzy (ondermeer spellingsfouten worden opgevangen)
Boolean search
Zoeken via een kaart (= feature)
Openurl gebaseerd: bv. verschillende formaten eenvoudig tonen
Toegang tot de xml-beschrijving of Json-beschrijving, indien beschikbaar
![Page 31: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/31.jpg)
Resultaten
Sterke zoomer
Bladerinterface: kan complexe objecten aan
Persistente URLs: zowel per complex object als per onderdeel (bv. boek –blz)
Selectie en mandje (vooral organisatorische keuze wat kan)
Toegangscontrole mogelijk
![Page 32: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/32.jpg)
16 november: eindevenement archipel in deSingel in Antwerpen
Registreren via http://archipelproject.be
![Page 33: Duurzame ontsluiting in Archipel](https://reader034.vdocuments.site/reader034/viewer/2022052700/55a14e431a28abcd488b466e/html5/thumbnails/33.jpg)
Medewerkers
Technisch: Nicolas Franck en Patrick Hochtstenbach
Inhoudelijk: Mui-ling Verbist en Inge Van Nieuwerburgh