stefan hein tools zur generierung technischer...
TRANSCRIPT
![Page 1: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/1.jpg)
| 21 | nestor – Workshop | 21. Oktober 20101
Tools zur Generierung technischer Metadaten
Stefan Hein
![Page 2: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/2.jpg)
| 21 | nestor – Workshop | 21. Oktober 20102
1. Leistungsspektrumwas Metadatentools leisten können
2. Metadatentoolsund ihre Vielfalt
3. Auswahlkriteriendie Wahl des passenden Tools
4. JHOVE & Co.
Der rote Faden
![Page 3: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/3.jpg)
| 21 | nestor – Workshop | 21. Oktober 20103
1. Leistungsspektrumwas Metadatentools leisten können
2. Metadatentoolsund ihre Vielfalt
3. Auswahlkriteriendie Wahl des passenden Tools
4. JHOVE & Co.
Der rote Faden
![Page 4: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/4.jpg)
| 21 | nestor – Workshop | 21. Oktober 20104
Metadatentools und ihr Leistungsspektrum
I. Dateiformate identifizierenWelches Dateiformat hat ein vorliegendes digitales Objekt?
II. Datei gegen das Format validierenKann dem vertraut werden, was ein digitales Objekt vorgibt zu sein?
III. techn. Metadaten extrahierenWelches sind die technischen Eigenschaften eines vorliegenden digitalen Objekts?
![Page 5: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/5.jpg)
| 21 | nestor – Workshop | 21. Oktober 20105
1. Leistungsspektrumwas Metadatentools leisten können
2. Metadatentoolsund ihre Vielfalt
3. Auswahlkriteriendie Wahl des passenden Tools
4. JHOVE & Co.
Der rote Faden
![Page 6: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/6.jpg)
| 21 | nestor – Workshop | 21. Oktober 20106
Metadatentools
JHOVE
DROID
ExifTool
ffident
ImageInfo
NLNZ MetadataExtractor
FITS
file
Adobe XMP
IrfanView
Eastman Kodak Picture Metadata
Toolkit
![Page 7: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/7.jpg)
| 21 | nestor – Workshop | 21. Oktober 20107
Ordnung nach funktionalen Fähigkeiten
Identifikation
DROID, ImageInfo, ffident, JHOVE, ExifTool, NLNZ-MDExt, file, IrfanView, Adobe XMP
Validation
JHOVE, Adobe XMP, „XML-Validatoren“
Techn. MD Extraktion
ImageInfo, JHOVE, ExifTool, NLNZ-MDExt,IrfanView, Adobe XMP
![Page 8: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/8.jpg)
| 21 | nestor – Workshop | 21. Oktober 20108
1. Leistungsspektrumwas Metadatentools leisten können
2. Metadatentoolsund ihre Vielfalt
3. Auswahlkriteriendie Wahl des passenden Tools
4. JHOVE & Co.
Der rote Faden
![Page 9: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/9.jpg)
| 21 | nestor – Workshop | 21. Oktober 20109
Auswahlkriterien (1)
– Anforderungen an Funktionalität und Formatunterstützung
– Anforderungen an Skalierbarkeit, Performance, Robustheit , Zuverlässigkeit (qualitative Kriterien)
– Dokumentation, Verfügbarkeit (Weiterentwicklung), Support (Integrierbarkeit, Austauschbarkeit, Wartung, Anpassbarkeit bei der Entwicklung von Erweiterungen)
– Open-Source vs. proprietär (Lizenzrecht)
![Page 10: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/10.jpg)
| 21 | nestor – Workshop | 21. Oktober 201010
Auswahlkriterien (2)
– standardisierte und dokumentierte Schnittstellen
– automatisierte Verarbeitung (Stapelverarbeitung) z. B. per Kommandozeile bzw. Aufruf über Schnittstellen
– Softwarearchitektur (z. B. modularer Aufbau)
– Systemanforderungen
![Page 11: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/11.jpg)
| 21 | nestor – Workshop | 21. Oktober 201011
1. Leistungsspektrumwas Metadatentools leisten können
2. Metadatentoolsund ihre Vielfalt
3. Auswahlkriteriendie Wahl des passenden Tools
4. JHOVE & Co.
Der rote Faden
![Page 12: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/12.jpg)
| 21 | nestor – Workshop | 21. Oktober 201012
– Zusammenarbeit von Journal STORage (JSTOR) undHarvard University Library zur Format-Validation
– im Jahr 2005 veröffentlicht
– Java 1.4 (plattformunabhängig)
– Swing-basierte GUI oder Kommandozeile
– Open-Source unter LGPL
![Page 13: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/13.jpg)
| 21 | nestor – Workshop | 21. Oktober 201013
Für die Dateiformate: ASCII and UTF-8 encoded text, GIF, JPEG2000, and JPEG, and TIFF images, AIFF and WAVE audio, PDF, HTML, and XML
bietet JHOVE folgende Funktionen:
Identifikation X Validation X
Extraktion techn. MD X Checksummen X
Container-Verarbeitung O Erkennen von Beschränkungen
X (nur PDF)
Standardisierte Ausgabe(XML, z. T. unter Verwendung von Metadatenstandards)
X
![Page 14: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/14.jpg)
DROID JHOVE NLNZ
Identifies formats Yes (on basis offile extensiononly)
Yes Yes (on basis offile extensiononly)
Identifies versions Yes Yes Yes
Confirms well-formedand valid
No Yes No
Extracts technicalmetadata
No Yes Yes (limited)
Outputs xml reports Yes Yes Yes
| 21 | nestor – Workshop | 21. Oktober 201014
JHOVE im Vergleich (1)
Quelle: http://artefactual.com/wiki/index.php?title=DROID,_JHOVE,_NLNZ_Metadata_Extractor
![Page 15: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/15.jpg)
DROID JHOVE NLNZ
Office documents DBF, DOC, Lotus formats, MS Works formats, OpenOfficeformats, MDB, MPP, PDF, PPT, PST, PUB, RTF, StarOffice formats, TXT, VSD, WPD, WS andother WordStar formats, XLS (BIFF) and others
PDF, ASCII, UTF-8
DOC, MS Works formats, OpenOfficeformats, PDF, PPT, WPD, XLS
Images BMP, CDR and otherCorel formats, DWG andother AutoCad formats, DXF, EPS, GeoTIFF, GIF, JPEG, JPEG2000, PageMaker documents, PCX, PNG, PS, PSD, PSP, SWF and otherMacromedia formats, SVG, TIFF and others
GIF, JPEG, JPEG2000, TIFF
BMP, GIF, JPEG, TIFF
Sound / movingimage
AIFF, ASF, AVI, MIDI, MOV, MP3, MPG, Real Audio (RM/A), WAV and others
AIFF, WAV WAV, MP3
Markup languages GML, HTML, ODF, XML, XHTML and others
HTML, XHTML, XML
HTML, XML
| 21 | nestor – Workshop | 21. Oktober 201015
Quelle: http://artefactual.com/wiki/index.php?title=DROID,_JHOVE,_NLNZ_Metadata_Extractor
![Page 16: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/16.jpg)
| 21 | nestor – Workshop | 21. Oktober 201016
• verbessertes Datenmodell: 1 object = n files = m formatsrekursive Verarbeitung von Containern und Verzeichnissen
• neue Architektur -> nichtkompatibel zu JHOVE 1
• generalisiertes Charakterisierungskonzept (Policy-basierte Bewertungskomponente)
• Java 1.6
• verbesserte Identifikation
• Dateiformate: ICC color profile, JPEG 2000, PDF, SGML, Shapefile, TIFF, UTF-8, Wave, XML, Zip
•
•
aktuelle Beta-Version unter BSD open sourcelicense
buffered I/O
![Page 17: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/17.jpg)
| 21 | nestor – Workshop | 21. Oktober 201017
Framework
– File Information Tool Set (FITS)
ExifToolJHOVE
NLNZ MetadataExtractor DROID
ffident
file
<?xml version="1.0" encoding="UTF-8"?><fitsxmlns="http://hul.harvard.edu/ois/xml/ns/fits/fits_output" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://hul.harvard.edu/ois/xml/ns/fits/fits_output http://hul.harvard.edu/ois/xml/xsd/fits/fits_output.xsd" version="0.4.2" timestamp="9/2/10 3:41 PM"><identification><identity format="Tagged Image File Format" mimetype="image/tiff"><tool toolname="Jhove" toolversion="1.5" /><tool toolname="file utility" toolversion="5.03" /><tool toolname="Exiftool" toolversion="7.74" /><tool toolname="Droid" toolversion="3.0" /><tool toolname="NLNZ Metadata
Consolidation
FITS-Output Object
![Page 18: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/18.jpg)
| 21 | nestor – Workshop | 21. Oktober 201018
Quellen (1)
– JHOVE : http://hul.harvard.edu/jhove/index.html
– JHOVE 2: https://confluence.ucop.edu/display/JHOVE2Info/Home
– Adobe XMP:http://www.adobe.com/products/xmp/
– FITS:http://code.google.com/p/fits/
![Page 19: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/19.jpg)
| 21 | nestor – Workshop | 21. Oktober 201019
Quellen (2)
– Unix-Manpage file:http://unixhelp.ed.ac.uk/CGI/man-cgi?file
– ExifTool:http://www.sno.phy.queensu.ca/~phil/exiftool/
– NLNZ Metadata Extractor:http://meta-extractor.sourceforge.net/
– DROIDhttp://droid.sourceforge.net/
![Page 20: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/20.jpg)
| 21 | nestor – Workshop | 21. Oktober 201020
Quellen (3)
– ImageInfo:http://web.archive.org/web/20060715192746/schmidt.devlib.org/image-info/index.html
– Eastman Kodakt Picture Metadata Toolkit:http://picturemetadata.sourceforge.net/
– ffident:http://web.archive.org/web/20060715192855/schmidt.devlib.org/ffident/index.html
– IrfanView: http://www.irfanview.com/
![Page 21: Stefan Hein Tools zur Generierung technischer Metadatenfiles.dnb.de/nestor/veranstaltungen/20.10.2010/hein.pdf · PCX, PNG, PS, PSD, PSP, SWF and other ... xsi:schemaLocation="](https://reader034.vdocuments.site/reader034/viewer/2022052608/5abe28e47f8b9ad8278cd455/html5/thumbnails/21.jpg)
| 21 | nestor – Workshop | 21. Oktober 201021
Vielen Dank für Ihre Aufmerksamkeit
?