Download - Miroslav Bartošek: Česká digitální matematická knihovna (Nominované projekty na Cenu PARTSIP)
Česká digitální matematická knihovna
Miroslav Bartošek
Masarykova univerzitaÚstav výpočetní techniky
M.Bartošek, 2011 DML-CZ 2
Kdyby se někomu podařilo zničit knihovny a všechny knihy, o třicet let později by žádný zámečník neuměl ani utáhnout šroub.
Thomas Alva Edison
Hromada knih ještě není knihovna, disk plný digitálních dokumentů ještě není digitální knihovna.
Anonym
Motivace
M.Bartošek, 2011 DML-CZ 5
Co je DML-CZ
M.Bartošek, 2011 DML-CZ 6
Co je DML-CZ
1. Projekt pokročilá digitalizace
grant - Informační společnost, AV ČR
2005-2009
2. Digitální knihovna špičková česká matematická literatura
fulltexty+metadata - volně dostupné
30.000 článků, 320.000 stran
2010-trvale
M.Bartošek, 2011 DML-CZ 7
1.1 Projekt: cíle
1. zkoumání/vývoj technologií OCR matematiky nástroje pro tvorbu metadat – metadatový editor
2. digitalizace časopisy, monografie, sborníky článkově orientovaná národní DML
3. začlenění do světové WDML mezinárodní standardy interoperabilita
http://project.dml.cz
M.Bartošek, 2011 DML-CZ 8
1.2 Projekt: partneři
AV – Matematický ústav vedení, autorsko-právní, uživatelské požadavky
MFF UK matematika, metadata
AV – Knihovna digitalizace
MU – FI OCR + vyhledávání matematiky, podobnost
MU – ÚVT integrace, implementace digitální knihovny provoz a rozšiřování
M.Bartošek, 2011 DML-CZ 9
2.1 Knihovna: obsah
časopisy 12 titulů (11 českých, 1 slovenský) od počátku do současnosti moving wall (0-24 měsícu) 27.000 článků, 276.000 stran, 2.443 čísel
sborníky 6 vybraných konferenčních řad (Equadiff, …) 2.390 článků, 19.000 stran, 100 svazků
monografie kolekce prací Bernarda Bolzana vybrané monografie předních matematiků 653 článků/kapitol, 10.000 stran, 44 monografií
http://dml.cz- osobnosti
M.Bartošek, 2011 DML-CZ 11
2.2 Knihovna: materiály
tištěné dokumenty 19.století – 1990 předlohy pouze v tištěné podobě klasická digitalizace
retro-born-digital 1991 – 2007 předlohy v (částečně) digitální formě různé formáty - konverze
digital-online 2008 – automatizované přebírání nových čísel do DML-CZ
M.Bartošek, 2011 DML-CZ 12
2.3 Knihovna: nabízí
320.000 stran odborných textů od 10.000 autorů plné texty článků a kapitol ve formátu PDF metadata včetně bibliografických referencí propojení článků i referencí do recenzních DB
MathSciNet + Zentralblatt MATH
procházení podle rejstříků kolekce, názvy, autoři, MSC
jednoduché i pokročilé vyhledávání v metadatech / v plných textech
podobné články
DML-CZ workflow
stránky.tiff
skenování
EuDMLMR/Zbl
Tištěnýdokument
stránková MD
1
10
příprava
2sken
časopis.xml
stránky.tiff
úpravy obrázků
stránky.pdf
stránky.txt
popis
OCR3
ocr
digitalizov.dokument(stránky)
ArchivčasopisuTeX, ps
RedakcečasopisuTeX, pdf
5born-digital
6aktuální
číslo
Metadatovýeditor
konverze články.pdf
metadata
retro-born-digital číslo
články.pdf
metadata
export DMLCZ
born-digital číslo
MR/ZBL
metadataMR/Zbl
sklízenínormalizace
4
prolinkování
editormetadat
editorreferencí
mathcorpus
DSpaceDML-CZ
NUMDAM
JSTOR
články.pdf
metadata
struktura
digitální dokument
similarities
výpočet podobností
7
8
rozšířenímetadat
archiv
9
digitálníknihovna
archivace
export MD
end-users
11
statistiky
12
http://dml.cz
integrace
metadata MR/Zbl
články
editace
© DML-CZ, 2009
M.Bartošek, 2011 DML-CZ 14
3. DML-CZ workflow
1. Příprava materiálů2. Digitalizace3. OCR4. Referenční metadata (MathSciNet, Zbl MATH)
5. Retro-born-digital6. Aktuální čísla7. Integrace, tvorba metadat8. Podobné články9. Digitální knihovna10. Archivace11. Exporty metadat do EuDML, MR/ZBL12. Statistiky využívání (Google Analytics, log DSpace)
M.Bartošek, 2011 DML-CZ 15
4. Hlavní výstupy
digitální knihovna DML-CZ
nástroje použitelné v dalších projektech Metadatový editor nadstavba DSpace/Manakin
projekt FFdigi
M.Bartošek, 2011 DML-CZ 16
Digitální knihovna
ukázky
Děkuji za pozornost