netextové objekty jako součást databáze kvalifikační prací amu
DESCRIPTION
Netextové objekty jako součást databáze kvalifikační prací AMU. Iva Horová Radim Chvála. Netextové objekty jako součást databáze kvalifikační prací AMU. Praxe tvorby dokumentů na AMU Budování repositáře Úpravy repositáře Vazby repositáře na okolí Praktická ukázka Co dál?. - PowerPoint PPT PresentationTRANSCRIPT
Horová, Chvála: Netextové objekty jako součást databáze VŠKP
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
Netextové objekty jako součást databáze kvalifikační prací AMU
Iva Horová
Radim Chvála
Horová, Chvála: Netextové objekty jako součást databáze VŠKP
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
1.Praxe tvorby dokumentů na AMU2.Budování repositáře3.Úpravy repositáře4.Vazby repositáře na okolí5.Praktická ukázka6.Co dál?
Netextové objekty jako součást databáze kvalifikační prací AMU
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
3
1. 1 Výchozí situace: na AMU jako jinde
Produkce textových i netextových materiálů
Bakalářské práceDiplomové
práceDisertační práceSeminární
práceRočníkové práceSemestrální
práceA jiné práce (výukové materiály)
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
4
Běžná situace na vysokých školách
Textová část(povinná)
Různé přílohy
NázevVedoucíOponentiAnotaceKlasifikace…….
1. 2. porovnání situace na AMU s jinými VŠ
Závěr studia – JEDNA kvalifikační práce
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
5
Situace na AMU
Textová část(povinná)
Závěr studia – „kvalifikační výkon“ tj. NĚKOLIK prací
Název VedoucíOponenti AnotaceKlasifikace…….
„Kvalifikační výkon“ 1
Různé přílohyNázev jinýVedoucí jinýOponenti jiníAnotace jináKlasifikace jináÚčinkující jiní apod.…….
„Kvalifikační výkon“ 2
Různé přílohyNázev jinýVedoucí jinýOponenti jiníAnotace jináKlasifikace jináÚčinkující jiní apod.…….
1. Výchozí situace na AMU1. 2. porovnání situace na AMU s jinými VŠ
Různé přílohy
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
6
PŘÍKLADY:• teoretická práce + scénář hry (text)• teoretická práce + film• teoretická práce + soubor fotografií• teoretická práce + role v divadel. představení• teoretická práce + interpretační výkon• teoretická práce + pedagogický výstup• teoretická práce + scénografická dokumentace
různá technická kvalitavelké objemy dat ….
Specifika závěrečných prací AMU
1. 2. porovnání situace na AMU s jinými VŠ
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
7
KOS: základní typy kvalifikačních prací:
• Teoretická tj. textová „hlavní“ práce – typ A • Hra, scénář (textová, ale ne „hlavní“) – typ B • Film, videozáznam – typ C • Interpretační výkon – typ D • Skladba – typ E
Pro každý typ: • zvláštní formulář• vytvářen SAMOSTATNÝ metadatový záznam
2. Budování repositáře:1. 2. porovnání situace na AMU s jinými VŠ
Pracovní třídění VŠKP na AMU
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
8
Vybudovat pro AMU institucionální repositář
s některými archivními funkcemi.
ZADÁNÍ:
Cílem je operativní nástroj sloužící k rychlému nalezení dokumentů a snadnému posouzení jejich
zajímavosti a dostupnosti.
Vybudovat pro zpřístupňování institucionální repositář
s některými archivními funkcemi.
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
9
• Vnější a vnitřní legislativa• Výběr zpřístupňovaných typů souborů• Výběr SW pro repositář a jeho úpravy• Workflow
2. Budování repositáře
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
10
Vnější legislativa
Zákon 111/1998, § 47b – novela požaduje zveřejňování VŠKP:
• Výnos rektora AMU č. 2/2006 o zveřejňování závěrečných prací;
• Výnos rektora AMU č. 3/2006 – Metodika zpracování, ukládání a zpřístupňování VŠKP;
• Výnos rektora AMU č. 4/2006 – Pokyn pro tvorbu a jednotnou úpravu VŠKP;
• Autorsko-právní problematika• Popisná metadata - standard MS-EVSKP (eVŠKP)• Standardy bibliografického popisu (knihovna)
2.1 Budování repositáře – legislativa
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
11
Vnitřní legislativa
Autorsko-právní problematika:
• AMU uzavírá licenční smlouvy s autory• Definováno několik stupňů• Autor přiděluje konkrétní práva ke konkrétní práci• Přiděluje práva v okamžiku odevzdávání práce ve
studijním informačním systému (KOS)• Autor má možnost zpřístupnění zamítnout – pak
budeme jen archivovat• Konkrétní přidělená práva se zobrazují i v repositáři
2.1 Budování repositáře – legislativa
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
12
Další východiska – interní zásady AMU
- Knihovní katalog je prvním místem pro uživatele- Systém musí zajišťovat:
• exporty i do knihovního katalogu• vazby z katalogu do repositáře• vyhledat informace o souvisejících dokumentech• komfort i pro „nestandardní“ uživatele
- Textová práce je „nadřazená“ i když obvykle není rozhodující pro kvalifikaci
- Hierarchie záznamů (matka, dcery)
- Dopracování metadat a bibliografického popisu
2.1 Budování repositáře – legislativa
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
13
V roce 2008 přijat systém Dspace
Výhody:• Malá finanční náročnost (open source)• Jednoduchá instalace a administrace, úpravy, lokalizace• Podpora standardů (XML, DC, METS…)• Podpora interoperability - OAI-PMH server • Podporuje volný i zabezpečovaný přístup (LDAP,…)• Výkonný vyhledávací mechanismus, i fulltext• Nejsme osamoceni, řada VŠ, (web, setkání VŠB TUO,…)
Perzistentní identifikátor - Handle
2.2 Výběr vhodného SW
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
14
Workflow metadata
• Výchozí systém pro sběr – Studijní inf. systém - KOS• Export metadat, vznik záznamu v Dspace• Přidělení perzistentního identifikátoru Handle• Export do Tinlibu• Doplnění věcného popisu v Tinlibu (předmětové
skupiny, klíčová slova,…) - knihovníci• Přidání (import) věcného popisu do Dspace
• Vystavení pro harvest (zatím pro theses.cz - MU)
2.3 Workflow
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
15
Formáty digitalizovaných dokumentů
• Textové, statické obrazové a kombinované dokumenty
• Zvukové dokumenty
• Videozáznamy
PDF/A-1a
mp3
flv, 720 x 576px D1-PAL, 1500 kbps
Plné verze netextových prací budou k dispozici na katedrách
Výběr formátů se vyvíjí - např. usnesení Vlády ČR č. 1338 ze dne 3. 11. 08
„NÁHLEDOVÉ“ FORMÁTY:
2.3 Workflow – volba formátů
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
16
Workflow plné verze (spolupráce s ČVUT)
• Převod plných „textů“ do stanovených formátů:• texty, statické obrázky – PDF/A-1a – (nutná
standardizace pro fulltextové vyhledávání) nástroj: print2pdf - S602
• Audio – mp3 – není problém• Video – FLV - problém obecně, ani AMU nemá jasno,
FAMU nechce „YouTube“ – sledujeme trendy• Nahrávání do Dspace – zatím ručně• Zpřístupnění v souladu s licenční smlouvu v Dspace
Plné verze mimo AMU nepředáváme
2.3 Workflow
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
17
• Struktura metadat• Vazby mezi souvisejícími záznamy• Extrakce pro fulltext. vyhledávání (pdf)• Další úpravy (vzhled, …)
3. Úpravy repositáře Dspace:
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
18
1. NameSpace: Dublin Core ze základní instalace
2. NameSpace: AMU – elementy chybějící do MS-EVSKP:a. Autor IDb. Datum nar. autorac. Kód katedryd. Název katedrye. ID studia, ke kterému patří prácef. Typy práce (formuláře A, B, C)
Metadatový soubor je rozšiřitelný za provozu
3.1 Úpravy Dspace – struktura metadat
DC AMU
MS eVŠKP
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
19
3.1 Úpravy Dspace – struktura metadat – přidané prvky
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
20
- Vytvořit virtuální objekt - „závěr studia“, fiktivní záznam, URI a k němu pospojovat související objekty
- Využít vztahů „nadřízená / podřízená“ práce
3.2 Úpravy Dspace – vazby mezi příbuznými záznamy
Je několik možností:
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
21
- Vytvořit virtuální objekt - „závěr studia“, fiktivní záznam, URI a k němu pospojovat související objekty
- Využít vztahů „nadřízená / podřízená“ práce „Obsahuje / Je částí“
3.2 Úpravy Dspace – vazby mezi příbuznými záznamy
Je několik možností:
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
22
Textová část (A) – NADŘÍZENÝ ZÁZNAM
– dc.relation.hasPart – „Obsahuje“
Ostatní typy (B, C) – PODŘÍZENÉ ZÁZNAMY - dc.relation.isPartOf - „Je částí“
3.2 Úpravy Dspace – vazby mezi příbuznými záznamy
Použit prvek dc.relation hasPart / isPartOfatributy
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
23
3.2 Úpravy Dspace – vazby mezi příbuznými záznamy
Textová práce (A) – nadřízený záznam
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
24
3.2 Úpravy Dspace – vazby mezi příbuznými záznamy
Ostatní práce (B, C) – podřízený záznam
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
25
3.2 Úpravy Dspace – vazby mezi příbuznými záznamy
Ostatní práce (B, C) – podřízený záznam
Dspace – browse:
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
26
3.3 Úpravy Dspace – extrakce textu pro fulltext. hledání
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
27
3.3 Úpravy Dspace – extrakce textu pro fulltext. hledání
Mediafilter: pdfBox pdfToText
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
28
3.4 Úpravy Dspace – další úpravy – vzhled, en. mutace
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
29
4. Vazby repozitáře na okolí
• Interoperabilita – OAI-PMH• Úpravy pro knihovní systém Tinlib• Možnosti vystavení metadat pro jiné
harvestory
Spolupráce s okolními systémy
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
30
4.1 interoperabilita - OAI PMH
• Dspace má vlastní server OAI (podpora protokolu OAI-PMH), který zajišťuje vystavení metadat pořízených v Dublin core
• Java plugin byl upraven aby zpracovával též přidaná metadata (MS eVSKP)
• Úprava jsou ve stabilní části kódu, nebude ovlivněna případnými dalšími upgrade
Harvest (zatím) pro „theses.cz“ (MU)
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
31
Na základě hodnoty elementu worktype<dcvalue element="worktype" qualifier="none">A</dcvalue>
Textová práce (A) – NADŘÍZENÝ ZÁZNAMMonografie
Netextová práce (B, C, …) – PODŘÍZENÝ ZÁZNAM Článek
4.2 Úpravy pro Tinlib
XML soubor získaný exportem z Dspace je konvertován technologií XML/XLST ( + procesor SAXON) na importní soubor pro Tinlib
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
32
4.3 Možnosti vystavení metadat pro jiné repozitáře (UK)
Dspace obsahuje modul pro vystavení dat ve formátu METS/MODS, kontejnerování souvisejících záznamů
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
33
4.3 Možnosti vystavení metadat pro jiné repozitáře (UK)
Dspace obsahuje modul pro vystavení dat ve formátu METS/MODS, kontejnerování souvisejících záznamů
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
34
4.3 Možnosti vystavení metadat pro jiné repozitáře (UK)
Pokus s UVT UK - DigiTool
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
35
A nyní praxe…
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
36
Studijní Informační Systém KOS
Zadání práce- katedra
Údaje o práci - student
Repozitář AMU -> Dspace
Knihovní systém knihovníci -> Tinlib
Knihovní systém čtenáři -> Tinweb
Ruční zpracování
Národní registr VŠKP„theses“ MU Brno -> veřejnost
Plný text - student
Soubor PDF/A
PLNĚNÍ ZÁZNAMŮ O VŠKP
Harvest OAI PMH
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
37
Studijní Informační Systém KOS
Zadání práce- katedra
Údaje o práci - student
Repozitář AMU -> Dspace
Knihovní systém knihovníci -> Tinlib
Knihovní systém čtenáři -> Tinweb
Ruční zpracování
Národní registr VŠKP„theses“ MU Brno -> veřejnost
Plný text - student
Soubor PDF/A
PLNĚNÍ ZÁZNAMŮ O VŠKP
Harvest OAI PMH
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
38
Studijní Informační Systém KOS
Zadání práce- katedra
Údaje o práci - student
Repozitář AMU -> Dspace
Knihovní systém knihovníci -> Tinlib
Knihovní systém čtenáři -> Tinweb
Ruční zpracování
Národní registr VŠKP„theses“ MU Brno -> veřejnost
Plný text - student
Soubor PDF/A
PLNĚNÍ ZÁZNAMŮ O VŠKP
Harvest OAI PMH
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
39
VYHLEDÁVÁNÍ ZÁZNAMŮ
Repozitář AMU
Dspace
Knihovní systém Tinweb
Vše z AMU
Národní registr VŠKP - THESES
Vše z vysokých škol
v ČR
Uživatel
Plná verze – text/náhled
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
40
VYHLEDÁVÁNÍ ZÁZNAMŮ
Repozitář AMU
Dspace
Knihovní systém Tinweb
Vše z AMU
Národní registr VŠKP - THESES
Vše z vysokých škol
v ČR
Plná verze – text/náhled
Uživatel
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
41
Prostor pro ukázky
on line…
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
42
Dále…
Ve spolupráci s Komisí eVŠKP a komunitou Dspace:- Terminologie- Archivace – technicky- Relations zapracovat do Metadatového standardu MS-
EVSKP
Komunita Dspace:- Přístupová práva – struktura- Zobrazení hierarchie záznamů
Co dále:
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
43
pro NETEXTY - PLNÉ VERZE?:• Umělecký výkon• Umělecké dílo• Praktická částapod.pro CELEK:• Kvalifikační výkon• Diplomový úkol
Bude mít o tyto záznamy zájem theses.cz ?
Terminologie
Příspěvek do diskuse
Horová, Chvála: Netextové objekty jako součást databáze VŠKP
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
Děkuji za pozornost
Dotazy?
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
45
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
46
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
47
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
48
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
49
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
50
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
51
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
52
Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009
53