netextové objekty jako součást databáze kvalifikační prací amu

53
Horová, Chvála: Netextové objekty jako součást databáze VŠKP Brno 21. 10. 2009: Systémy pro Netextové objekty jako součást databáze kvalifikační prací AMU Iva Horová Radim Chvála

Upload: jase

Post on 21-Jan-2016

33 views

Category:

Documents


1 download

DESCRIPTION

Netextové objekty jako součást databáze kvalifikační prací AMU. Iva Horová Radim Chvála. Netextové objekty jako součást databáze kvalifikační prací AMU. Praxe tvorby dokumentů na AMU Budování repositáře Úpravy repositáře Vazby repositáře na okolí Praktická ukázka Co dál?. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Netextové objekty jako součást databáze kvalifikační prací AMU

Horová, Chvála: Netextové objekty jako součást databáze VŠKP

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

Netextové objekty jako součást databáze kvalifikační prací AMU

Iva Horová

Radim Chvála

Page 2: Netextové objekty jako součást databáze kvalifikační prací AMU

Horová, Chvála: Netextové objekty jako součást databáze VŠKP

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

1.Praxe tvorby dokumentů na AMU2.Budování repositáře3.Úpravy repositáře4.Vazby repositáře na okolí5.Praktická ukázka6.Co dál?

Netextové objekty jako součást databáze kvalifikační prací AMU

Page 3: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

3

1. 1 Výchozí situace: na AMU jako jinde

Produkce textových i netextových materiálů

Bakalářské práceDiplomové

práceDisertační práceSeminární

práceRočníkové práceSemestrální

práceA jiné práce (výukové materiály)

Page 4: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

4

Běžná situace na vysokých školách

Textová část(povinná)

Různé přílohy

NázevVedoucíOponentiAnotaceKlasifikace…….

1. 2. porovnání situace na AMU s jinými VŠ

Závěr studia – JEDNA kvalifikační práce

Page 5: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

5

Situace na AMU

Textová část(povinná)

Závěr studia – „kvalifikační výkon“ tj. NĚKOLIK prací

Název VedoucíOponenti AnotaceKlasifikace…….

„Kvalifikační výkon“ 1

Různé přílohyNázev jinýVedoucí jinýOponenti jiníAnotace jináKlasifikace jináÚčinkující jiní apod.…….

„Kvalifikační výkon“ 2

Různé přílohyNázev jinýVedoucí jinýOponenti jiníAnotace jináKlasifikace jináÚčinkující jiní apod.…….

1. Výchozí situace na AMU1. 2. porovnání situace na AMU s jinými VŠ

Různé přílohy

Page 6: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

6

PŘÍKLADY:• teoretická práce + scénář hry (text)• teoretická práce + film• teoretická práce + soubor fotografií• teoretická práce + role v divadel. představení• teoretická práce + interpretační výkon• teoretická práce + pedagogický výstup• teoretická práce + scénografická dokumentace

různá technická kvalitavelké objemy dat ….

Specifika závěrečných prací AMU

1. 2. porovnání situace na AMU s jinými VŠ

Page 7: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

7

KOS: základní typy kvalifikačních prací:

• Teoretická tj. textová „hlavní“ práce – typ A • Hra, scénář (textová, ale ne „hlavní“) – typ B • Film, videozáznam – typ C • Interpretační výkon – typ D • Skladba – typ E

Pro každý typ: • zvláštní formulář• vytvářen SAMOSTATNÝ metadatový záznam

2. Budování repositáře:1. 2. porovnání situace na AMU s jinými VŠ

Pracovní třídění VŠKP na AMU

Page 8: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

8

Vybudovat pro AMU institucionální repositář

s některými archivními funkcemi.

ZADÁNÍ:

Cílem je operativní nástroj sloužící k rychlému nalezení dokumentů a snadnému posouzení jejich

zajímavosti a dostupnosti.

Vybudovat pro zpřístupňování institucionální repositář

s některými archivními funkcemi.

Page 9: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

9

• Vnější a vnitřní legislativa• Výběr zpřístupňovaných typů souborů• Výběr SW pro repositář a jeho úpravy• Workflow

2. Budování repositáře

Page 10: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

10

Vnější legislativa

Zákon 111/1998, § 47b – novela požaduje zveřejňování VŠKP:

• Výnos rektora AMU č. 2/2006 o zveřejňování závěrečných prací;

• Výnos rektora AMU č. 3/2006 – Metodika zpracování, ukládání a zpřístupňování VŠKP;

• Výnos rektora AMU č. 4/2006 – Pokyn pro tvorbu a jednotnou úpravu VŠKP;

• Autorsko-právní problematika• Popisná metadata - standard MS-EVSKP (eVŠKP)• Standardy bibliografického popisu (knihovna)

2.1 Budování repositáře – legislativa

Page 11: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

11

Vnitřní legislativa

Autorsko-právní problematika:

• AMU uzavírá licenční smlouvy s autory• Definováno několik stupňů• Autor přiděluje konkrétní práva ke konkrétní práci• Přiděluje práva v okamžiku odevzdávání práce ve

studijním informačním systému (KOS)• Autor má možnost zpřístupnění zamítnout – pak

budeme jen archivovat• Konkrétní přidělená práva se zobrazují i v repositáři

2.1 Budování repositáře – legislativa

Page 12: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

12

Další východiska – interní zásady AMU

- Knihovní katalog je prvním místem pro uživatele- Systém musí zajišťovat:

• exporty i do knihovního katalogu• vazby z katalogu do repositáře• vyhledat informace o souvisejících dokumentech• komfort i pro „nestandardní“ uživatele

- Textová práce je „nadřazená“ i když obvykle není rozhodující pro kvalifikaci

- Hierarchie záznamů (matka, dcery)

- Dopracování metadat a bibliografického popisu

2.1 Budování repositáře – legislativa

Page 13: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

13

V roce 2008 přijat systém Dspace

Výhody:• Malá finanční náročnost (open source)• Jednoduchá instalace a administrace, úpravy, lokalizace• Podpora standardů (XML, DC, METS…)• Podpora interoperability - OAI-PMH server • Podporuje volný i zabezpečovaný přístup (LDAP,…)• Výkonný vyhledávací mechanismus, i fulltext• Nejsme osamoceni, řada VŠ, (web, setkání VŠB TUO,…)

Perzistentní identifikátor - Handle

2.2 Výběr vhodného SW

Page 14: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

14

Workflow metadata

• Výchozí systém pro sběr – Studijní inf. systém - KOS• Export metadat, vznik záznamu v Dspace• Přidělení perzistentního identifikátoru Handle• Export do Tinlibu• Doplnění věcného popisu v Tinlibu (předmětové

skupiny, klíčová slova,…) - knihovníci• Přidání (import) věcného popisu do Dspace

• Vystavení pro harvest (zatím pro theses.cz - MU)

2.3 Workflow

Page 15: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

15

Formáty digitalizovaných dokumentů

• Textové, statické obrazové a kombinované dokumenty

• Zvukové dokumenty

• Videozáznamy

PDF/A-1a

mp3

flv, 720 x 576px D1-PAL, 1500 kbps

Plné verze netextových prací budou k dispozici na katedrách

Výběr formátů se vyvíjí - např. usnesení Vlády ČR č. 1338 ze dne 3. 11. 08

„NÁHLEDOVÉ“ FORMÁTY:

2.3 Workflow – volba formátů

Page 16: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

16

Workflow plné verze (spolupráce s ČVUT)

• Převod plných „textů“ do stanovených formátů:• texty, statické obrázky – PDF/A-1a – (nutná

standardizace pro fulltextové vyhledávání) nástroj: print2pdf - S602

• Audio – mp3 – není problém• Video – FLV - problém obecně, ani AMU nemá jasno,

FAMU nechce „YouTube“ – sledujeme trendy• Nahrávání do Dspace – zatím ručně• Zpřístupnění v souladu s licenční smlouvu v Dspace

Plné verze mimo AMU nepředáváme

2.3 Workflow

Page 17: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

17

• Struktura metadat• Vazby mezi souvisejícími záznamy• Extrakce pro fulltext. vyhledávání (pdf)• Další úpravy (vzhled, …)

3. Úpravy repositáře Dspace:

Page 18: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

18

1. NameSpace: Dublin Core ze základní instalace

2. NameSpace: AMU – elementy chybějící do MS-EVSKP:a. Autor IDb. Datum nar. autorac. Kód katedryd. Název katedrye. ID studia, ke kterému patří prácef. Typy práce (formuláře A, B, C)

Metadatový soubor je rozšiřitelný za provozu

3.1 Úpravy Dspace – struktura metadat

DC AMU

MS eVŠKP

Page 19: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

19

3.1 Úpravy Dspace – struktura metadat – přidané prvky

Page 20: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

20

- Vytvořit virtuální objekt - „závěr studia“, fiktivní záznam, URI a k němu pospojovat související objekty

- Využít vztahů „nadřízená / podřízená“ práce

3.2 Úpravy Dspace – vazby mezi příbuznými záznamy

Je několik možností:

Page 21: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

21

- Vytvořit virtuální objekt - „závěr studia“, fiktivní záznam, URI a k němu pospojovat související objekty

- Využít vztahů „nadřízená / podřízená“ práce „Obsahuje / Je částí“

3.2 Úpravy Dspace – vazby mezi příbuznými záznamy

Je několik možností:

Page 22: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

22

Textová část (A) – NADŘÍZENÝ ZÁZNAM

– dc.relation.hasPart – „Obsahuje“

Ostatní typy (B, C) – PODŘÍZENÉ ZÁZNAMY - dc.relation.isPartOf - „Je částí“

3.2 Úpravy Dspace – vazby mezi příbuznými záznamy

Použit prvek dc.relation hasPart / isPartOfatributy

Page 23: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

23

3.2 Úpravy Dspace – vazby mezi příbuznými záznamy

Textová práce (A) – nadřízený záznam

Page 24: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

24

3.2 Úpravy Dspace – vazby mezi příbuznými záznamy

Ostatní práce (B, C) – podřízený záznam

Page 25: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

25

3.2 Úpravy Dspace – vazby mezi příbuznými záznamy

Ostatní práce (B, C) – podřízený záznam

Dspace – browse:

Page 26: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

26

3.3 Úpravy Dspace – extrakce textu pro fulltext. hledání

Page 27: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

27

3.3 Úpravy Dspace – extrakce textu pro fulltext. hledání

Mediafilter: pdfBox pdfToText

Page 28: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

28

3.4 Úpravy Dspace – další úpravy – vzhled, en. mutace

Page 29: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

29

4. Vazby repozitáře na okolí

• Interoperabilita – OAI-PMH• Úpravy pro knihovní systém Tinlib• Možnosti vystavení metadat pro jiné

harvestory

Spolupráce s okolními systémy

Page 30: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

30

4.1 interoperabilita - OAI PMH

• Dspace má vlastní server OAI (podpora protokolu OAI-PMH), který zajišťuje vystavení metadat pořízených v Dublin core

• Java plugin byl upraven aby zpracovával též přidaná metadata (MS eVSKP)

• Úprava jsou ve stabilní části kódu, nebude ovlivněna případnými dalšími upgrade

Harvest (zatím) pro „theses.cz“ (MU)

Page 31: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

31

Na základě hodnoty elementu worktype<dcvalue element="worktype" qualifier="none">A</dcvalue>

Textová práce (A) – NADŘÍZENÝ ZÁZNAMMonografie

Netextová práce (B, C, …) – PODŘÍZENÝ ZÁZNAM Článek

4.2 Úpravy pro Tinlib

XML soubor získaný exportem z Dspace je konvertován technologií XML/XLST ( + procesor SAXON) na importní soubor pro Tinlib

Page 32: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

32

4.3 Možnosti vystavení metadat pro jiné repozitáře (UK)

Dspace obsahuje modul pro vystavení dat ve formátu METS/MODS, kontejnerování souvisejících záznamů

Page 33: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

33

4.3 Možnosti vystavení metadat pro jiné repozitáře (UK)

Dspace obsahuje modul pro vystavení dat ve formátu METS/MODS, kontejnerování souvisejících záznamů

Page 34: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

34

4.3 Možnosti vystavení metadat pro jiné repozitáře (UK)

Pokus s UVT UK - DigiTool

Page 35: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

35

A nyní praxe…

Page 36: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

36

Studijní Informační Systém KOS

Zadání práce- katedra

Údaje o práci - student

Repozitář AMU -> Dspace

Knihovní systém knihovníci -> Tinlib

Knihovní systém čtenáři -> Tinweb

Ruční zpracování

Národní registr VŠKP„theses“ MU Brno -> veřejnost

Plný text - student

Soubor PDF/A

PLNĚNÍ ZÁZNAMŮ O VŠKP

Harvest OAI PMH

Page 37: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

37

Studijní Informační Systém KOS

Zadání práce- katedra

Údaje o práci - student

Repozitář AMU -> Dspace

Knihovní systém knihovníci -> Tinlib

Knihovní systém čtenáři -> Tinweb

Ruční zpracování

Národní registr VŠKP„theses“ MU Brno -> veřejnost

Plný text - student

Soubor PDF/A

PLNĚNÍ ZÁZNAMŮ O VŠKP

Harvest OAI PMH

Page 38: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

38

Studijní Informační Systém KOS

Zadání práce- katedra

Údaje o práci - student

Repozitář AMU -> Dspace

Knihovní systém knihovníci -> Tinlib

Knihovní systém čtenáři -> Tinweb

Ruční zpracování

Národní registr VŠKP„theses“ MU Brno -> veřejnost

Plný text - student

Soubor PDF/A

PLNĚNÍ ZÁZNAMŮ O VŠKP

Harvest OAI PMH

Page 39: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

39

VYHLEDÁVÁNÍ ZÁZNAMŮ

Repozitář AMU

Dspace

Knihovní systém Tinweb

Vše z AMU

Národní registr VŠKP - THESES

Vše z vysokých škol

v ČR

Uživatel

Plná verze – text/náhled

Page 40: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

40

VYHLEDÁVÁNÍ ZÁZNAMŮ

Repozitář AMU

Dspace

Knihovní systém Tinweb

Vše z AMU

Národní registr VŠKP - THESES

Vše z vysokých škol

v ČR

Plná verze – text/náhled

Uživatel

Page 41: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

41

Prostor pro ukázky

on line…

Page 42: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

42

Dále…

Ve spolupráci s Komisí eVŠKP a komunitou Dspace:- Terminologie- Archivace – technicky- Relations zapracovat do Metadatového standardu MS-

EVSKP

Komunita Dspace:- Přístupová práva – struktura- Zobrazení hierarchie záznamů

Co dále:

Page 43: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

43

pro NETEXTY - PLNÉ VERZE?:• Umělecký výkon• Umělecké dílo• Praktická částapod.pro CELEK:• Kvalifikační výkon• Diplomový úkol

Bude mít o tyto záznamy zájem theses.cz ?

Terminologie

Příspěvek do diskuse

Page 44: Netextové objekty jako součást databáze kvalifikační prací AMU

Horová, Chvála: Netextové objekty jako součást databáze VŠKP

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

Děkuji za pozornost

Dotazy?

[email protected]

[email protected]

Page 45: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

45

Page 46: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

46

Page 47: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

47

Page 48: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

48

Page 49: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

49

Page 50: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

50

Page 51: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

51

Page 52: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

52

Page 53: Netextové objekty jako součást databáze kvalifikační prací AMU

Brno 21. 10. 2009: Systémy pro zpřístupňování eVŠKP 2009

53