-
Lietuvos virtualaus universiteto 2007–2012 metų programa
(Patvirtinta Lietuvos Respublikos švietimo ir mokslo ministro
2007 m. balandţio 27 d. įsakymu Nr. ISAK-791)
Lietuvos mokslo ir studijų integruotos informacinės erdvės plėtros
uţdavinys
PAIEŠKOS SISTEMOS PRIMO TAIKYMO
GALIMYBĖS LIETUVOS VIRTUALIOJE BIBLIOTEKOJE
STUDIJA
(Pataisyta atsiţvelgiant į recenzentų pastabas)
KAUNAS, 2009 m. gruodis
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
2 Kaunas, 2009 m. gruodis
Studijos bendraautoriai ir jų atlikti darbai rengiant nurodytus studijos skyrius
Eil. Nr. Bendraautoriaus vardas,
pavardė
Atlikti darbai rengiant nurodytus studijos
skyrius
1. Antanas Štreimikis 1.2; 1.3; 1.4; 1.6; 1.9; 2; 3; 4
2. Andrius Blaţinskas 1.2; 2; 3
3. Lina Bloveščiūnienė 1.7; 1.9; 2; 3; 4
4. Daiva Černytė 1.4; 1.5; 1.6; 1.7; 1.9; 2; 3; 4
5. Vilija Dzingienė 1.3; 1.7; 1.9; 2; 3; 4
6. Antanas Gilaitis 1.8; 2; 3
7. Saulius Grigonis 1.2; 1.4; 1.6; 1.8; 2; 3; 4
8. Daiva Jurkšaitienė 1.7; 1.9; 2; 3; 4
9. Deividas Kančelkis 1.2; 2; 3
10. Daiva Keraitė 1.3; 1.7; 1.9; 2; 3; 4
11. Andrius Klimavičius 1.1; 1.2; 1.3; 1.4; 1.5; 1.6; 1.8; 2; 3; 4
12. Vilius Kučiukas 1.1; 1.2; 1.4; 1.6; 1.8, 1.9; 2; 3; 4
13. Mindaugas Muckus 1.8; 2; 3
14. Rytis Rudelis 1.2; 1.5; 2; 3
15. Linas Salelionis 1.8; 1.9; 2; 3; 4
16. Lina Šarlauskienė 1.7; 1.9; 2; 3; 4
17. Aleksandras Targamadzė 1.9; 2; 2.1; 3; 4
18. Gintarė Tautkevičienė 1.3; 1.7; 1.9; 2; 3; 4
19. Neringa Valytė 1.2; 1.6; 1.7; 1.9; 2; 3; 4
20. Gintautas Ţemaitis 1.5; 1.7; 1.9; 2; 3; 4
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
3 Kaunas, 2009 m. gruodis
TURINYS
Įvadas ................................................................................................................................................... 6
1. Primo galimybių taikymo išplėstoje LVB apţvalga ir apibendrinimai ........................................... 7
1.1. Primo komponentai ir jiems vykdyti reikalingi skaičiavimo resursai ....................................... 7 1.1.1. Publikavimo platforma......................................................................................................... 7 1.1.2. Indeksatorius ........................................................................................................................ 9 1.1.3. Administravimo modulis ................................................................................................... 10 1.1.4. Paieškos koordinatorius ..................................................................................................... 11
1.1.5. Paieškos agentai ................................................................................................................. 11 1.1.6. Paieškos valdiklis ............................................................................................................... 11 1.1.7. Vartotojo paieškos sąsaja ................................................................................................... 11 1.1.8. Primo duomenų bazė ......................................................................................................... 11 1.1.9. Paskirstytų sistemų principo taikymas Primo sistemoje .................................................... 11
1.1.10. Primo administravimo modulio paskirstymas ................................................................. 12 1.1.11. Vartotojo paieškos sąsajų paskirstymas ........................................................................... 13
1.1.12. PDS paskirstymas ............................................................................................................ 14
1.1.13. Apkrovos stabilizatoriaus taikymas ................................................................................. 14 1.1.14. Primo konfigūracijos perkėlimas iš testinio į produkcinį serverį .................................... 16 1.1.15. Visų konfigūravimo duomenų kopijavimas ..................................................................... 16 1.1.16. Atvaizdavimo konfigūracijų kopijavimas ........................................................................ 16
1.1.17. Atstatymas iš atsarginių duomenų kopijos ...................................................................... 17 1.1.18. Normalizavimo taisyklių rinkinių kopijavimas ............................................................... 17
1.1.19. Visos duomenų bazės kopijavimas .................................................................................. 17
1.2. Aleph, Metalib, SFX išteklių publikavimas Primo sistemai .................................................... 17 1.2.1. Aleph išteklių publikavimas .............................................................................................. 17
1.2.2. MetaLib išteklių publikavimas .......................................................................................... 20 1.2.3. SFX išteklių publikavimas ................................................................................................. 20
1.3. LABT institucijų konfigūravimas Primo sistemoje ................................................................. 21
1.3.1. Primo administracinė struktūra .......................................................................................... 21
1.3.2. Duomenų šaltiniai .............................................................................................................. 22 1.3.3. Paieškos sritys .................................................................................................................... 23 1.3.4. Ribotos paieškos sritys ....................................................................................................... 24
1.4. Aleph, MetaLib ir SFX duomenų šaltinių konfigūravimas Primo sistemoje .......................... 25
1.5. Normalizavimo taisyklės ir jų taikymas Primo sistemoje ....................................................... 26
1.5.1. Normalizuoto įrašo struktūra ............................................................................................. 26 1.5.2. Normalizavimo taisyklių rinkiniai ..................................................................................... 31 1.5.3. Normalizavimo taisyklių rinkinių sąrašas .......................................................................... 32
1.5.4. Sukurti naują rinkinį .......................................................................................................... 32 1.5.5. Redaguoti rinkinius ............................................................................................................ 32 1.5.6. Išdėstyti rinkinius (angl. deploy) ....................................................................................... 32 1.5.7. Ištrinti rinkinius .................................................................................................................. 32
1.5.8. Normalizavimo taisyklių rinkinių redagavimas ................................................................. 32 1.5.9. Vartotojo sąsaja normalizavimo taisyklėms redaguoti ...................................................... 33 1.5.10. Veiksmų ADD, OR, MERGE pavyzdys .......................................................................... 33
1.6. Publikavimo kanalų konfigūravimas, išteklių krovimas ir indeksavimas ............................... 34 1.6.1. Primo publikavimo kanalai ................................................................................................ 34 1.6.2. Primo publikavimo kanalų konfigūravimas ....................................................................... 35 1.6.3. Indeksavimas Primo sistemoje ........................................................................................... 36
1.7 Rastų išteklių pateikimo konfigūravimas Primo sistemoje ...................................................... 36
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
4 Kaunas, 2009 m. gruodis
1.7.1. Išteklių tipai ....................................................................................................................... 37 1.7.2. Riboto pateikimo sritys ...................................................................................................... 38
1.7.3. GetIt! pateikimo nuoroda ................................................................................................... 38 1.7.4. Pateikimo nuorodų konfigūravimas ................................................................................... 39
1.8. Registruotų Primo vartotojų duomenų konfigūravimas ir krovimas ....................................... 40 1.8.1. Kas yra PDS? ..................................................................................................................... 40
1.8.2. Kas nėra PDS? ................................................................................................................... 40 1.8.3. PDS darbo eiga .................................................................................................................. 41 1.8.4. Kaip veikia PDS? ............................................................................................................... 41 1.8.5. PDS katalogų struktūra ...................................................................................................... 41 1.8.6. PDS tapatumo nustatymo metodai ..................................................................................... 41
1.8.7. Vartotojų konfigūracijos vedlys ......................................................................................... 42 1.8.8. Vieningo prisijungimo konfigūravimas ............................................................................. 42 1.8.9. Naujos institucijos sukūrimas PDS sistemoje .................................................................... 43 1.8.10. Institucijos redagavimas PDS sistemoje .......................................................................... 43 1.8.11. Autentifikavimo metodo sukūrimas ................................................................................. 45
1.8.12. Autentifikavimo metodo redagavimas ............................................................................. 45 1.8.13. Autentifikavimo metodo testavimas ................................................................................ 47 1.8.14. Vartotojo atributų metodo sukūrimas .............................................................................. 47
1.8.15. Vartotojų atributų metodo redagavimas........................................................................... 48
1.8.16. Autentifikavimas LABT sistemose .................................................................................. 50 1.8.17. Integracija su Primo ......................................................................................................... 51
1.8.18. Tipinė Shibboleth funkcionavimo aplinka – vieningoji autentifikavimo sistema ........... 51 1.8.19. Vartotojo prisijungimo vardo maskavimas ...................................................................... 51
1.9. Primo vartotojo sąsajos lietuvių ir anglų kalbomis konfigūravimas ....................................... 54
1.9.1. Atvaizdavimų konfigūravimas ........................................................................................... 55 1.9.2. CSS konfigūravimas .......................................................................................................... 56
1.9.3. Teksto konfigūravimas ...................................................................................................... 57 1.9.4. Piktogramų koregavimas ................................................................................................... 57
1.9.5. Statinių HTML failų koregavimas ..................................................................................... 57 1.9.6. Pagalbos failų koregavimas ............................................................................................... 57
1.9.7. Pateikimo konfigūravimas ................................................................................................. 57
1.10 Primo galimybių taikymo išplėstoje LVB apibendrinimai ..................................................... 58
2. Virtualių bibliotekų, įdiegusių primo sistemą, gerosios patirties analizė ...................................... 60
2.1. Virtualių bibliotekų gerosios patirties analizės metodika ........................................................ 60
2.2. Virtualių bibliotekų analizės rezultatai .................................................................................... 60 2.2.1. Boston College University Libraries (JAV) ...................................................................... 61 2.2.2. British Library (JK) ........................................................................................................... 65 2.2.3. CatalogPlus (JAV) ............................................................................................................. 67 2.2.4. Curtin University of Technology. New Library Catalogue, in Development (Australija) 70
2.2.5. DiscoverLibrary. Jean and Alexander Heard Library (JAV) ............................................. 73 2.2.6. discoverE (JAV) ................................................................................................................ 76
2.2.7. E–Knowledge (Airija) ........................................................................................................ 79 2.2.8. You and your Library. Primo (Kanada) ............................................................................. 82 2.2.9. Laurier Library. Primo (Kanada) ....................................................................................... 86 2.2.10. MNCAT PLUS. Libraries of University of Minnesota (JAV) ......................................... 89 2.2.11. National Library of New Zealand (Naujoji Zelandija) .................................................... 93
2.2.12. NLB SearchPlus. Public Libraries. Singapore ................................................................. 96 2.2.13. OneSearch (Izraelis) ........................................................................................................ 99
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
5 Kaunas, 2009 m. gruodis
2.2.14. REX. The Royal Library and Copenhagen University Library Information Service
(Danija) ...................................................................................................................................... 103
2.2.15. SearchFirst (Australija) .................................................................................................. 107 2.2.16. SOLO. Search Oxford Libraries Online (JK) ................................................................ 110 2.2.17. Southampton Solent University library (JK) ................................................................. 114 2.2.18. State Library of Queensland (Australia) ........................................................................ 116
2.2.19. State Library of Victoria (Australija) ............................................................................. 120 2.2.20. The College of the Bahamas (Bahamų Sandrauga) ....................................................... 125 2.2.21. The University of Auckland Library. The Catalogue (Naujoji Zelandija) .................... 128 2.2.22. The University of Iowa Libraries (JAV) ........................................................................ 130 2.2.23. The University of Tennessee Libraries (JAV) ............................................................... 132
2.2.24. TUG Primo (Kanada) ..................................................................................................... 135 2.2.25. Universitat Mannheim. Universitatsbibliothek Mannheim. Primo (Vokietija) ............. 137 2.2.26. University of East Anglia (JK) ...................................................................................... 141 2.2.27. UEL. University of East London. Library & Learning Services (JK) ........................... 144 2.2.28. Galimi klausimai LVB vartotojui .................................................................................. 147
2.3. Rezultatų apibendrinimas ir rekomendacijos LVB tobulinimui ............................................ 148 2.3.1. Svetainės sąranka ............................................................................................................. 148 2.3.2. Paieškos kortelės .............................................................................................................. 148
2.3.3. Paieškos sritys .................................................................................................................. 149
2.3.4. Paieškos rezultatų vaizdavimas ....................................................................................... 150 2.3.5. Kiti vartotojo sąsajos elementai ....................................................................................... 150
2.3.6. Kalbų sąsajos ................................................................................................................... 150
3. Lietuvos virtualios bibliotekos panaudojamumo tyrimas ............................................................ 152
3.1. Tyrimo planavimas ir organizavimas .................................................................................... 152
3.1.1. Literatūros apţvalga ......................................................................................................... 152 3.1.2. Tyrimo metodologija ....................................................................................................... 153
3.2. Lietuvos virtualios bibliotekos panaudojamumo tyrimo rezultatų analizė ....................... 155 3.2.1. Vartotojų atsakymų analizės rezultatai ............................................................................ 155
3.2.2. Vartotojų pastabų ir pasiūlymų turinio analizės rezultatai .............................................. 167
4. Išvados ir rekomendacijos Primo sistemai išplėstoje LVB konfigūruoti .................................... 175
Literatūros sąrašas ........................................................................................................................ 176
Priedai .............................................................................................................................................. 178 1.0 priedas. Techninė specifikacija ............................................................................................ 178 1.1 priedas. Primo konfigūravimo procedūros ........................................................................... 180
1.2 priedas. Primo LABT institucijos ir bibliotekos .................................................................. 187 1.3 priedas. Primo vartotojo sąsajos vertimo fragmentas .......................................................... 197 1.4 priedas. PNX įrašo pavyzdys ............................................................................................... 200 1.5 priedas. Siūlomo sprendimo vartotojo prisijungimo vardui maskuoti programavimas ....... 202 3.1 priedas. Lietuvos virtualios bibliotekos portalo vertinimo anketa ....................................... 204
3.2–3.5 prieduose naudojami ţymėjimai ................................................................................... 210
3.2 priedas. Kintamųjų aprašomoji statistika bibliotekininkų imtyje ........................................ 210
3.3 priedas. Kintamųjų aprašomoji statistika ekspertų imtyje ................................................... 211 3.4 priedas. Kintamųjų aprašomoji statistika studentų imtyje .................................................. 212 3.5 priedas. Respondentų laikas minutėmis, praleistas susipaţinimui su LVB portalu ............. 213
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
6 Kaunas, 2009 m. gruodis
ĮVADAS
Greita ir patogi prieiga prie mokslinės informacijos kasdien tampa vis svarbesnė. Tai
aktualu tiek pradinių kursų studentui, tiek profesoriui. Lietuvoje akademinės institucijos kuria ir
prenumeruoja įvairias duomenų bazes, kuriomis gali naudotis Lietuvos ir kitų šalių mokslininkai ir
kita suinteresuota visuomenės dalis. Duomenų bazėse galima surasti bibliotekose esančius išteklius,
mokslinių ţurnalų straipsnius, monografijas, disertacijas, baigiamuosius magistrantūros studentų
darbus ir kitus dokumentus ar tų dokumentų bibliografinius aprašus. Informacijos paieška duomenų
bazėse labai patogi ir greita, tačiau esant dideliam duomenų bazių skaičiui, visuomenei sudėtinga
suţinoti apie visas naudingas duomenų bazes, atlikti informacijos paiešką kiekvienoje duomenų
bazėje uţima gana daug laiko. Dėl šių prieţasčių kuriamos ir diegiamos integruotos paieškos
įvairiose duomenų bazėse galimybės. Šiam tikslui Lietuvoje buvo teikiamos paslaugos Lietuvos
virtualios bibliotekos portale (http://www.lvb.lt), naudojančiame MetaLib sistemą, tačiau jame
nebuvo išplėtotų informacijos paieškos, rezultatų pateikimo ir kitų galimybių vartotojams. Norint
patenkinti augančius informacijos vartotojų poreikius, suteikti galimybę aiškiai mokslinių rezultatų
sklaidai ir panaudai, pradėtos diegti Primo sistemos galimybės Lietuvos virtualioje bibliotekoje.
Šios studijos objektas − paieškos ir pateikimo sistemos Primo (toliau – Primo arba Primo
sistema) galimybių analizė, demonstravimas ir taikymas išplėstoje Lietuvos virtualioje bibliotekoje
(LVB), veikiančioje plačiai pasaulyje paplitusių produktų MetaLib, SFX ir Primo pagrindu.
Studija skirta atsakingiems uţ LVB plėtrą, diegiantiems Primo sistemą ir galintiems
tobulinti LVB portalą pagal studijos rekomendacijas, taip pat visiems Lietuvos akademinių
bibliotekų tinklo (LABT) akademinės bendruomenės nariams, norintiems įsigilinti į Primo sistemos
pritaikymo Lietuvos vartotojams galimybes, konfigūravimo priemones ir procesus.
Studijos tikslas − išanalizuoti ir apibendrinti Primo galimybes, jų taikymą išplėstoje LVB,
uţsienio bibliotekose ir, vadovaujantis ekspertų bei kitų tikslinės grupės atstovų apklausos
rezultatais, suformuoti rekomendacijas Primo sistemai išplėstoje LVB konfigūruoti.
Primo skirta surasti ir pateikti vartotojams informaciją apie spausdintus ir skaitmeninius
informacijos šaltinius, neatsiţvelgiant į jų formatą ir saugojimo vietą. Primo gali pateikti paţangius
aukštos kokybės paieškos rezultatus, pagrįstus metaduomenimis, kuriuos surenka iš integruotų
bibliotekų sistemų ar kitų interneto paieškos bei pateikimo sistemų ir juos tinkamai indeksuoja.
Primo sistemoje iš principo galima nustatyti tuos pačius e. išteklius (LABT bibliotekų katalogus,
uţsienio katalogus, prenumeruojamas mokslines duomenų bazes ir pan.) ir taikyti jiems tuos pačius
paieškos kriterijus kaip ir MetaLib sistemoje. Tačiau Primo iš esmės skiriasi nuo MetaLib, nes gali
formuoti taip vadinamų lokalių bei kitų e. išteklių bendrą indeksą, kuris kokybiškai pagreitina
paiešką ir suteikia vartotojui galimybę iš tikrųjų dirbti vieno langelio principu, taikomu Google
stiliaus sistemose. Primo nepakeičia MetaLib, kuri naudojama atlikti paiešką nutolusiuose
e. ištekliuose, pavyzdţiu, prenumeruojamose mokslinėse duomenų bazėse. Todėl įdiegus Primo, ji
veiks kartu su anksčiau LABT bendruomenei įsigytais ir įdiegtais MetaLib bei SFX ir tokiu būdu
gerokai išplės dabartinės LVB teikiamas paieškos galimybes LABT vartotojams. Primo turi
išplėtotas surastų išteklių, esančių bibliotekų fonduose ar internete, pateikimo galimybes. Jei su
Primo dirbama svečio teisėmis, tokiu atveju e. paslaugų tiekiama maţiau. Prie Primo galima
prisijungti registruotu vartotoju, naudojant tuos pačius identifikavimo kodus, kaip ir jungiantis prie
LABT integralios bibliotekų sistemos Aleph.
Primo jau anksčiau yra įsigiję ir įdiegę tokios garsios pasaulyje institucijos, kaip British
Library (Jungtinė Karalystė), The Royal Library (Danija) ir kiti. Primo suteikia daug paieškos ir
rezultatų pateikimo galimybių, tačiau jas reikia ne tik įdiegti, bet ir tinkamai sukonfigūruoti,
atsiţvelgiant į LABT naudojamus informacijos išteklius, duomenų bazes, vartotojų poreikius. Šiam
tikslui pasiekti buvo atlikta Primo sistemos galimybių analizė, ekspertinė Primo taikymo pasaulio
virtualiose bibliotekose gerosios patirties analizė ir šių rezultatų lyginamoji analizė su testuojamo
LVB portalo funkcijomis, atlikta tikslinių vartotojų grupių anketinė apklausa ir suformuotos
rekomendacijos Primo sistemai išplėstoje LVB konfigūruoti.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
7 Kaunas, 2009 m. gruodis
1. PRIMO GALIMYBIŲ TAIKYMO IŠPLĖSTOJE LVB APŢVALGA IR
APIBENDRINIMAI
Šis skyrius parengtas naudojantis Ex Libris kompanijos išleista dokumentacija [1-6] ir
LABT Primo ekspertų praktine patirtimi.
1.1. PRIMO KOMPONENTAI IR JIEMS VYKDYTI REIKALINGI SKAIČIAVIMO
RESURSAI
Primo - tai universalus sprendimas, skirtas spausdintiems ir skaitmeniniams informacijos
šaltiniams rasti ir pateikti, nepaisant jų formato ir saugojimo vietos.
Primo siūlo kokybiškus paieškos rezultatus, pagrįstus egzistuojančiais metaduomenimis.
Primo gali palengvinti egzemplioriaus pateikimą iš bibliotekos arba nedelsiant suteikti prieigą prie
skaitmeninės kopijos.
Primo - tai naršyklės sąsaja paremtas sprendimas, kuris veikia UNIX operacinėje sistemoje.
Primo turi integruotą publikavimo platformą, kuri apdoroja metaduomenims (toliau – duomenis),
pateiktus įvairiais standartiniais formatais (MARC 21, UNIMARC, MAB, Dublic Core) ir perveda
juos į kvalifikuotą, suindeksuotą informaciją, saugomą PNX (angl. Primo Normalized XML)
formatu. Duomenų šaltinio apdorojimą atlieka publikavimo kanalai (angl. Publishing Pipes), kurie
supranta įvairius bibliotekų išteklių metaduomenų standartus. Paieškos variklis gali greitai ir
lengvai surasti PNX įrašuose esančią informaciją.
Primo sudaro šie komponentai:
Publikavimo platforma (angl. Publishing Platform);
Indeksatorius (angl. Indexer);
Administravimo modulis (angl. Back Office);
Paieškos koordinatorius (angl. Search Federator);
Paieškos agentai (angl. Search Agents);
Paieškos variklis (angl. Search Engine);
Vartotojo paieškos sąsaja (angl. Front End);
Duomenų bazė (angl. Database).
Primo komponentai ir jų tarpusavio ryšiai pateikti 1.1.1 pav.
1.1.1. Publikavimo platforma
Publikavimo platforma leidţia apjungti didelę įvairovę institucijos išteklių, įskaitant
spausdintas kolekcijas, skaitmenines talpyklas ir e. resursus. Publikavimo platforma valdo duomenų
surinkimą ir jų transformavimą į kokybišką indeksuotą informaciją, saugomą PNX formate, kurią
Primo paieškos variklis gali greitai ir efektyviai surasti iš įvairių duomenų šaltinių.
Primo gali surinkti ir normalizuoti standartiniame XML formate bet kokius metaduomenis.
Standartiniai duomenų formatai, pvz., MARC 21, MAB ir Dublin Core, turi integruotus
normalizavimo šablonus. Šablonai gali būti adaptuoti Primo diegimo metu. Publikavimo kanalai
atpaţįsta įvairius duomenų formatus ir atlieka duomenų šaltinių apdorojimą.
Publikavimo platforma atlieka šias funkcijas:
Sumanus duomenų surinkimas naudojant FTP (angl. File Transfer Protocol), failų kopijavimą ar OAI (angl. Open Archives Initiative) protokolą.
Duomenų transformavimas į PNX formatą ir saugojimas Primo duomenų bazėje – normalizavimas.
Duomenų praturtinimas (angl. Enrichment), remiantis algoritmais ir išorine informacija.
Dubliuotos informacijas apdorojimas (angl. De-duplication).
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
8 Kaunas, 2009 m. gruodis
Grupavimo procesas, kurio metu sistema atlieką įrašų grupavimą pagal FRBR (angl. Functional Requirements for Bibliographic Records) standartą.
Darbuotas
Galutinis
vartotojas
Primo
administravimo
modulis
Publikavimo
platforma
Primo vartotojo paieškos sąsaja
ir
paieškos programa
Aleph
Digitool
Voyager
KitiPrimo
duomenų
bazė
Paieškos agentas Paieškos agentasPaieškos agentas
IndeksatoriusIndekso
dalis
IndeksatoriusIndekso
dalis
IndeksatoriusIndekso
dalis
Paieškos
valdiklis
Paieškos
koordinatorius
Duomenų šaltiniai
Paieškos variklis
1.1.1 pav. Primo komponentai ir jų tarpusavio ryšiai
Normalizavimo šablonai ir duomenų praturtinimas konfigūruojami naudojant Primo
administravimo modulį. Leidybos platforma palaiko reguliarų ir nenumatytą duomenų surinkimą ir
skirtingų duomenų formatų apdorojimą, leidţia interaktyvų vykdomų darbų stebėjimą ir valdymą.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
9 Kaunas, 2009 m. gruodis
1.1.2. Indeksatorius
Indeksatorius yra paieškos variklio dalis naudojama indeksų dalims kurti. Paieškos variklis
palaiko kelias paieškos duomenų dalis. Indeksų dalinimas yra efektyvus būdas išskirstyti, lygias
pagal dydį, atminties dalis. Indeksatorius automatiškai susikeičia su paieškos mašinomis taip, kad
indeksų dalys gali būti gaminamos nenutrūkstamai.
Indeksatorius padalina faktinius duomenis į valdomas dalis, kurios uţkraunamos į atmintį.
Kiekvienai daliai skirta atskira programinė gija (angl. thread). Kelios dalys gali būti toje pačiame
serveryje, taip, kad visi jo procesoriai būtų išnaudojami efektyviai. Sistemai galima naudoti kelis
serverius tam, kad ji nebūtų apribota uţimamos vietos atţvilgiu.
1.1.2 paveiksle pateiktas Primo sistemos indeksavimo procesas.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
10 Kaunas, 2009 m. gruodis
1.1.2 pav. Primo sistemos indeksavimo procesas
1.1.3. Administravimo modulis
Administravimo modulis su lengvai naudojama jo grafine sąsaja leidţia konfigūruoti ir stebėti
visus Primo komponentus.
Primo sistemos gyvavimo ciklas skirstomas į:
pradinę konfigūraciją,
nuolatinę prieţiūrą.
Taip pat galima individualiai konfigūruoti sistemos elementus naudojant tam skirtus vedlius.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
11 Kaunas, 2009 m. gruodis
1.1.4. Paieškos koordinatorius
Koordinuoja paiešką, pasitelkdamas indeksų dalis ir apjungia paieškos rezultatus į vieningą
rezultatų rinkinį.
1.1.5. Paieškos agentai
Paieškos agentai išdėstyti nutolusiose mašinose. Šie agentai stabdo ir paleidţia paiešką ir
indeksavimo procesą. Agentui pasileidus, jis išsiunčia prisiregistravimo duomenis paieškos
koordinatoriui. Agentai su koordinatoriumi komunikuoja naudodami Java RMI (angl. Remote
Method Invocation) protokolą.
1.1.6. Paieškos valdiklis
Paieškos valdiklis išrenka bibliotekos metaduomenis iš vietinės Primo PNX duomenų bazės
lentelės ir transformuoja ją į naudingą informaciją. Paieškos variklis paremtas Lucene technologija.
Jis praplečia Lucene funkcionalumą, palaiko atminties dalijimą labai dideliems duomenų
rinkiniams. Šias atminties dalis paruošia indeksuotojas. Taip pat paieškos varikliui priskiriamos šios
funkcijos: rezultatų filtravimas, pasiūlymai patobulinti paiešką (angl.did u mean), puslapiavimas,
rezultatų rikiavimas.
1.1.7. Vartotojo paieškos sąsaja
Vartotojo paieškos sąsaja atsakinga uţ Primo sąveiką su galutiniu vartotoju. Tai galingas ir
lengvai naudojamas paieškos įrankis. Kiekviena institucija gali turėti jai pritaikytą atvaizdavimą.
Kiekvienas atvaizdavimas gali turėti vieną ar daugiau kortelių. Kortelės leidţia padalinti Primo
saugyklas (talpyklas) ir įrašus į grupes ar tipus. Kortelėje galima aprašyti kelias paieškos sritis. Šios
sritys sugrupuoja įrašus.
Galutinis vartotojas, naudodamasis vartotojo sąsaja, atlieka paiešką Primo PNX duomenų
bazės lentelėje. Primo, naudodamasis surastais įrašais, patikrina prieinamumo prie resurso statusą
šaltinio sistemoje (pvz., Aleph) ir sąveikauja su šaltinio sistema tam, kad galėtų pateikti daugiau
informacijos vartotojui apie išteklių.
1.1.3 paveiksle pavaizduotas paieškos procesas.
1.1.8. Primo duomenų bazė
Primo duomenų bazė naudoja Oracle 10 RDBVS, kurioje saugoma:
Primo PNX įrašai ir vartotojo pateikta informacija (atsiliepimai, ţymės);
stebėjimo informacija, statistika, detali paieškų informacija ir pan.;
Primo konfigūracijos informacija.
1.1.9. Paskirstytų sistemų principo taikymas Primo sistemoje
Primo sistemą galima fiziškai išskaidyti į tokias dalis:
Publikavimo platforma ir administravimo modulis, veikiantis JBoss aplikacijų serveryje.
Vartotojo sąsaja ir paieškos valdikliai, veikiantys JBoss aplikacijų serveryje.
Paieškos agentai (įskaitant indeksatorius), veikiantys RMI serveryje.
Indeksų dalys, veikiančios RMI serveryje.
Primo duomenų bazė, esanti Oracle serveryje.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
12 Kaunas, 2009 m. gruodis
1.1.3 pav. Primo paieškos procesas
Primo programinė įranga turi keturis skirtingus procesus (du JBoss serveriai, RMI serveris,
Oracle serveris). Šie procesai gali būti paleisti skirtingose serveriuose ar tame pačiame serveryje,
bei vieni − viename, kiti − kitame. Rekomenduojama turėti Oracle ir JBoss – publikavimo
platformą ir Administravimo modulį viename serveryje, ir JBoss – vartotojo sąsajai bei RMI serverį
paieškai kitame serveryje. 1.1.4 paveiksle pavaizduota fizinis sistemos vaizdas.
1.1.4 pav. Primo sistemos fizinis vaizdas
1.1.10. Primo administravimo modulio paskirstymas
Diegiant Primo galima sukonfigūruoti keletą administravimo modulio instaliacijų. Tik
vienas modulis yra aktyvus sistemos veikimo metu. Jei aktyvaus modulio darbas sutrinka, šį modulį
galima pakeisti kitu. Tokiu atveju, kitą (neaktyvų) modulį reikia paleisti rankiniu būdu, nes
dabartinė Primo versija (2.1.7) dar neturi galimybės automatiškai aptikti administravimo modulio
sutrikimų ir į juos reaguoti.
Konfigūruojant keletą administravimo modulių reikėtų atsiţvelgti šį tokius dalykus:
Tik vienas administravimo modulis yra aktyvus sistemos veikimo metu, visi kiti privalo būti išjungti.
Norint išvengti daugybės administravimo modulio nustatymų rankiniu būdu, visi jie turi būti susieti su ta pačia duomenų baze naudojant apkrovos stabilizatorių (ţiūr. skyrelį
Apkrovos stabilizatoriaus taikymas). Jei apkrovos stabilizatorius nenaudojamas, tuomet
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
13 Kaunas, 2009 m. gruodis
rankiniu būdu reikia atlikti susijusius su atitinkamo modulio mašinos adresu tokius
nustatymus:
pds_url, pds_configuration_url, Reports URL, Help Base URL, reporting_base, primo_admin_base, primo_base ir Search Statistics Report URL.
Visi administravimo moduliai turi dalintis tuo pačiu katalogu, kuriame saugoma publikavimo kanalų informacija.
Norint uţtikrinti, kad tik vienintelis administravimo modulis būtų aktyvus ir veikiantis, paleidimo paprogramėje reikia atlikti tokius nustatymus:
patikrinti, ar kiti serveriai yra pasiekiami, bei paleisti jų išjungimo scenarijus; patikrinti, ar nėra prisijungimų prie kitų administravimo modulių prievadų; patikrinti, ar nėra paleidimo valdymo failo bendrame publikavimo kanalų kataloge.
1.1.11. Vartotojo paieškos sąsajų paskirstymas
Norint sumaţinti skaičiavimo apkrovas, kurias gali sukelti intensyvus akademinės
bendruomenės naudojimasis Primo vartotojo paieškos sąsaja, galima įdiegti keletą vartotojų sąsajos
serverių. Įmanomi šie vartotojo (paieškos) sąsajos diegimo variantai:
Keletas vartotojo sąsajų serverių ir vienas paieškos valdiklis (Daug-su-vienu konfigūracija).
Keletas vartotojo sąsajų serverių ir keletas paieškos valdiklių (Daug-su-daug konfigūracija).
Daug-su-vienu konfigūracijoje (1.1.5 pav.), kiekviena vartotojo paieškos sąsaja turi tą pačią
paieškos variklio konfigūraciją. Viena iš vartotojo paieškos sąsajų yra vadinama pagrindine, kuri
gauna nurodymus iš administravimo modulio ir atlieka agentų stebėjimą. Kitos sąsajos vadinamos
valdomosiomis ir vykdo komandas gautas iš pagrindinės sąsajos.
1.1.5 pav. Daug-su-vienu konfigūracijos architektūra
Daug-su-daug konfigūracijoje paskirstoma paieškų apkrova skirtingose paieškos varikliuose
(1.1.6 pav.), tai sumaţina sistemos neveikimo laiką esant sutrikimams.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
14 Kaunas, 2009 m. gruodis
1.1.6 pav. Daug-su-daug konfigūracijos architektūra
Paleidus administravimo modulį, jis patikrina ar pagrindinė vartotojo paieškos sąsaja yra
paleista. Jei ji nepaleista (ar neveikia, dėl klaidos), sistema apie tai pranešimu ţurnale ir periodiškai,
pvz., kas 30 sekundţių, tikrina, kol ji bus paleista. Kai pagrindinė sąsaja paleista, administravimo
modulis pasiima valdomųjų sąsajų sąrašą. Sutrikus pagrindinės sąsajos darbui, administravimo
modulis atsitiktiniu būdu atrenka vieną valdomąją sąsają, kuriai priskiriamos pagrindinės sąsajos
funkcijos.
1.1.12. PDS paskirstymas
Analogiškai administravimo moduliui, galima įdiegti keletą PDS (angl. Patron Directory
services) paslaugų. Vienu metu gali veikti tik viena PDS paslauga. Konfigūravimo gairės keletui
PDS:
Visi PDS serveriai turi būti sukonfigūruoti naudojant administravimo modulio specialų vedlį.
Visi PDS serveriai turi naudoti tą patį veikiančio PDS serverio adresą.
Vienu metu vienintelis PDS serveris gali būti aktyvus.
Visi vartotojo sąsajos serveriai turi būti perkrauti atlikus PDS nustatymus per administravimo
modulį.
1.1.13. Apkrovos stabilizatoriaus taikymas
Turint keletą vartotojo paieškos sąsajų konfigūracijų, vadinamų Primo MFE (angl. Multiple
Front End), naudojamas apkrovos stabilizatorius. Jis taikomas, kuomet yra Primo N+1 serverių su
klaidos toleravimo technologija. Tipinę Primo MFE konfigūraciją sudaro dvi vartotojo paieškos
sąsajos. Kaip vyksta stabilizatoriaus darbas įvykus gedimui paieškos sąsajose, pateikiama 1.1.7,
1.1.8 ir 1.1.9 paveiksluose.
Bet kuri iš Primo vartotojo paieškos sąsajų gali būti pašalinta iš stabilizatoriui priklausančios
grupės prieţiūros tikslais. Pastaroji grupė turi būti perkonfigūruota tam, kad apkrovos stabilizatorius
nustotų siųsti uţklausas, pašalintam serveriui. Rekomenduojama pašalinti sąsają tik tada, kai nėra
aktyvių sesijų veikiančiame serveryje. Atitinkamai, jei norima pridėti serverį, reikia įtraukti jį į
grupę.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
15 Kaunas, 2009 m. gruodis
1.1.7 pav. Sistemos veikimas be sutrikimų
1.1.8 pav. Sistema veikimas įvykus vartotojo sąsajos 1 gedimui
1.1.9 pav. Sistemos veikimas sutvarkius vartotojo sąsajos 1 gedimą
Apkrovos stabilizatorius vykstant vieno vartotojo sesijai, nukreipia vartotojus pagal jo IP
adresą į tą patį serverį. Vartotojų uţklausų apkrova paskirstoma pagal serverių galią. Jei du serveriai
turi tą pačią galią, jiems paskiriama po pusę visų vartotojų sesijų.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
16 Kaunas, 2009 m. gruodis
1.1.14. Primo konfigūracijos perkėlimas iš testinio į produkcinį serverį
Primo turi galimybę kopijuoti visus konfigūravimo duomenis, tokius kaip normalizavimo
taisyklių rinkiniai, suderinimo lentelės, vidinės pusės nustatymai ar kodų lentelės iš vienos Primo
instaliacijos į kitą. Tai paprastai daroma reguliaraus diegimo proceso metu pereinant nuo testinio
instaliavimo prie produkcinio instaliavimo.
Tam yra parengti reikalingi importavimo ir eksportavimo scenarijai, leidţiantys atskirai
kopijuoti šiuos duomenis: normalizavimo taisyklių rinkinius, atvaizdavimo nustatymus ir visą
duomenų bazę.
Toliau apibūdinamos tokios procedūros:
Visų konfigūravimo duomenų kopijavimas;
Atvaizdavimo konfigūravimo duomenų kopijavimas;
Normalizavimo taisyklių rinkinių kopijavimas;
Visos duomenų bazės kopijavimas.
1.1.15. Visų konfigūravimo duomenų kopijavimas
Norint išeksportuoti/importuoti visą Primo konfigūraciją, reikia atlikti:
visų konfigūravimo lentelių ir konfigūravimo failų eksportavimą ir pakavimą testinėje aplinkoje;
importuoti visas konfigūravimo lenteles ir konfigūravimo failus produkcinėje aplinkoje.
Prieš importavimą jo scenarijai patikrina, ar produkcinė instaliacija turi tos pačios versijos
atnaujinimų paketus kaip ir testinė instaliacija. Prieš pradedant importavimą, visos egzistuojančios
konfigūravimo lentelės yra ištrinamos.
Procedūros eksportuoja ir importuoja šią informaciją:
Oracle duomenų bazėje esančias lenteles (ţiūr. 1.1 priedą);
Visus duomenis iš konfigūravimo failų, esančių kataloguose: o /exlibris/primo/p_/ng/primo/home/system/thirdparty/openserver/server/sear
ch/deploy/primo_library-app.ear/primo_library-libweb.war/
o css/ o help/ o images/ o static_htmls/
Visus su PDS konfigūravimu susijusius duomenis iš: o /exlibris/primo/p_/pds/conf_table
Visų konfigūravimo duomenų kopijavimo procedūra pateikta 1.1 priede.
1.1.16. Atvaizdavimo konfigūracijų kopijavimas
Atvaizdavimo konfigūracijos, apima šią informaciją:
Atvaizdavimo konfigūracijos suderinimo ir kodų lenteles, susijusias su atvaizdavimu.
Duomenis iš konfigūravimo failų, esančių vidiniuose
/exlibris/primo/p_/ng/primo/home/system/thirdparty/openserver/server/search/
deploy/primo_library‐app.ear/primo_library‐libweb.war kataloguose: o css/ o help/ o images/
o static_htmls/
Prieš importuojant atvaizdavimus, specialūs scenarijai sukuria atsargines atvaizdavimų ir
susijusių lentelių kopijas, įvykdo patikrinimo procedūras, kurios uţtikrina, kad atvaizdavimai bus
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
17 Kaunas, 2009 m. gruodis
funkcionalūs naujoje aplinkoje. Taip pat patikrina, ar produkcinė instaliacija turi tos pačios versijos
atnaujinimų paketus kaip ir testinė instaliacija.
Atvaizdavimai yra susiję su daugybe kitų elementų, įskaitant institucijas ir sritis – šie
elementai nėra eksportuojami. Importavimo programa patikrina, ar institucijos ir sritys
produkciniame serveryje yra tokios pačios kaip ir testiniame.
Atvaizdavimo konfigūravimo duomenų kopijavimo procedūra pateikta 1.1 priede.
1.1.17. Atstatymas iš atsarginių duomenų kopijos
Prieš importuojant atvaizdavimą, importavimo/eksportavimo scenarijai sukuria atsargines
egzistuojančių atvaizdavimų ir susijusių lentelių kopijas.
Atvaizdavimų atsarginės kopijos failas yra išsaugomas $primo_dev/prm00/files kataloge
naudojant tokį formatą:
views_tables_import_backup..export.gz_aa
Atstatymo iš atsarginių duomenų kopijos procedūra pateikta 1.1 priede.
1.1.18. Normalizavimo taisyklių rinkinių kopijavimas
Primo turi specialius scenarijus, kurie naudojami normalizavimo taisyklių rinkinių
kopijavimui iš testinio serverio į produkcinį serverį.
Šie scenarijai eksportuoja visus normalizavimo taisyklių rinkinius arba pasirinktus
normalizavimo taisyklių rinkinius ir suderinimo lenteles iš „normalizavimo“ posistemės.
Eksportavimui/importavimui vykdyti naudojamos tokios procedūros:
export_nm_config.sh
import_nm_config.sh
Čia yra taisyklių rinkinio pavadinimas, o katalogas, kurį sukuria
export_nm_config procedūra. Detali veiksmų seka pateikiama 1.1 priede.
1.1.19. Visos duomenų bazės kopijavimas
Visą duomenų bazę galima nukopijuoti naudojant /exlibris/primo/p_/primo/proc
kataloge esančias procedūras (scenarijus):
exp_c_g_conf.csh
exp_schema.csh
imp_schema.csh
Prieš atliekant šias procedūras, rekomenduojama pasikonsultuoti su Ex Libris programinės
įrangos palaikymo skyriumi. Detali veiksmų seka pateikiama 1.1 priede.
1.2. ALEPH, METALIB, SFX IŠTEKLIŲ PUBLIKAVIMAS PRIMO SISTEMAI
1.2.1. Aleph išteklių publikavimas
Integralioje bibliotekos sistemoje Aleph yra numatyti du išteklių (bibliografinių bibliotekėlių)
publikavimo būdai:
pradinis (angl. initial) publikavimas,
tęstinis (angl. ongoing) publikavimas.
Pradinis publikavimas yra skirtas visų ištekliuje esančių bibliografinių įrašų publikavimui, o
tęstinis publikavimo procesas skirtas publikuoti tik tuos bibliografinius įrašus kurie buvo
atnaujinti/pasikeitė po pradinio publikavimo. Aleph sistemoje esančių išteklių publikavimo, į Primo
paieškos sistemą, procesai yra šie:
Publikuojamų išteklių aibių saugyklos konfigūravimas;
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
18 Kaunas, 2009 m. gruodis
Bibliografinių bibliotekėlių publikavimo aibių ir bibliografinių įrašų papildymo (angl. expand) autoritetiniais ir administraciniais duomenimis konfigūravimas;
Saugyklos aibių uţpildymas duomenimis ir publikavimas: o Pradinis (angl. initial) aibių publikavimas; o Tęstinis aibių pildymas ir publikavimas.
1.2.1.2. Publikuojamų išteklių aibių saugyklos konfigūravimas
Publikuojamų išteklių saugykla konfigūruojama sukuriant specialią Oracle duomenų bazės
lentelę Z00P (joje yra saugojami visų publikuotų išteklių aibės), kuri yra sukuriama LBT00 (Aleph
vartotojų bibliotekėlė). Svarbu atsiţvelgti į numatytų publikuoti bibliografinių duomenų dydį, ir
numatyti pakankamai vietos kuriant Oracle duomenų bazės lentelę.
1.2.1.3. Bibliografinių bibliotekėlių publikavimo aibių ir bibliografinių įrašų papildymo
(enrichment/expand) autoritetiniais ir administraciniais duomenimis konfigūravimas
Bibliografinių bibliotekėlių publikavimo aibės konfigūruojamos suteikiant bibliografinei
bibliotekėlei publikuojamos aibės pavadinimą (aibės pavadinimas turi būti unikalus), nustatyti
procedūras reikalingas bibliografinių įrašų papildymo autoritetiniais ir administraciniais
duomenimis (jos aprašomos kitame konfigūraciniame faile tab_expand, todėl nurodomas
identifikatorius esantis tame faile) ir nustatyti konfigūruojamos aibės saugyklos formatą.
Publikuojamos aibės konfigūracijos parametrai saugomi tab_publish faile: ! 1 2 3 4 5
!!!!!!!!!!!!!!!!!!!!-!!!!!!!!!!!!!!!!!!!!-!-!!!!!-!!!!!!!!!!!!!!!
KMU01 N FULL MARC_XML
Pirmas stulpelis nurodo publikuojamos aibės pavadinimą, antrame stulpelyje galima nurodyti
loginę bazę jei tokia yra nustatyta ištekliuje, ketvirtame stulpelyje nurodoma bibliografinių įrašų
papildymo procedūrų identifikatorius, kuris aprašytas tab_expand faile, penktajame stulpelyje
nurodoma išteklių saugykloje saugomos aibės formatas.
tab_expand faile nustatoma, kokios bibliografinio įrašo papildymo procedūros bus
naudojamos įrašant bibliografinį įrašą į publikuojamų išteklių saugyklą: ! 1 2 3
!!!!!!!!!!-!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!-!!!!!!!!!!!!!!!!!!!!!!!!!!!!!>
FULL expand_doc_bib_avail
FULL expand_doc_bib_accref_1
Pirmame stulpelyje nurodomas bibliografinių įrašų papildymo procedūrų identifikatorius,
antrajame stulpelyje nurodomas vykdomos procedūros pavadinimas, trečiajame stulpelyje nurodomi
parametrai, jei tokie yra, kurie perduodami vykdomai procedūrai.
1.2.1.4. Išteklių saugyklos aibių uţpildymas duomenimis ir publikavimas
Išteklių saugyklos aibės uţpildomos atliekant pradinį publikavimą, kuris yra vykdomas vieną
kartą ir vykdant tęstinio publikavimo procedūras (šios procedūros yra vykdomos foniniu reţimu).
Pradiniam išteklių saugyklos aibių uţpildymui naudojama Aleph p_publish_04 procedūra. Ši
procedūra turi būti vykdoma tiek kartų, kiek yra numatytų publikuoti išteklių aibių. LABT projekto
rėmuose Aleph serveryje yra sukurtas ir įdiegtas scenarijus (angl. script) labt_publish_full,
automatizuojantis pradinį visų išteklių saugyklos aibių uţpildymo procesą.
1.2.1.5. Pradinis išteklių saugyklos publikavimas
Pradiniam publikavimui naudojama Aleph p_publish_06 procedūra. Ši procedūra skirta
publikuotų aibių turiniui (įrašams) išsaugoti archyvuose (suspaustame UNIX archyvo failo formate
– tar.gz) , kiekvieną įrašą išsaugant atskiruose failuose esančiuose tame archyve. Pradiniame
publikavime ši procedūra taip pat turi būti vykdoma tiek kartų, kiek yra numatytų publikuoti
išteklių aibių. LABT projekto rėmuose sukurtame scenarijuje labt_publish_full numatytas šios
procedūros vykdymas kiekvienam iš numatytų publikuoti įrašų aibių.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
19 Kaunas, 2009 m. gruodis
1.2.1.6. Tęstinis išteklių saugyklos aibių pildymas ir publikavimas
Tęstinis aibių pildymas ir publikavimas skirtas bibliografinių įrašų, kurie buvo
atnaujinti/pakeisti, atnaujinimui išteklių saugyklos aibėse ir publikavimui. Atnaujinti/pasikeitę
bibliografiniai įrašai yra registruojami ir atnaujinami išteklių saugyklos aibėse naudojant Aleph
ue_21 procedūrą, kuri yra vykdoma kiekvienam publikuotam ištekliui (ši procedūra yra paleidţiama
po pradinio publikavimo ir yra vykdoma, kol ją sustabdo Aleph sistemos
administratorius/bibliotekininkas ar vykdant p_publish_04 procedūrą. Tęstinis publikavimas
atliekamas vykdant Aleph p_publish_06 procedūrą tam tikrais nustatytais laiko tarpais. LABT
projekto rėmuose Aleph serveryje automatizuojant tęstinį publikavimą, yra sukurtas ir įdiegtas
scenarijus labt_check_publish. Skirtingai nuo pradinio publikavimo, tęstinis publikavimas
suformuoja archyvą tik iš atnaujintų/pasikeitusių įrašų.
Aleph sistemoje publikuojami ištekliai (2009-12-10 duomenys):
LABT institucija/projektas Išteklius (Aleph
bibliotekėlė)
Aibės pavadinimas
išteklių saugykloje
Publikuotų
įrašų kiekis
eLABa-ETD projektas ETD01 ETD01 11927
eLABa projektas ELB01 ELB01 3849
HSM projektas HSM01 HSM01 121
LIT projektas LIT01 LIT01 20739
LABT LBT02 LBT02 36381
Kolegijos KOL01 KOL01 53588
Kauno technologijos universitetas
KTU01 KTU01 93456
KPI01 KPI01 16082
KTU02 KTU02 37114
KTU03 KTU03 650
Kauno medicinos universitetas KMU01 KMU01 38433
KMU02 KMU02 72332
Vadybos ir ekonomikos universitetas ISM01 ISM01 4048
ISM02 ISM02 328
Klaipėdos universitetas KUB01 KUB01 104493
KUB02 KUB02 5943
Generolo Jono Ţemaičio Lietuvos
karo akademija
LKA01 LKA01 13457
LKA02 LKA02 71
Lietuvos kūno kultūros akademija LKK01 LKK01 11231
LKK02 LKK02 4211
Lietuvos muzikos ir teatro akademija LMT01 LMT01 21178
Lietuvos veterinarijos akademija LVA01 LVA01 12738
LVA02 LVA02 2078
Lietuvos ţemės ūkio universitetas
LZU01 LZU01 27325
LZU02 LZU02 23720
LZU03 LZU03 3
Lietuvos mokslų akademijos
biblioteka
MAB01 MAB01 214361
MAB03 MAB03 2956
MAB04 MAB04 56372
MAB05 MAB05 32818
Mokslo institutai
MIB01 MIB01 61585
MIB03 MIB03 292
MIB04 MIB04 65
MIB05 MIB05 40
Mykolo Romerio universitetas MRU01 MRU01 42400
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
20 Kaunas, 2009 m. gruodis
MRU02 MRU02 5790
Šiaulių universitetas SUB01 SUB01 69480
SUB02 SUB02 6234
Vilniaus dailės akademija VDA01 VDA01 22289
Vytauto Didţiojo universitetas
VDU01 VDU01 80124
VDU02 VDU02 7383
VDU03 VDU03 5174
VDU04 VDU04 365
VDU05 VDU05 4326
VDU06 VDU06 7
Vilniaus Gedimino technikos
universitetas
VGT01 VGT01 71477
VGT02 VGT02 19733
VGT03 VGT03 10286
VGT04 VGT04 4964
VGT05 VGT05 25230
Vilniaus pedagoginis universitetas
VPU01 VPU01 74626
VPU02 VPU02 7009
VPU03 VPU03 3167
Vilniaus universitetas
VUB01 VUB01 389381
VU301 VU301 2386
VUB02 VUB02 34609
VUB03 VUB03 4573
VUB05 VUB05 11560
VUB06 VUB06 2505
VUB07 VUB07 12230
Springer SPR01 SPR01 9373
Viso publikuotų įrašų 1910666
1.2.2. MetaLib išteklių publikavimas
Primo gali naudoti LVB komponentą, veikiantį MetaLib programinės įrangos pagrindu,
atliekant informacijos paiešką unifikuotoje formoje iš įvairių bibliotekinės paskirties informacijos
sistemų ir duomenų bazių (prenumeruojamų ir laisvai prieinamų) on-line (nutolusiu) būdu. Primo,
naudodama MetaLib, vykdo paiešką LVB paieškos aibėje (angl. quick-set), kurioje nurodyti
išoriniai ištekliai. Ši paieška vykdoma lygiagrečiai (paieška vykdoma visuose paieškos aibėje
nurodytuose ištekliuose vienu metu).
Kiekvienai paieškos aibei turi būti suteiktas pavadinimas (kodas), atitinkantis institucijos,
aprašytos MetaLib konfigūracijoje, kodą. Ši sąlyga uţtikrina Primo paiešką išoriniuose ištekliuose.
MetaLib CKB (angl. Central Knowledge Base) publikavimui skirtos procedūros neturi
tęstinio publikavimo galimybės. MetaLib CKB yra visada visa publikuojama. Publikavimo procesai
yra vykdomi inicijuojant juos per MetaLib valdymo sąsają. Prieš uţkraunant publikuotą MetaLib
CKB į Primo, jau esami duomenys turi būti ištrinti.
1.2.3. SFX išteklių publikavimas
Primo gali naudoti MARC 21 įrašus, kuriuose aprašomi SFX KB (angl. Knowledge Base)
saugojami e. ţurnalų (angl. e-journal) ir e. knygų (angl. e-books) ištekliai. Šie įrašai turi būti
publikuojami su papildoma informacija, apimančia aktyvius (naudojamus) visateksčių (angl. Full-
text) ţurnalų ir knygų išteklius. Šių įrašų publikavimui naudojama speciali SFX vidinė
procedūra/programa SFX2Primo, leidţianti publikuoti visus aktyvius išteklius aprašančius įrašus,
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
21 Kaunas, 2009 m. gruodis
esančius SFX KB, pradiniam (angl. initial) publikavimui arba naujus/atnaujintus išteklius,
aprašančius įrašus tęstiniam (angl. ongoing) publikavimui.
1.3. LABT INSTITUCIJŲ KONFIGŪRAVIMAS PRIMO SISTEMOJE
1.3.1. Primo administracinė struktūra
Vieną Primo įdiegimą gali naudoti viena institucija arba kelios institucijos, sudarančios
konsorciumą. Keletas konsorciumų gali sudaryti superkonsorciumą. Primo institucija yra
pagrindinis administracinis Primo vienetas. Institucija taip pat yra pagrindinis vienetas išteklių
pateikimo atţvilgiu. Vienas Primo portalas gali turėti daug duomenų pateikimo sistemų ir Primo
turi turėti informaciją, į kurią pateikimo sistemą nukreipti vartotoją. Pvz., Primo gali nukreipti
vartotoją į specifinį SFX įdiegimą arba į integruotos bibliotekų sistemos (pvz., Aleph) serverį.
Primo institucijas galima prilyginti „plytoms“ – jas galima įvairiai dėlioti tam, kad patenkinti
įvairius poreikius.
Kiekviena institucija turi ribotą IP adresų skaičių. Vartotojas yra priskirtas vienai Primo
institucijai, kuri nustatoma pagal vartotojo prisijungimo vardą per PDS paslaugas. Jei vartotojas
neprisijungęs, Primo bando nustatyti instituciją iš vartotojo IP adreso. Jei to padaryti negalima,
Primo nukreipia vartotoją į iš anksto nustatytą instituciją.
Institucija turi ne tik vietinius, bet ir nutolusius išteklius. Primo vykdo nutolusių išteklių
paiešką per MetaLib.
Institucija gali turėti daug bibliotekų ir/arba talpyklų. Primo biblioteka yra smulkesnis
institucijos padalinys, kuriam priklauso fiziniai ištekliai. Išteklius Primo sistemoje yra aprašomas
normalizuotu Primo įrašu (angl. Primo Normalized XML) (PNX). Kiekviena biblioteka turi
priklausyti vienai institucijai.
Jei yra daugelio institucijų Primo portalas, reikia apsvarstyti, ar nebūtų tikslinga nurodyti taip
vadinamą centrinę instituciją tokiais atvejais:
1. Yra vienas Primo atvaizdavimas, kuris priklauso visoms institucijoms arba konsorciumo
centrinei administracijai. Kiekvienas atvaizdavimas turi būti susietas su numatyta institucija,
kuri gali būti viena iš junginį sudarančių institucijų arba centrinė institucija.
2. Egzistuoja duomenų šaltinis, kuris priskiriamas keletui ar visoms institucijoms.
Vartotojai yra priskirti institucijoms tinklo narėms, o ne centrinei institucijai. Ribotos
paieškos sritys ir pateikimo sritys nustatomos tik institucijoms – konsorciumo narėms (toliau –
institucijoms narėms), kadangi jos yra vartotojų institucijos.
Apsibrėţus institucijos administracinę struktūrą, Primo sistemoje ji sukonfigūruojama
naudojant Pradinį konfigūravimo vedlį (angl. Initial Configuration Wizard).
LABT struktūroje aukščiausias hierarchijos laiptelis yra Lietuvos akademinių bibliotekų
tinklas LABT. Atlikus pradinį konfigūravimą, LABT Primo įdiegime išskirta 19 institucijų, kurios
turi savo bibliotekas.
1.2 priede pateikiamos LABT institucijos, 1.3 priede pateikiamos institucijų bibliotekos.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
22 Kaunas, 2009 m. gruodis
Nacionalinis
katalogas
1 Konsorciumas 1 Konsorciumas 1 Konsorciumas
1 Universitetas1 Universitetas1 Universitetas
Centrinė
biblioteka
Skaitmeninė
talpykla
Farmacijos
biblioteka
Superkonsorciumas
Konsorciumas
Primo institucija
Primo bibliotekos
1.3.1 pav. Primo administracinė struktūra
1.3.2. Duomenų šaltiniai
Primo duomenų bazėje gali būti duomenys iš daugelio šaltinių. Pvz., galima įtraukti
bibliografinius ir fondų duomenis iš LABT bibliotekų informacijos sistemų (BIS), veikiančių
integruotos bibliotekų sistemos Aleph pagrindu, skaitmeninius ir elektroninius išteklius iš
skaitmeninės talpyklos ir nutolusius išteklius.
Diegiant Primo reikia nustatyti esamus ir planuojamus duomenų šaltinius LABT institucijoje,
kurių duomenys bus pateikiami Primo sistemai. Tam, kad efektyviai vykdyti išteklių paieškos ir
pateikimo funkcijas, Primo surenka duomenis ir transformuoja juos į paprastą arba praturtintą įrašą
PNX formatu.
Kadangi visi įrašai iš duomenų šaltinių paprastai yra surenkami ir apdorojami pradinio
duomenų įkėlimo metu, o duomenų gali būti labai daug ir siekiant taupyti perkėlimo laiką, Primo
kūrėjai (kompanija Ex Libris) rekomenduoja kopijuoti iš Primo serverio lokalaus disko. Atlikus
pradinę migraciją, vėliau surenkami tik nauji, atnaujinti ir ištrinti įrašai.
Visi informaciniai laukai, įtraukiami į kiekvieną PNX įrašą, turi būti randami viename
duomenų šaltinio įraše, kurį galima identifikuoti unikaliu identifikatoriumi. Todėl bet kokia
informacija, kuri yra įrašuose, susijusiuose su pagrindiniu įrašu, turi būti prijungta prie pagrindinio
įrašo.
Pvz., kai fondų informacija yra saugoma viename ar keliuose įrašuose, susijusiuose su
pagrindiniu bibliografiniu įrašu, šią fondų informaciją reikės prijungti prie bibliografinio įrašo.
Kai duomenys gaunami iš Aleph, visa atitinkama informacija apie fondus ir prieinamumą
prijungiama prie bibliografinių įrašų specialia programa. Autoritetinių duomenų bazių informacija
prijungiama naudojant kitą specialią programą.
Kiekvieno duomenų šaltinio įrašo struktūra turi atitikti vieną iš standartinių formatų:
MARCXML;
MARC Exchange format (ISO 2709);
Dublin Code XML.
PNX įraše gali būti ir nestandartinių laukų.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
23 Kaunas, 2009 m. gruodis
1.3.3. Paieškos sritys
Paieškos srityje grupuojami įrašai tam, kad būtų ieškoma tik juose. Paieškos sritis gali būti
dviejų tipų: vietinių ir nutolusių išteklių.
Vietinių išteklių paieškos sritis – Primo talpyklos poaibis (tai analogiška Aleph loginei bazei). Pradiniuose nustatymuose vietiniai ištekliai apima visą Primo talpyklą. Vienas
Primo įrašas gali priklausyti kelioms vietinėms paieškos sritims.
Daugeliui institucijų papildomos paieškos sritys gali būti nereikalingos. Kai Primo diegiamas
konsorciumuose, kiekviena institucija gali turėti savo atskiras paieškos sritis, kuriose yra tik tos
institucijos ištekliai. Be to, bendra sritis apims visos talpyklos išteklius.
Skaitmeninė talpykla Skaitmeninė talpykla
Bibliotekos
katalogas
Bibliotekos
katalogas
A institucija B institucija
Konsorciumo
katalogas
Primo talpykla
1.3.2. pav. Vietinių išteklių paieškos sritys
Nutolusių išteklių paieškos sritys – nutolusių įrašų išteklių poaibis. Nutolusių išteklių sritis sudaroma iš MetaLib Quick Sets, t. y. nutolusių išteklių sąrašų, kurie
sukonfigūruojami pagal specifines vartotojų grupes. Rasti ištekliai yra konvertuojami į
PNX įrašus ir pateikiami per Primo sistemą.
Pvz., konsorciumas, kuriame yra trys institucijos, gali turėti skirtingą atvaizdavimą kiekvienai
institucijai arba galima nuspręsti, kad norima turėti keturis atvaizdavimus – po vieną kiekvienai
institucijai ir vieną bendrą. Atskirai institucijai iš anksto numatytos sritys yra šios: institucijos
vietinių išteklių komplektas (institucijos katalogas, specialieji institucijos katalogai, publikacijos ir
kt.), papildomi bendri konsorciumo ištekliai, kuriais dalijasi visos konsorciumo institucijos, ir
nutolę ištekliai, kuriuos sudaro MetaLib Quick Sets sąrašas.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
24 Kaunas, 2009 m. gruodis
Vartotojai
Institucija
Bibliotekos katalogas
Skaitmeninė talpykla
SFX
Publikacijos
2. Nutolusių išteklių paieška ir
pateikimas
MetaLib
1. Pateikimas
1.3.3 pav. Institucijos išteklių schema
1.3.4. Ribotos paieškos sritys
Ribotos paieškos sritys – tai ribotos paieškos sritys specifiniams vartotojams. Tik vartotojai,
kuriems suteikti įgaliojimai perţiūrėti ribotos prieigos įrašus, galės juose atlikti paiešką ir jos
rezultatus matyti per Primo. Pvz., paieškos sritį „Rankraščiai“ galima apriboti, kad joje ieškoti ir
matyti rezultatus galėtų tik absolventai.
Apriboti galima tokius parametrus:
„Institucija“ – prieiga prie išteklių leidţiama tik tam tikros institucijos vartotojams.
„Vartotojų grupė“ – prieiga prie išteklių leidţiama tik tam tikroms vartotojų grupėms. Viena iš grupių gali būti „ne svečias“, tai reiškia, kad vartotojas nebūtinai turi
priklausyti tam tikrai grupei, bet jis turi prisijungti prie sistemos.
„Universiteto intranetas/ne universiteto intranetas“ leidţia prieigą prie išteklių pagal tai, ar vartotojas jungiasi iš universiteto intraneto – t. y. ar vartotojo IP adresas priklauso
institucijai.
Įvairiai nustatant šiuos parametrus, galima nustatyti norimą prieigos statusą, pvz., kad
universiteto vartotojai prenumeruojamos duomenų bazės išteklius galėtų gauti tik jungdamiesi iš
universiteto intraneto.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
25 Kaunas, 2009 m. gruodis
Skaitmeninė
talpyklaSkaitmeninė
talpykla
Bibliotekos
katalogas
Bibliotekos
katalogas
A institucija B institucija
Primo
talpykla
Apribota paieškos sritisPaieškos sritis
1.3.4. pav. Ribotos paieškos sritys
1.4. ALEPH, METALIB IR SFX DUOMENŲ ŠALTINIŲ KONFIGŪRAVIMAS
PRIMO SISTEMOJE
Primo gali surinkti duomenis iš Aleph, MetaLib, SFX ir kitų sistemų.
Aleph atveju, duomenys yra surenkami panaudojant Aleph publikavimo mechanizmą.
Pastarasis yra teikiamas nuo Aleph 16 versijos. Šis mechanizmas suteikia galimybę Aleph sistemoje
paskirstytus duomenis pateikti Primo priimtinu būdu (vieno objekto, pvz., leidinio) duomenis
viename įraše, pridedant OAI-PMH antraštę ir pan.
Prenumeruojamoms duomenų bazėms įtraukti į Primo, yra galimybė surinkti IRD (angl.
Information Resource Description) įrašus iš MetaLib sistemos. MetaLib sistema tuo tikslu (nuo
MetaLib 4 versijos) turi specialią duomenų eksportavimo galimybę. MetaLib atveju nėra galimas
tęstinis surinkimas ir kaskart pateikus duomenų uţklausą yra gaunamas pilnas duomenų rinkinys.
Tam, kad uţtikrinti duomenų suderinamumą tarp Primo ir MetaLib sistemų, prieš vykdant naujų
duomenų įkėlimą, reikia išvalyti „senus“ Primo duomenis. Primo sistema duomenis iš MetaLib gali
surinkti ir paieškos metu, todėl juos nebūtina saugoti Primo sistemoje. Surenkant duomenis
paieškos metu, juos reikia papildomai apdoroti, todėl paieškos trukmė gali gerokai išaugti ir tuo
sukelti nepatogumų galutiniam vartotojui.
SFX atveju, duomenų pateikimui kitoms sistemoms yra naudojama specialiai tam sudaryta
programa SFX2Primo, kuri suteikia galimybę išeksportuoti tiek visus duomenis pradiniam įkėlimui,
tiek ir po pradinio įkėlimo laike pakitusius duomenis tęstiniam duomenų surinkimui. SFX tokiu
būdu gali pateikti duomenis apie e. ţurnalus ir e. knygas. Pastebėsime, jog dabartinė SFX versija 3
automatiškai neprideda Primo sistemai reikalingų OAI-PMH antraščių kiekviename įrašo faile,
todėl tokiai antraštei suformuoti reikia panaudoti specialiai tam skirtą XSL (angl. Extensible
Stylesheet Language) transformaciją (SFXOAI.xsl).
Duomenų šaltinių konfigūravimas prasideda nuo institucijų sąrašo sudarymo.
Institucija yra apibrėţiama nurodant jos pavadinimą, kodą, aprašymą ir, jei reikia, kitą su
MetaLib, SFX ir Aleph sistemomis susijusią informaciją.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
26 Kaunas, 2009 m. gruodis
1.4.1 pav. Institucijų konfigūravimo lango fragmentas
Nustačius institucijas, kuriami duomenų šaltiniai. Tam yra nurodomas šaltinio pavadinimas,
aprašymas, pateikiamų duomenų formatas (arba tiesiog XML jei duomenys struktūrizuoti paprastu
XML), šaltinio sistema, institucija (sukurta prieš tai), XSL transformacijos failas (jei reikia) ir kita
informacija.
1.4.2 pav. Duomenų šaltinio konfigūravimo lango fragmentas
Parinkus duomenų šaltinius, galima kurti publikavimo kanalus, kurie ir atlieka visą reikiamą
duomenų surinkimą iš išorinių publikavimo sistemų.
1.5. NORMALIZAVIMO TAISYKLĖS IR JŲ TAIKYMAS PRIMO SISTEMOJE
1.5.1. Normalizuoto įrašo struktūra
PNX įrašas yra struktūrizuotas, kur kiekviena sekcija turi savo paskirtį. Duomenys gali
dubliuotis, tačiau duomenų manipuliavimui Primo tikslams tai suteikia lankstumo.
PNX struktūra:
Control – ši sekcija apima duomenis, naudojamus kontrolės tikslams. Control sekcijos turinys (sąrašas):
o sourceid – šaltinio ID. Identifikuoja Primo šaltinio saugyklą (talpyklą). Kiekviena šaltinio saugykla turi konfigūracijos failą, kuriame uţfiksuota sourceid ir kita šaltinio
saugyklos informacija.
o originalsourced – pradinio šaltinio ID. Šaltinio sistemoje identifikuoja šaltinio saugyklą. Tai nėra tas pats, kas šaltinio saugyklos identifikatorius Primo sistemoje
(pvz., USM01).
o sourcerecorid – šaltinio įrašo ID. Identifikuoja įrašą šaltinio saugykloje (taip kaip Aleph sistemos numeris pateiktas MARC 21 tag 001). Šis ID privalo būti unikalus ir
nuolatinis (pastovus) šaltinio saugykloje. sourcerecordid yra pateikiamas iš OAI-
PMH antraštės (angl. header).
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
27 Kaunas, 2009 m. gruodis
o addsrcrecordid – papildomo šaltinio įrašo ID. o recordid – įrašo ID. Primo saugyklos unikalus įrašo identifikatorius. recordid
sukuriamas apjungiant sourceid ir sourcerecordid (pvz., Aleph sistemos numeris +
tag 001).
o sourcetype – šaltinio tipas. Kol kas jis nenaudojamas. o sourceformat – šaltinio formatas. Identifikuoja šaltinio įrašo pradinį formatą, kaip,
pvz., MARC 21, Dublin Core, MAB2 ir pan.
o sourcesystem – šaltinio sistema. Identifikuoja šaltinio saugyklos naudojamą sistemą, kaip, pvz., Aleph, MetaLib, SFX ir pan.
o recordtype – įrašo tipas. Kol kas jis nenaudojamas. o lastmodified – paskutinės modifikacijos data. Kol kas jis nenaudojamas.
Display – ši sekcija saugo duomenis naudojamus vartotojo sąsajos vaizdavimo formatams. Šioje sekcijoje naudojamų duomenų bazė yra Dublin Core elementų
rinkinys. Dublin Core buvo pasirinktas kaip metaduomenų standartas, kuris skirtas
palaikyti plačiam tikslų ir išteklių tipų diapazonui. Kai kuriais atvejais, Dublin Core
elementų pavadinimai buvo modifikuoti ir papildyti tam tikru skaičiumi papildomų
laukų. PNX Link laukas apima duomenis grįstus nuorodos tipu:
o Statinis – Link laukas saugo URL. Statiniam URL gali prireikti kelių institucijos, kuriai priklauso ir teksto atvaizdavimo, atributų. Šie atributai yra paţymėti polaukio
skyrikliais, pvz.,$$uURL$$dDisplay text$$iInstitution).
o Suplanuotas (sukurtas, dinaminis) – šie URL yra sukurti iš šablonų, kurie apibrėţti Primo administraciniame modulyje. Link laukas turi URL šablono kodą, šablono
(savininko) vietos ir institucijos duomenis (jei keletas to paties tipo laukų yra pridėti
skirtingoms institucijoms).
Display sekciją sudaro tokie laukai:
o type; o source; o title; o vertitle; o unititle; o creator; o contributor; o description; o edition; o format; o identifier; o language; o publisher; o creationdate; o subject; o coverage; o relation; o ispartof; o rights; o availlibrary; o availinstitution; o availpnx; o userreview; o userrank.
Links – ši sekcija kaupia nuorodas (ryšius, sąsajas), kurios gali būti panaudotos GetIt! funkcijos kūrimui ir/arba įrašo vaizdavimo nuorodų kūrimui (pvz., nuoroda į turinio
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
28 Kaunas, 2009 m. gruodis
lentelę). Link sekcija apima keletą laukų, iš kurių kiekvienas simbolizuoja Primo
funkciją. Šią sekciją sudaro tokie laukai:
o openurl; o openurlfullt; o openurlservice; o linktoholdings; o linktorequest; o backlink; o linktorsrc; o linktotoc; o linktoabstract; o linktoreview; o linktoprice; o linktoextract; o thumbnail; o linktofindingaid; o linktouc; o additionallinks.
Search – ši sekcija saugo duomenis (įskaitant metaduomenis ir pilnus duomenis [full-text]), kurie buvo suindeksuoti paieškos metu. Šią sekciją sudaro tokie laukai:
o Creatorcontrib; o title; o alttitle; o addtitle; o description; o subject; o isbn; o issn; o fulltext; o toc; o rsrctype; o creationdate; o usertag; o recordtype; o sourceid; o recorded; o general; o addsrcrecordid; o searchscope; o ressearscope; o scope; o pnxtype; o matched; o frbrid; o syndetics_fulltext; o syndetics_toc.
Facets – ši sekcija naudojama aspektinio (angl. faceted) naršymo vartotojo sąsajoje sukūrimui. Aspektai skirti padėti vartotojui tikslinti rezultatus (rezultatų sąrašą). Vienas
įrašas gali turėti daugelį aspektų tipų. Šią sekciją sudaro tokie laukai:
o rsrctype; o language; o creatorcontrib;
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
29 Kaunas, 2009 m. gruodis
o topic; o genre, classificationlcc, classificationddc, classificationudc; o classificationrvk; o creationdate; o format; o filesize; o collection; o library; o toplevel; o prefilter; o related; o pnxdate.
Sort – laukai šioje sekcijoje gali būti naudojami kaip pagrindas rezultatų rūšiavimui. Šią sekciją sudaro tokie laukai:
o Creation Date; o Popularity; o Title.
Duplicate Record Detection – dublikatų aptikimo ar atitikimo (matching) procesas, kuris yra grindţiamas kiekvieno PNX įrašo dublikato šalinimo vektoriaus kūrimu Primo
duomenų bazėje. Vektorius apima visus duomenis, reikalingus dublikatų aptikimo
algoritmui, kuriuo metu nustatoma ar du įrašai yra ekvivalentūs.
Dubliuotiems įrašams priskiriami tie patys matchID. Kiekvienai dubliuotų įrašų grupei,
dublikatų šalinimo procesas sukuria sulietą įrašą. Paieškos mašina nuskaito ir
indeksuoja tiktai sulietus įrašus.
Dublikatų šalinimo vektorius yra sukuriamas normalizavimo proceso metu. Dubliuoto
įrašo aptikimas yra atskiras procesas, vykdomas po to, kai įrašai yra uţkraunami į Primo
duomenų bazę. Dubliuotos informacijos įrašo turinys:
o Control section – dauguma laukų sulieti. o Display section – source ir availlibrary laukai yra sulieti; availinstitution ir availpnx
laukai yra perskaičiuoti.
o Links section – visi laukai sulieti, besidubliuojantys laukai yra pašalinti. o Search section – visi laukai sulieti, besidubliuojantys laukai yra pašalinti. o Sort section – imama tik iš pageidautinų (from preferred) laukų. o Facets section – visi laukai sulieti, besidubliuojantys laukai yra pašalinti. o Dedup section – nėra svarbus (neaktualus). o FRBR section – visi laukai sulieti, besidubliuojantys laukai yra pašalinti. o Delivery section – visi laukai sulieti. o Ranking section – imamas didţiausią reikšmę turintis įrašas. o Enrichment section – nėra svarbus (neaktualus). o Additional data section – visi laukai sulieti, besidubliuojantys laukai yra pašalinti.
FRBR – grupavimo procesas, kurio metu sistema atlieką įrašų grupavimą pagal FRBR standartą. Grupavimo procesas paremtas kiekvieno įrašo vektoriaus kūrimu. Vektorius
apima vieną ar kelis raktus, kurių pagalba identifikuojama grupė. Įrašai, kurie turi
atitikimo raktą, yra dedami į FRBR grupę ir paţymimi grupės ID (FrbrID). Kiekvienas
įrašas gali priklausyti tik vienai grupei. Todėl, kai tik įrašas yra priderintas (angl.
matched) prie egzistuojančios grupės, Primo šiam įrašui nutraukia grupavimo procesą.
Vartotojo paieškos sąsajoje Primo dinamiškai iš grupės parinks vieną įrašą, kuris bus
vaizduojamas kaip bendras rezultatų sąrašas – tai yra „pageidautinas“ įrašas.
Pageidautinas įrašas rezultatų sąraše turi aukščiausią reitingą (įvertinimą).
FRBR sekcija turi FRBR vektorių. Vektorius turi dvi dalis:
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
30 Kaunas, 2009 m. gruodis
o Type (T) – tipas gali būti naudojamas įrašų rinkinio grupavimui pagal FRBR standartą, naudojant skirtingus FRBR algoritmus.
o Keys (Kn) – raktas yra sukurtas iš specifinio įrašo šaltinio lauko, pagal kurį galima nustatyti grupę, kuriai priklauso šis įrašas. Raktai yra tikrinami pradedant K1 raktu.
Duomenys privalo būti normalizuoti.
Delivery – ši sekcija apima informaciją, kuri reikalinga (rezultatų) pateikimui (pateikimo valdymui). Primo naudojamas institucinių (angl. institutional) išteklių
radimui ir pateikimui. Iš principo, Primo teikia pateikimo paslaugas susiejant vartotojus
su kitomis programomis, pvz., Aleph – uţklausų išdėstymui, skaitmeninė talpykla –
skaitmeninių objektų perţiūrai. Prieiga prie tokių išteklių yra kontroliuojama vietinės
programos, bet ne Primo. Tačiau Primo turi informaciją apie elemento tinkamumą ir
bando pateikti ryšį (sąsają) į geriausią galimą pateikimo parinktį (GetIt! funkcija). Šią
sekciją sudaro tokie laukai:
o institution; o delcategory; o resdelscope; o fulltext.
Ranking – ši sekcija apima du „spartintojo“ (angl. booster) laukus, kurie gali būti panaudoti pagreitintam įrašų klasifikavimui (rikiavimui). Šią sekciją sudaro tokie
laukai:
o Booster1; o Booster2.
Enrichment – ši sekcija apima duomenis, kurie reikalingi rezultatų gerinimo (praturtinimo) procese. Pastarojo proceso rezultatai nėra kaupiami šioje sekcijoje, bet
yra kaupiami viename iš tokių laukų: Display, Search, Facets arba Links. Šią sekciją
sudaro tokie laukai:
o classificationlcc, classificationddc, classificationudc, classificationrvk; o fulltext; o toc; o abstract; o review; o availability; o rankparentchild; o ranknocopies; o rankdatefirstcopy; o ranknoloans.
Additional Data – ši sekcija susideda iš duomenų elementų, kurie reikalingi kai kurioms Primo funkcijoms ir kurių negalima išgauti iš kitų PNX sekcijų. Šią sekciją sudaro tokie
laukai:
o Author last; o Author first; o Author initials; o Author first initial; o Author middle initial; o Author suffix; o Author; o Author; o Corporate author; o Additional author; o Series author; o Book title;
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
31 Kaunas, 2009 m. gruodis
o Article title; o Journal title; o Short title; o Additional title; o Series title; o Date; o RISDate; o Additional Date; o Volume; o Issue; o Part; o Season; o Quarter; o Start page; o End page; o Pages; o Article number; o ISSN; o eISSN; o ISBN; o DOI; o CODEN; o SICI; o Metadata format; o Genre; o RISType; o RISType; o Abstract; o City of Publication; o Publisher; o Miscellaneous1; o Miscellaneous2; o Miscellaneous3; o URL; o Additional ID; o Object ID; o OCLC ID; o Local fields 1-5.
1.5.2. Normalizavimo taisyklių rinkiniai
Normalizavimo taisyklių rinkinys apibrėţia kaip specifinių duomenų šaltinis ar šaltinių grupė
turi būti konvertuojama iš šaltinio formato į Primo normalizuotą XML įrašą – „PNX“. Primo turi
keletą šablonų suderinimo rinkinių, kuriuos galima naudoti publikavimo kanalų rinkinių kūrimui.
Šiuo metu yra prieinami tokie šablonai:
o Generic MARC; o Generic Dublin Core; o ALEPH MARC; o ALEPH MAB; o Voyager MARC; o DigiTool – Dublin Core; o DigiTool – MARC;
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
32 Kaunas, 2009 m. gruodis
o SFX; o MetaLib.
Skirtingi publikavimo kanalai ir duomenų šaltiniai gali dalytis tais pačiais normalizavimo
taisyklių rinkiniais.
1.5.3. Normalizavimo taisyklių rinkinių sąrašas
Kai pasirinktas „Normalizavimo taisyklių konfigūravimo“ nustatymas, administravimo
modulis pateikia esamų rinkinių sąrašą. Šia Primo paslauga galima sukurti naujus rinkinius,
redaguoti, ištrinti ar išdėstyti jau turimus.
1.5.4. Sukurti naują rinkinį
Siekiant sukurti naują taisyklių rinkinį, atliekamas kaţkurio jau egzistuojančio rinkinio
dubliavimas (kopijavimas) – tai arba „įneštinio“ (angl. out of the box) šablono rinkinio, arba lokaliai
sukurto rinkinio kopijavimas. Nurodomas rinkinio pavadinimas ir parenkama „Sukurti“ komanda.
Naujas rinkinys bus įkeltas į sąrašą, kurį jau galima redaguoti.
Pastaba: nenaudokite „Template“ termino naujų rinkinių pavadinimuose. Norint susieti
normalizavimo taisyklių rinkinį su publikavimo kanalu, rinkinys turi būti pirmiau tinkamai
išdėstytas (angl. deploy).
1.5.5. Redaguoti rinkinius
Tam, kad būtų galima redaguoti rinkinius, reikia pasirinkti „Redaguoti“ (angl. Edit) komandą.
1.5.6. Išdėstyti rinkinius (angl. deploy)
Normalizavimo taisyklės yra saugomos Primo Oracle duomenų bazėje. Primo publikavimo
kanalas naudoja XML failus, sugeneruotus taisyklių, esančių šioje duomenų bazėje. Norint sukurti
XML failus ir panaudoti atnaujintas (naujausias) taisykles, rinkinius reikia tinkamai išdėstyti.
Kai rinkiniai yra tinkamai išdėstyti, XML failai sukuriami normalizationExport/ kataloge,
kuris yra /exlibris/primo/p1_n/ng/primo/primo_publishing/home/profile/publish/production/conf.
normalizationExport kataloge. Atitinkami reikalingi katalogai yra sukuriami kiekvienam
normalizavimo rinkiniui. Jei normalizavimo rinkinys naudojamas kanalo, XML failai kuriami ir
publikavimo kanalo conf kataloge.
1.5.7. Ištrinti rinkinius
Naudojamas normalizavimo rinkiniui ištrinti. Šablono normalizavimo rinkiniai negali būti
ištrinti.
1.5.8. Normalizavimo taisyklių rinkinių redagavimas
Normalizavimo taisyklės susideda iš 3 dalių:
1. Šaltinis – tai yra duomenų šaltinis, normalizuotas taisyklėmis. Šaltinis gali būti kelių tipų. Paprastai šaltinis yra normalizuotas iš įrašo šaltinio, bet šaltinis gali būti ir konstanta. Be
to, Primo reikalingas šaltinio įrašo formatas, kadangi skirtingiems formatams taikomi
skirtingi atvaizdavimai ekrane. Galimi tokie šaltinių tipai:
o MARC – šaltinio įrašo laukas standartiniu MARC 21 formatu. Galima apibrėţti (nustatyto) ţymę (tag), indikatorius ir polaukius.
o MAB – šaltinio įrašo laukas MAB formatu. Galima apibrėţti ţymę, indikatorius ir polaukius.
o XML – šaltinio įrašo laukas iš XML įrašo. Galima apibrėţti kelią (path), atributą ir reikšmę.
o PNX – PNX įrašo laukas. Būtina apibrėţti sekciją/lauką iš PNX įrašo.
-
Studija „Paieškos sistemos Primo taikymo galimybės Lietuvos virtualioje bibliotekoje“
33 Kaunas, 2009 m. gruodis
o Konstanta – šaltinis yra tam tikros rūšies konstanta. o Config – šaltinis yra laukas iš konfigūravimo failo/lentelės. Būtina apibrėţti lauko
kelią.
2. PNX laukas (ar „objektas“) – tai PNX įrašo sekcija/laukas sukurtas pagal taisyklę. Vienas PNX laukas gali būti sukurtas vienos ar kelių taisyklių.
3. Konvertavimas – tai yra ką reikia padaryti, kad duomenų šaltinis būtų konvertuotas į PNX lauką. Konvertavimas gali turėti keletą komponentų, įskaitant ir sąlygas, ir
transformavimo šablonus (paprogrames).
1.5.9. Vartotojo sąsaja normalizavimo taisyklėms redaguoti
Normalizavimo taisyklėms redaguoti prieinami 2 redaktoriai:
Bazinis;
Paţangus.
Bazinio redaktoriaus ypatybės:
Kiekvienam PNX laukui galima specifikuoti (tiksliai apibrėţti) daugialypes (sudėtines) taisykles (jei to reikia).
Kiekvienai taisyklei specifikuojamas šaltinis.
Kiekvienai taisyklei specifikuojama transformacija.
Specifikuojamas vienas (bendras) veiksmas, kuris apima visas taisykles: o ADD (pridėti) – nauji PNX laukai turėtų būti pridėti kiekvienam srauto laukui; o OR (arba) – sukuriamas tiktai vienas PNX laukas. Kitaip sakant, kai tik laukas
sukuriamas, Primo sistema nustoja tikrinti likusias taisykles;
o MERGE (sulieti) – sulieja visus šaltinio laukus į vieną bendrą PNX lauką. Jei panaudota suliejimo komanda, tai turi būti padėtas skyriklis, kuris dedamas visada
prieš reikšmę.
Negalima pritaikyti sąlygų.
Paţangaus redaktoriaus ypatybės:
Kiekvienam PNX laukui galima specifikuoti (tiksliai apibrėţti) daugialypes (sudėtines) taisykles (jei tai reikalinga).
Kiekvienai taisyklei specifikuojamas šaltinis.
Kiekvienai taisyklei specifikuojama transformacija.
Specifikuojamas veiksmas kiekvienai taisyklei: o ADD; o OR; o MERGE;
Galima pritaikyti sąlygas.
1.5.10. Veiksmų ADD, OR, MERGE pavyzdys
Srauto įrašas, kuris tu