Taxonomier och metadata Patrik Wallin, informationsarkitekt Planeringsavdelningen DoÄr
• Rätt uppmärkt digital information enligt förutbestämda klassificeringsstrukturer är en förutsättning för att återsökning, sortering, identifikation, administration och återanvändning av informationen kan ske på ett effektivt och kvalitativt sätt.
• Det bör här understrykas med emfas att det digitala informationssamhället i grunden är ett metadatasamhälle, och att de som producerar information och dokument måste vänja sig vid att lägga relativt sett mer tid på att beskriva dokumenten, handlingarna och informationen med hjälp av metadata.
• Begreppet taxonomi kommer ursprungligen från vetenskapen om organismernas klassificering, dvs. beskrivning, namngivning (nomenklatur) och formell klassifikation av organismgrupper som taxonomiska enheter
• Från grekiskans taxis = ordning, och nomos = lag, vetenskap
• Inom informationsvetenskapen används begreppet emellertid för ämnesbaserad klassifikation som ordnar definierade termer ur en kontrollerad ordlista i en hierarki.
• Man skulle således kunna beskriva en taxonomi som en hierarkisk klassifikationsstruktur.
• En taxonomi är helt enkelt ett strukturerat sätt klassificera olika ämnen eller företeelser hierarkiskt.
• Förutsätter att man har definierat de ord som man ska använda sig av i taxonomin
• Det är även en förutsättning för att kunna söka ut information och göra flexibla sammanställningar för olika ändamål och målgrupper.
• Taxonomier kan även utgöra ett underlag till
effektiva navigationsstrukturer på webben. Genom att märka innehållet med metadata (tagga) från en förutbestämd klassificeringsstruktur går det enklare att söka rätt på det.
• Metadata skapar förutsättningar för att skapa relationer mellan innehållsbitar och är en förutsättning för ett automatgenererat navigationssystem.
• Det framgick tydligt under informationsmodelleringen under 2008 att Uppsala universitet behöver en så kallad verksamhetstaxonomi för att på ett enkelt och effektivt sätt kunna kategorisera digital information.
• En verksamhetstaxonomi består av ett antal olika taxonomier för att kunna märka upp och kategorisera information med rätt tillhörighet. Det kan handla om utbildningsämne, forskningsämne, organisationstillhörighet eller funktion/verksamhetsområde.
• I dessa sammanhang brukar man använda sig av
klassifikation av innehållet enligt kategorierna: ämne, funktion/process/verksamhet, organisation samt dokumentyp.
Ämnestaxonomier • Vad det gäller ämnesklassificeringen har
informationsanalysen tydligt visat att utbildningsämnen och forskningsämnen är av central betydelse. Inom detta område bör man naturligtvis använda sig av redan befintliga taxonomier.
Organisationstaxonomi • Vi har konstaterat att man behöver kunna märka upp
informationen efter organisationstillhörighet, dvs. ex fakultet, institution, avdelning, enhet etc.
• Utgångspunkten i detta sammanhang är universitetets gällande organisationsstruktur nedbrutet till förslagsvis avdelningsnivå eller motsvarande.
• Det exempelvis intressant att kunna korskoppla
forskningsämnen med institutionstillhörigheter, centrumbildningar eller avdelningar.
Funktionstaxonomi (Verksamhetsområden) • Det finns ett stort behov av att klassificera
informationen efter verksamhetsområde/process/funktion. Detta gäller inte enbart webbinformationen, utan även elektroniska dokument, handlingar, ärendeinformation och arkivinformation.
• För att detta skall vara genomförbart måste universitetet således besluta om gemensamma benämningar på de övergripande verksamhetsområdena.
• I sin enklaste form består en denna taxonomi av fyra eller fem olika termer, exempelvis Utbildning, Forskning, Samverkan, Stödfunktioner och Ledning. Dessa kan i sin tur brytas ner var för sig i mindre beståndsdelar
• EX
• EX
Dokumenttypstaxonomi • I likhet med klassificering av verksamhetsområden gäller
detta inte enbart webbinformation. Det finns ett behov att man inom universitetet fattar beslut om vilka dokumenttyper och handlingstyper som skall finas.
• För utformning av denna taxonomi krävs således att man samordnar pågående arbeten samt att man vidare utreder vilka dokumenttyper som man har behov av att klassificera inom universitetet.
Metadata och taxonomier • Metadata betyder ”data om data” eller ”information om
information” och används för att beskriva och klassificera information för att öka dess användbarhet.
• Data och information kan i regel inte förstås eller
återsökas utan en bestämning i flera led som talar om i vilket sammanhang informationen är skapad, vem som skapat den, när den är skapad etc.
• Ett bra hjälpmedel för att underlätta metadatahantering är taxonomier. När man ska lägga till metadata till sin webbsida väljer man rätt term ur de olika taxonomierna (ex. Utbildning ur Funktionstaxonomin, Institutionen för arkeologi och antik historia ur Organisationstaxonomin och Egyptologi ur ämnestaxonomin Utbildningsämnen)
Metadata Title
Author
Department
Audience
Topic
Topics Employee Services
Compensation Retirement Insurance Further Education
Finance and Budget Products and Services Support Services
Infrastructure Supplies
Metadata Values (As Taxonomy)
Audience Internal
Executives Managers
External Suppliers Customers Partners
Förvaltning • Taxonomier är inte konstanta, utan kommer att
behöva ändras allt eftersom verksamheten förändras och utvecklas. På grund av detta faktum måste taxonomierna förvaltas.
• Utöver Taxonomier, som handlar om hur man klassificerar termer, kommer vi behöva ge oss på Thesaurus (synonymordlistor) för termerna, samt Folksonomier, XML Topic maps (ISO standard det med) för att beskriva ett begreppsområde och hur olika begrepp (topics) är relaterade till varandra.
Exponering och användningsområden • All metadata om innehållet bör inte exponeras utåt i t.ex.
meta-elementen på webbsidor. Endast metadata av relevans skall inkluderas.
• Mycket av den metadata som insamlas och automatgenereras om ett innehållsobjekt har många organisations- och systeminterna användningsområden men tillför ingen nytta utan kan i vissa fall snarare orsaka skada om de exponeras.
• Detta bör även beaktas då dokument lämnar organisationen i form av automatgenererade pdf-filer, exporter, etc