hantering av forskningsdata – lärosätes syn

29
Hantering av forskningsdata Lärosätes syn Renata Arovelius Luleå 2012-04-02

Upload: yazid

Post on 22-Feb-2016

52 views

Category:

Documents


0 download

DESCRIPTION

Hantering av forskningsdata – Lärosätes syn. Renata Arovelius Luleå 2012-04-02. Översikt. * Vad menar vi med forskningsdata? Forskningsprocessen Handlingstyper Offentlighetsprincipen och Arkivlagen * Vad är hantering av data? Handlingarnas livscykel: - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Hantering av forskningsdata –  Lärosätes syn

Hantering av forskningsdata – Lärosätes syn

Renata Arovelius Luleå 2012-04-02

Page 2: Hantering av forskningsdata –  Lärosätes syn

* Vad menar vi med forskningsdata?ForskningsprocessenHandlingstyperOffentlighetsprincipen och Arkivlagen

* Vad är hantering av data?Handlingarnas livscykel: Datahantering – bevarande – publicering - återanvändning

* Hur kvalitetssäkra, bevara och tillgängliggöra forskningsdata?

MetadataForskningens infrastrukturSamarbete

Översikt

Page 3: Hantering av forskningsdata –  Lärosätes syn

Vad är forskningsdata?/forskningsmaterial, forskningshandlingar

• Handlingar tillkomna inom forskningsprojekt och inom kontinuerligt bedriven forskning

Page 4: Hantering av forskningsdata –  Lärosätes syn

Offentlighetsprincipen (OP)

Myndighetens verksamhet öppen för allmän insyn (arbete i form av forskning har ingen särställning)

* Handlingar som uppstår i samband med forskning är underkastade Tryckfrihetsförordningens regler om allmänna handlingars offentlighet

* Typen av forskning och dess finansiering saknar betydelse

Page 5: Hantering av forskningsdata –  Lärosätes syn

Vad är arkiv?

• Myndighetens allmänna handlingar och sådana handlingar som avses i 2 kap. 9 § TF (minnesanteckningar, utkast etc.), om man beslutar att de ska arkiveras

Arkiv = ”Kvalitetssäkrad information”(autenticitet, spårbarhet, beständighet, tillgänglighet)

Page 6: Hantering av forskningsdata –  Lärosätes syn

4. Forskningsprocessen

PROCESSKARTA MED HANDLINGSTYPERD

elpr

oces

sH

uvud

proc

ess

Förv

arin

gs-m

edel

Han

dlin

gsty

per

Projekt/forsknings-

idé

Projekt /forskning

genomförd

Proj.ansökan

Metod-beskrivningar

Adm.korre-spondens

Ekon. korre-spondens

Ansökan till etisk kommitté

Ansökan om tillstånd

kontrakt

Avslag

Kontrakt-kompletteringar

Strategi för bevarande

dataset

Statiska bearbetningar artiklar

delrapporter

konferensbidrag

rapporter

Aggregerade data

Instruktioner för insamling

enkäter

rådata

publikationer

Ekonomiska rapporter

Public 360 Agresso

Webb

papperdataset Elektronisk

publicering

Planeraforskning

Utföraforskning

Publiceraforskning

Fullfölja forskning

Forrmulera forskningsidé Söka medel Planera

projektFörbereda

datainsamling Samla in data

Sammanställa data

Analysera och bearbeta data

Skapa publicerings-och

utvärderings-plan

Publicera resultat

Slutredovisa projekt

E-ARKIV

Page 7: Hantering av forskningsdata –  Lärosätes syn

Forskningsprocessen:Delprocesser och aktiviteter

Archiving:Data and metadata, preservation standards, roules for appraisal

Page 8: Hantering av forskningsdata –  Lärosätes syn

JAN FEB MARDAT

50 84 851 54 84 802 59 85 813 58 86 814 61 86 795 63 89 776 69 93 757 75 98 72

Datasetet får endast användas i icke kommersiellt syfte.Datasetet är samlat i en komprimerad fil, dataset.zip. Filerna har komprimerats med pkzip.exe och kan efter nedladdning packas upp med t ex. WinZip eller pkunzip.exe.

Data set Text Bild• Bevarat på hårddisk (laptop) ej acceptabelt; mycket osäkert• Publicerat på webben ej arkivmässigt, utan strategi för

långtidsbevarande

• Översänt till arkivet metoder och metadata (eArkiv)

tillgängliggörandemeriterande (”citering standard”: beständiga

identifierare för rådata (dataset)säkert

Page 9: Hantering av forskningsdata –  Lärosätes syn

Vad är e-arkiv?

• E-arkiv beskrivs som system för bevarande eller system för långsiktig informationsförsörjning som kan vara ett fristående system eller ett verksamhetssystem med inbyggd e-arkivfunktion

• SLU tillämpar den sistnämnda definitionen

(E-delegationen och Riksarkivet)

Page 10: Hantering av forskningsdata –  Lärosätes syn

Bevarandefrågor och bevarandestrategi:

Enligt Riksarkivets föreskrifter 2009:1, kap. 3, 1 § är universitetet skyldigt att upprätta en strategi för bevarande av elektroniska handlingar.

De handlingar som finns i digital form vid SLU omfattar i första hand *forskningsdatabaser inkl. den information som hanteras i IT-system för bearbetning av forskningsdata, *administrativa system som LADOK, PUBLIC och AGRESSO samt andra verksamhetssystem,* system för distansutbildning, kurshantering, elektronisk publicering, universitetens webbsidor samt handlingar i andra digitala format som ljud, film eller foto.

Page 11: Hantering av forskningsdata –  Lärosätes syn

eArkiv

• Lämpliga metadata (deskriptiva och för bevarande)• Indexering av alla metadata för snabb utforskning

• Tillgång till data oavsett tid och plats – god infrastruktur

• Skydd för sekretess, ”restricted access”

• Möjlighet att följa hela kedjan (länkning rådata – forskningsresultat); beständiga länkar

• Garanti för och migrering till beständiga format – långsiktighet

Page 12: Hantering av forskningsdata –  Lärosätes syn

Applikationer måste styras avArkivredovisningen

Metadata enl RA-FS 2008:4 måste vara påförda i det uppgifts-lämnande systemet, bl. struktur-enhet (process) och arkivbildare

Metadata för e-arkivet skapas i verksamhetssystemen

Citerat från ”Vismas” presentation

Page 13: Hantering av forskningsdata –  Lärosätes syn

Varför beskriva?

MetadataArkiv = ”Kvalitetssäkrad information”(autenticitet, spårbarhet, beständighet, tillgänglighet)

Typer av metadata:1. Deskriptiva – hjälper till att hitta och identifiera arkiverade objekt2. Administrativa – hjälper till att hantera och ”spåra” data3. Strukturella – talar om hur komplexa objekten är och hur olika

delar relaterar till varandra

Bevarande metadata hjälper till långtidsbevarande och återanvändning av de digitala objekten.

Page 14: Hantering av forskningsdata –  Lärosätes syn

HUR BESKRIVA?

• Deskriptiva metadata

DCMODSMARC 21DDIEMLGEO-Data, mm.

• Bevarande metadata

METS

PREMIS

Page 15: Hantering av forskningsdata –  Lärosätes syn

PREMIS (Preservation Metadata: Implementation Stategies)

http://www.loc.gov/standards/premis/ och METS http://www.loc.gov/standards/mets

(Metadata Encoding and Transmission Standard)

Standard framtagen för att effektivt hantera, finna och återskapa den digitala informationen. PREMIS bevarandemetadata innehåller: - proveniensinformation, - fångar aktiviteter kring det digitala objektet och -identifierar tekniska egenskaper - ger även autenticitet till objektet

PREMIS schema används som ”METS extensions”

Page 16: Hantering av forskningsdata –  Lärosätes syn

METS http://www.loc.gov/standards/mets(Metadata Encoding and Transmission Standard)

(METS) är en struktur för att koda och packa ihop metadata för ett digitalt objekt. METS är en flexibel standard som använder XML för att koda upp strukturen.

Page 17: Hantering av forskningsdata –  Lärosätes syn

PREMIS OCH METS

• I. PREMIS under amdSec (administrative metadata): Object in techMD,Event in digiprovMDRights in rightsMDAgent with Event or Rights

Or

• II. All in digprovMD or• III. All in techMD

Page 18: Hantering av forskningsdata –  Lärosätes syn

ECDS Metadata (1)

• 1. Obligatoriska (m) och valfria (o) metadata element i portalen:

- Title

- Topic category code

- Geographical extent-Temporal extent- Additional information regarding georaphic, temporal and vertical extent (o)- Contact information regarding distribution (o)- Data format (o)- On-line resource (o)- Data quality information (o)- Metadata information (fixed or created automatically)- Contact information regarding metadata- Revision (date and type)- Dataset version- Dataset citation (o)

- Dataset description- Contact information regarding the dataset- Graphic illustration (o)- Descriptive keywords from thesaurus- Use limitation- Access constraints- Other constraints- Language- Topic category code- Geographical extent- Temporal extent

Page 19: Hantering av forskningsdata –  Lärosätes syn

Arkivmetadata for forskningsmaterial/försök- (1)• admSec Object: unik identifierare (typ och värde)

”fixity info” – checksumma, algoritm för att ”återhämta”filtyp, storlek, struktur (format och version) referenskod, antal filer, signumobjektets innehåll, ämne (variabler, parametrar,

relationer) materialets typ och ursprungprocedurer för datainsamling

hur objektet uppstått och varförarkivbildare (person/organisation eller dyl.)samband med andra objekt, kompletterande infotidsomfattning, geografisk täckning

Page 20: Hantering av forskningsdata –  Lärosätes syn

Arkivmetadata for forskningsmaterial/försök- (2)

system- och programinfo

hårdvaruplattformkomprimering, kodningschema, validitet (checksummor)klassificeringsschema, beteckningar, sökbegreppgallringsregler, gallringsfristalla ”inhibitors” (access, use, migration)

Rights: unik identifierare (typ och värde) informationens ägare, alla roller inblandade, beskrivning av begränsningstypen (t.ex. sekretess, upphovsrätt, licens)

Event: unik identifierare för (typ och värde)typ av ”event” (t.ex. migrering, upprättande, överföring)

användnings-, konverterings och migreringshistorikleveranshistorik (”avställning”, tilläggsleverenser; vem och vad)

Agents: roller i ”events” eller ”rights” (person. org., software; hänvisning till andra standarder)

Page 21: Hantering av forskningsdata –  Lärosätes syn

ECDS - admSec

- Title- Revision (date and type)- Dataset version- Contact information regarding the dataset- Use limitation- Access constraints- Other constraints- Contact information regarding distribution (o)- Data format (o)- Metadata information (fixed or created automatically)- Contact information regarding metadata

Page 22: Hantering av forskningsdata –  Lärosätes syn

Varför bevara forskningsmaterial

• Verifiering av forskningsresultat

* Allmänhetens insyn och kontroll * Återanvändning och nya projekt

Page 23: Hantering av forskningsdata –  Lärosätes syn

Verifiering av forskningsresultat

Page 24: Hantering av forskningsdata –  Lärosätes syn

Insyn och allmänhetens kontroll

Page 25: Hantering av forskningsdata –  Lärosätes syn

Återanvändning av data

Page 26: Hantering av forskningsdata –  Lärosätes syn

”Open Access” till rådata

• ” Att hålla på viktig information blir allt mer förlegat. Nu börjar till och med läkemedelsföretag förstå att de skulle kunna få fram nya läkemedel snabbare och billigare genom att samarbeta och dela med sig av sina data till andra forskare – och till varandra!”

http://henrikbranden.se/2010/09/10/lakemedelsforetag-go-open-access/

Page 27: Hantering av forskningsdata –  Lärosätes syn

En samlad strategi för hantering av forskningsdata

• Samarbete om metadata/metadata import, export och standarder

• Länkning rådata – publikationer• Systemlänkning/infrastruktur• Strategi för bevarande så tidigt som möjligt

i forskningsprocessen

Page 28: Hantering av forskningsdata –  Lärosätes syn

The importance of scientific e-infrastructure:A vision for 2030

“Researchers and practitioners from any disciplines are able to find access and process the data they need.

They can be confident in their ability to use and understand data, and they can evaluate the degree to which that data can be trusted.”

And:“Producers of data benefit from opening it to broad access, and prefer to deposit their data with confidence in reliable repositories. A framework of repositories is guided by international standards, to ensure they are trustworthy”.

”The vision of 2030” inte möjlig att genomförautan gedigen arkivinsats och en adekvat strategi förbevarande.

Riding the wave. How Europe can gain from the rising tide of scientific data. Final report of the High Level Expert Group on Scientific Data. A

submission to the European Commission., October 2010.

p.25

Page 29: Hantering av forskningsdata –  Lärosätes syn