tutkimuksen sähköinen vallankumous juha haataja · suomessa on selkeä tietopolitiikka, jota...
TRANSCRIPT
TTA-hankkeen esittely
Pirjo-Leena Forsström
TTA-hankkeen pääsihteeri
Tutkimuksen tietoaineistot TTA
Opetus- ja kulttuuriministeriön TTA-hanke edistää tietoaineistojen
kuvausten yhtenäistämistä, säilytystä ja käyttöä
Hankkeessa tuotetaan tätä tukemaan:
• tutkimuksen tietoaineistojen prosessikartta
• tietoinfrastruktuurin palvelukokonaisuuden suunnittelu
• metatietomalli tutkimustiedon hallinnalle
• yhteinen metatietokatalogi/hakupalvelu tutkimusaineistoille
• tallennuspalvelu tutkimuksen tietoaineistoille
• yhteisen pitkäaikaissäilytysratkaisun valmistelu
TTA-palvelukokonaisuus edistää tutkimuksen tietoaineistojen
kansallista, eurooppalaista ja kansainvälistä yhteentoimivuutta.
Toimenpiteitä tietoaineistojen hyödyntämisen parantamiseksi
TTA-VISIO Suomessa on selkeä tietopolitiikka, jota yhteiset sähköiset palvelut tukevat.
Julkisen sektorin hallinnoimat tietoaineistot sekä julkisen tutkimusrahoituksen tuella syntyneet tietoaineistot ovat lainsäädännön ja yhtenäisten käyttöehtojen ohjaamina pääsääntöisesti maksutta yhteiskunnan hyödynnettävissä.
Pitkäjänteinen tietoinfrastruktuurin kehittämisen ja ylläpidon rahoitusjärjestelmä takaa, että olemassa olevat ja uudet tietoaineistot kuvaillaan ja ne ovat helposti löydettävissä ja otettavissa käyttöön tietoverkossa olevien palveluiden avulla.
Kannustava ja oikeudenmukainen meriittijärjestelmä varmistaa uusien, laadukkaiden tietoaineistojen liittämisen tietoinfrastruktuuriin.
TTA-hankkeen hyödyt
Keskitettyä tietoa tutkimuksen tietoaineistoista: helpompi löytää, helpompi käyttää
Yhtenäisempiä käytäntöjä aineistojen hallintaan
Yhteentoimivuuden lisääntyminen: metatietomalli, rajapinnat
Monipuolisen palvelukokonaisuuden kehitys
Tietoaineistojen säilymisen turvaaminen
Säilyminen ja löytyminen epävarmaa
Säilymistodennäköisyys kasvaa, löydettävyys kasvaa
Paikallinen
Jaettu
TTA palvelu-arkki-
tehtuuri
TTA-palvelut
TTA-KATA - metadatakatalogi TTA-AVAA – avointen aineistojen
julkaisualusta TTA-IDA – tutkimusaineistojen
tallennuspalvelu www.tdata.fi –datanhallinnan opas TTA User forum – käyttäjäyhteisö Metatietomalli PAS
TTA-palvelut 2013
Perustuvat avoimen lähdekoodin ratkaisuihin
IDA – tallennuspalvelu (käytössä) (iRoDS)
KATA –metadatakatalogi (pilotissa) (CKAN)
AVAA –avoimen datan julkaisualusta (käytössä) (Liferay)
PAS – Pitkäaikaissäilytys (2015), pilotit alkavat 2014 (useita OS komponetteja)
KATA-metadatakatalogi
KATA-projektin tavoitteet
Rakentaa palvelu, joka: helpottaa tutkimuskäyttöön saatavilla olevien aineistojen
löytämistä, hyödyntämistä ja uudelleenkäyttöä luo yhtenäistä käyttöehto- ja käyttöoikeuskulttuuria:
omistajuus ja hyödyntämisoikeustiedot kytkettynä aineistoon
synnyttää meriitin tutkijalle ja antaa tietoa rahoittajatahoille
palvelu, jonne omat tutkimusdatat voi tuoda näkyville ohjaa metadatan syöttössä ja tukee muiden datojen
kanssa yhtenäisestä kuvailua pitkäaikaissäilytykseen
KATA-metadatakatalogi
tutkija voi tuoda oman tutkimusaineistonsa muiden tutkijoiden tietoisuuteen KATAn avulla
katalogiin ei tallenneta itse aineistoa, vaan sen metatiedot, joiden perusteella muut tutkijat voivat löytää aineiston ja saavat tiedon siitä, miten he voivat saada aineiston käyttöönsä
helpottaa metatiedon syöttöä ja muiden datojen kanssa yhtenäistä kuvailua; aineisto kuvaillaan vähintään TTA:n minimimetatietomallin mukaisesti
laadukkaan kuvailukulttuurin edistäminen erityisesti minimimetatietomallin avulla
monipuoliset hakuominaisuudet, joilla voi hakea keskitetysti useiden kohteiden dataa
metadatan massatuontimahdollisuus
KATA
katalogi nyt valmiina testattavaksi ennen varsinaista käyttöönottoa
kiinnostusta toimia testaajana?
AVAA – avointen aineistojen julkaisualusta
AVAA-projekti
Tavoitteena on tarjota web-pohjaisia välineitä eri tieteenalojen tutkimusdatan avoimen saatavuuden edistämiseen
yleiskäyttöisten välineiden rakentaminen on haasteellista mm. tieteenalojen aineistojen erilaisuus ja erilaiset tarpeet, esim. arkeologien kuva-aineistot vs. kielitieteilijöiden tekstikorpukset vs. numeerinen hiukkasfysiikan data
valittiin linja, jossa edetään yksittäistapausten kautta ja pyritään tunnistamaan mahdollisimman yleistettävissä olevia esimerkkejä sekä kehittämään apuvälineitä näiden tukemiseen
aloitettiin kolmen eri tieteenalan avoimen datan pilottisovellusten kehityksellä
pilottien tarkoitus on tarjota kokemusta
Opetussovellus Cernin CMS-kokeen avoimen hiukkasfysiikan aineiston hyödyntämiseksi lukio-opetuksessa valmistuu 2014 (ks. Cernin artikkeli) ◦Julkaistavan alkuperäisen formaatin lisäksi aineisto muunnetaan yksinkertaisempaan, avoimeen, koneluettavaan formaattiin ohjelmallista hyödyntämistä varten (tällä hetkellä JSON)
Ilmakehätieteiden SMEAR-ryhmän mittausdatan visualisointi, JSON-rajapintajakelu ja avoin lataus CSV-taulukkoina sekä HDF5-muodossa
Paikkatietoaineistojen rajapintajakelu, testitapauksena OpenStreetMap WMS -palvelu ETRS-TM35FIN-koordinaatistossa
Vuoden 2014 aikana WMS- ja WFS-rajapintapalvelut Kotimaisten kielten keskuksen murrekartta-aineistojen jakeluun
AVAA-pilotti SmartSMEAR on Helsingin yliopiston SMEAR-tutkimusasemien (Station for Measuring Ecosystem-Atmosphere
Relations) tietokannassa olevan mittaustiedon visualisointi- ja lataustyökalu.
CMS-pilottia käsitteleviä artikkeleja on julkaistu useassa arvostetussa aikakauslehdessä ja Cernin etusivulla: International Science Grid This Week (27.11.2013): LHC
data to be made public via open-access initiative
Nature - International Weekly Journal of Science (26.11.2013): LHC plans for open data future
Cern web home site (15.11.2013): LHC data to be made public via open access initiative
AVAA beta –pilottiportaali on 2.12. alkaen avoinna verkossa osoitteessa avaa.tdata.fi
Kysyttävää? [email protected]
IDA-tallennuspalvelu CSC – Tieteen tietotekniikan keskus Oy
IDA tallennuspalvelu
Yhteinen tallennuspalvelu tutkimuksen digitaalisten tietoaineistojen säilyttämiseksi ja uudelleenkäytön lisäämiseksi
Tietoaineistojen ja metatiedon turvallinen säilytys
Datan säilyminen eheänä ja muuttumattomana turvataan kopioiden ja niiden eheyden hallinnalla
IDA-palvelussa tarjotaan 2017 loppuun saakka noin 3
petatavun (PT) tallennuskapasiteetin käyttöoikeuksia:
Korkeakouluille varattu yhteensä 1 PT
Suomen Akatemian projektit yhteensä 1 PT
Erityishankkeet,1 PT
IDA tallennuspalvelun käyttäjäksi
Yliopistoilla käyttöoikeusosuudet, päättävät itse miten oikeus jaetaan.
Yliopistojen nimeämät IDA-yhteyshenkilöt linkkeinä yliopistojen ja CSC:n välillä. Lista yhteyshenkilöistä www.csc.fi/sivut/ida/esittely -sivulla
Käyttölupalomake samalta www.csc.fi/sivut/ida/esittely -sivuilta, toimitetaan yhteyshenkilön allekirjoituksella varustettuna CSC:lle.
TTA datanhallinnan opas ja käyttäjäfoorumi
Datanhallinnan opas http://www.tdata.fi
• Datanhallinnan suunnittelu
• Datan säilyttäminen
• Datan jakaminen ja julkaiseminen
• Datan hakeminen ja uudelleenkäyttö
• Datan käsittely ja prosessointi CSC:llä
• Tutkimusprosessi ja data
Paljon ohjeita, esimerkkejä ja valistusta tutkimusdatan hallintaan ja valmisteluun (kuvailu, lisenssit, formaatit)
Avoin keskustelufoorumi TTA-palvelujen käyttäjille
Tuetaan käyttäjiä TTA-palvelujen käyttöönotossa
Luodaan käyttäjien välille yhteys
Kerätään palautetta palveluista
Jaetaan tietoa
Kartoitetaan kehittämistarpeita
Uusien käyttäjien saaminen
Sähköinen ympäristö tiiviisti muiden TTA-palveluiden yhteydessä, avataan vuoden 2014 alussa
User forum -tilaisuuksia keväällä 2014. Ensimmäinen IDA-yhteyshenkilötapaamisen yhteydessä
Kiitokset ja yhteystiedot
KATA-projektitiimi Pinja Koskinen, projektipäällikkö Mikko Koho Juho Lehtonen Mikael Karlsson AVAA-projektitiimi Tanja Kantola, projektipäällikkö Pekka Järveläinen, projektipäällikkö IDA Jorma Paananen www.tdata.fi Irina Kupiainen TTA User Forum Johanna Blomqvist