data-analyysin tutkimus ja opetus › it › fi › ohjeita-opiskelijalle ›...
TRANSCRIPT
DATA-ANALYYSIN TUTKIMUS JA OPETUS
25.8.2014
JYVÄSKYLÄN YLIOPISTO
INFORMAATIOTEKNOLOGIAN TIEDEKUNTA
2014
SISÄLLYS
1 DATA-ANALYYSI ........................................................................................................ 4
1.1 Data-analyysin osaamisen tarve ..................................................................... 4
1.2 Data-analyysin ajankohtaisuus ....................................................................... 5
1.3 Big datatutkimus ............................................................................................. 7
1.3.1 Perusteita .............................................................................................. 7
1.3.2 Data-analyysi Jyväskylän yliopiston kesäkoulussa 2013 ....................... 8
1.3.3 Big data-analyysiin liittyviä hankkeita ................................................... 8
2 DATA-ANALYYSIN KOULUTUS .................................................................................. 9
2.1.1 Tilastotieteen maisteritutkinto ............................................................. 9
2.1.2 Sovelletun matematiikan maisteritutkinto ........................................... 9
2.1.3 Laskennallisten tieteiden maisteritutkinto ......................................... 10
2.1.4 Data-analyysin osaamisprofiili ............................................................ 10
2.1.5 Big data-analyysin jatkokoulutus ........................................................ 12
LIITE 1 SAATAVILLA OLEVIA VERKKOKURSSEJA ............................................................... 13
LÄHTEET ........................................................................................................................... 15
3
TIIVISTELMÄ Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut-kimukselle asetettuja vaatimuksia, joita on esitetty Suomen digitaalisessa agendassa (2011), ICT-2015 työryhmän raportissa (2013) ja Keski-Suomen ICT-strategiassa (2013). [2] [3] [4] Data-analyysikoulutus perustuu vahvaan tietotekniikan sekä matematiikan ja tilastotie-teen laitoksilla toteutettavaan tutkimukseen ja opetukseen. Koulutuksella vastataan muuttuvan maailman tilanteeseen, jossa suurien data-aineistojen automaattisesta analysoinnista on tullut keskeinen työkalu useilla aloilla. Digitalisoinnin ja erilaisten sensoritekniikoiden avulla tietomassat kasvavat huimaa vauhtia ja sekä tutkimus että teollisuus ovat havainneet data-analyysin tuomat mah-dollisuudet. Ala vaatii kuitenkin erikoistunutta osaamista, sekä tilastollisista menetel-mistä, että niiden soveltamisesta tietokoneisiin, eikä vastaava koulutusta ole riittävästi. Data-analyysiin profiloitumisen tarkoituksena on kouluttaa osaajia tämän tarpeen täyt-tämiseksi. Opiskelijoita koulutetaan matematiikan ja tilastotieteen sekä tietotekniikan laitoksen yhteistyönä. Opiskelijoilla on valmistuttuaan hyvät mahdollisuudet siirtyä teollisuuden ja elinkeinoelämän vaativiin asiantuntijatehtäviin tai jatkaa tutkimustyötä poikkitieteellisissä tutkimusryhmissä.
1 DATA-ANALYYSI
1.1 Data-analyysin osaamisen tarve
Valtioneuvoston selonteon Tuottava ja uudistuva Suomi – Digitaalinen agenda vuosille 2011–2020 mukaan tieto- ja viestintäteknologinen kehitys vaikuttaa merkittävästi kou-lutuksen, tutkimuksen ja kulttuurin tuottamiseen, välittämiseen ja hyödyntämisen ta-poihin. Sähköisen asioinnin yleistyminen sekä tieto- ja viestintätekniikan hyödyntämi-nen laajasti kaikessa työelämässä edellyttää koko väestöltä riittäviä tietoyhteiskunta- ja mediataitoja. Lähes kaikki yhteiskunnan elintärkeät toiminnot, mukaan lukien kan-sallinen ja kansainvälisiin yhteisöihin liittyvä päätöksenteko, ovat jo sidoksissa tieto- ja viestintäinfrastruktuurin sekä tietojärjestelmien toimintaan. [4] Tieto- ja viestintäteknologinen kehitys vaikuttaa merkittävästi koulutuksen, tutkimuk-sen ja kulttuurin tuottamiseen, välittämiseen ja hyödyntämisen tapoihin. Sähköisen asioinnin yleistyminen sekä tieto- ja viestintätekniikan hyödyntäminen laajasti kaikessa työelämässä edellyttää koko väestöltä riittäviä tietoyhteiskunta- ja mediataitoja. [4] ICT 2015 työryhmä toteaa: ”Digitaalisessa maailmassa informaation ja tallennetun tie-don määrä on valtava. Kun yhdistetään älykkäästi ja reaaliajassa näennäisesti turhaa tietoa, pystytään luomaan täysin uudentyyppistä, toimialojen rajoja rikkovaa tietoa. Big data on maailmalla kuuma tutkimuksen ja soveltamisen kohde. Suomen osaaminen tällä alueella on kapeaa, vaikkakin tietyiltä aloilta löytyy huippuosaamista. Big data liittyy läheisesti muihin Suomen kriittisiin avainosaamisalueisiin. Tietoliikenteen osaaji-na olemme perinteisesti käsitelleet suuria datamääriä. Tietoturva on tärkeää kaikissa big data -tyyppisissä sovelluksissa ja tietovarannoista louhittavien tiedonjyvästen in-tegrointi vaatii vahvaa ohjelmisto- ja tietojenkäsittelyosaamista. Julkisella puolella tie-tovarantojen avaaminen, yhteinen ICT -palveluarkkitehtuuri ja perinteisesti Suomessa hyvin toimiva julkinen – yksityinen -yhteistyö avaa mielenkiintoisia mahdollisuuksia. Suurimmaksi ongelmaksi big data tiedon soveltamisessa ja tietojen avaamisessa toi-mijat kokevat, että organisaatioilla ei ole riittävästi asiantuntemusta. Organisaatiot tarvitsevat tähän osaajia ja koulutusta.” [2]
Maaliskuussa 2013 Advanced Scientic Computing Advisory Committee (ASCAC) alako-mitea julkaisi raportin “Synergistic Challenges in Data-Intensive Science and Exascale Computing”, jossa käsiteltiin “Big Data and the Fourth Paradigm” -teemaa. Raportin mukaan “Historically, the two dominant paradigms for scientific discovery have been theory and experiments, with large-scale computer simulations emerging as the third paradigm in the 20th century. In many cases, large-scale simulations are accompanied by the challenges of data-intensive computing. Overcoming the challenges of data-
5
intensive computing has required optimization of data movement across multiple lev-els of memory hierarchies, and these considerations have become even more im-portant as we prepare for exascale computing. The approaches taken to address these challenges include (a) fast data output from a large simulation for future pro-cessing/archiving; (b) minimization of data movement across caches and other levels of the memory hierarchy; (c) optimization of communication across nodes using fast and low-latency networks, and communication optimization; and (d) effective co-design, usage and optimization of system components from architectures to software.” [1] Over the past decade, a new paradigm for scientific discovery is emerging due to the availability of exponentially increasing volumes of data from large instruments such as telescopes, colliders, and light sources, as well as the proliferation of sensors and high-throughput analysis devices. Further, data sources, analysis devices, and simulations are connected with current-generation networks that are faster and capable of moving significantly larger volumes of data than in previous generations. These trends are popularly referred to as big data. However, generation of data by itself is of not much value unless the data can also lead to knowledge and actionable insights. Thus, the fourth paradigm, which seeks to exploit information buried in massive datasets to drive scientific discovery, has emerged as an essential complement to the three exist-ing paradigms. The complexity and challenge of the fourth paradigm arises from the increasing velocity, heterogeneity, and volume of data generation.” [1] Jyväskylän yliopiston IT-tiedekunta on kehittänyt data-analyysin koulutusta ja tutki-musta systemaattisesti yhteistyössä matematiikan ja tilastotieteen laitoksen sekä kan-sainvälisten huippuyliopistojen, Tel Avivin ja Yalen yliopistojen, kanssa. IT-tiedekunnan monialainen osaaminen luo hyvän pohjan alan koulutuksen ja tutkimuksen kehittämi-seen. Kehitystyötä tullaan jatkamaan sekä metodien että sovellusten osalta (käsittäen kyberturvallisuuden, hyperspektrikameran kuvantamisdatan käsittelyn, big datan sekä Business Intelligent:iin liittyvän datan käsittelyn).
1.2 Data-analyysin ajankohtaisuus
Data-analyysillä tarkoitetaan menetelmiä ja lähestymistapoja, joilla eritavoilla (senso-rit, videokuvat, signaalit, raportointi) kerätystä tiedosta pyritään muodostamaan ky-seistä toimintaa kuvaavia malleja, sekä korkealuokkaista analysointia tai tarkempaa, tilastollisesti luotatettavaa informaatiota. Data-analyysin metodiikka voidaan tiivistää oheiseen kuvaan, joka mukailee Fayyed’n Knowledge Discovery in Databases -prosessia. Oleelliset vaiheet kaikessa tekemisessä ovat data valinta, sen esiprosessoin-ti, muuntaminen diskreeteiksi tai jatkuviksi havainnoiksi, rakenteiden löytäminen da-tan louhimisen avulla ja löydettyjen rakenteiden tulkitseminen ja varmistaminen. Ku-vassa 1 on esitetty data-analyysitutkimuksen prosessi.
6
KUVA 1 Data-analyysin tutkimusprosessi
Googlen hallituksen puheenjohtaja Eric Schmidt totesi puheessaan, että 5 eksabittiä (1018) dataa on luotu ihmiskunnan alkuajoista vuoteen 2003 mennessä. Nyt yhtä paljon dataa syntyy joka toinen päivä. Data tulvan keskellä ilmaantuu suuria mahdollisuuksia niille, jotka pystyvät ymmärtämään dataa, irrottamaan siitä oleellisen ja visualisoimaan tai muuten selventämään tämän tiedon muille. Tähän massiivisen datan louhimiseen tarvitaan uusia työkaluja ja menetelmiä, mutta ennen kaikkea uusia osaajia – data ana-lyytikkoja. ICT 2015 – työryhmä [2] on raportissaan tunnistanut Suomen menestymisen kannalta seuraavat teknologiseen osaamiseen liittyvät kehityskohteet:
On kehitettävä syvää tietojenkäsittelyosaamista (Computer Science).
On varmistettava kriittinen osaamiskeskittymä avainteknologioissa, joita ovat digitaaliset palvelut ja sisällöt, pelillisyys, tietoturva, mobiliteetti ja big data.
On laitettava kuntoon tutkimuksen, soveltamisen, tuotteistamisen ja kaupallis-tamisen ketju.
On huomioitava ICT yleisen koulutuspolitiikan kehittämisessä. Big Datan markkina on voimakkaasti kasvava. Vuonna 2011 kokonaismarkkina oli noin 5,1 miljardia dollaria ja vuonna 2013 sen arvioidaan olevan vajaa 17 miljardia ja kasva-van vuoteen 2016 mennessä lähes 55 miljardiin dollariin. Eri yrityksille kertyy yhä suurempia datamääriä asiakkaista ja heidän ostotottumuksis-taan. Ihmisillä on useita eri liikkeiden kanta-asiakaskortteja, joiden käytön perusteella yritykset voivat luoda asiakaskohtaisia profiileita. Suurilla yrityksillä ongelmaksi on muodostunut valtavien asiakastietojen käsittely. Kuinka selviytyä miljoonien asiakkai-den päivittäisten ostotapahtumien käsittelystä ja analyysistä? Esimerkiksi peliyhtiö Roviolla on yli 260 miljoonaa aktiivista Angry Birds pelaajaa, joilta saadaan erilaista palautetta peleistä ja pelaamisesta. Big data-analyysi on tehokas vaihtoehto näin suu-rien käyttäjätietojen tehokkaaseen analyysiin.
7
1.3 Big datatutkimus
1.3.1 Perusteita
Suurien datamassojen tutkimusta toteutetaan tilastotieteessä, laskennallisten tietei-den ja sovelletun matematiikan alueilla. Tilastotieteen tutkimusaloja ovat mm:
Spatiaalinen tilastotiede tarkastelee paikkatietoaineistojen tilastollista ana-lysointia ja mallinnusta sekä tilastollista kuva-analyysia
Aikasarja-analyysin tutkimus kohdistuu tila-avaruusmallien ja monimuuttujais-ten aikasarjamallien teoriaan ja metodikehitykseen.
Rakenneyhtälömallien tutkimus on kompleksisten monimuuttujaisten aineisto-jen ja pitkittäisaineistojen mallinnusta
Parametrittomien ja robustien monimuuttujamenetelmien tutkimus on merkki- ja järjestyslukuvektoreihin perustuvien monimuuttujamenetelmien teoreettista kehitystyötä
Biometrian ja ympäristötilastotiede on tutkimusalue, joka sisältää populaation mallinnusta ja vesistöjen ekologisen tilan arviointia
Erityisen kiinnostava tutkimusalue ovat spatiaaliset mallit. Paikkatietoon perustuvia ennustemalleja voidaan tuottaa päätöksentekijöitä varten muodostamalla datasta ja-kaumia, kasautumia, riippuvuuksia ja poikkeamia. Havainnoista voidaan tehdä päätel-miä luoda hypoteeseja jatkoanalyysiin. Mobiiliteknologian alueella paikkatiedolla on yhä suurempia sovellusalueita. Spatiaalisten mallien rakentamisen tavoitteena on tut-kittavan ilmiön ymmärtäminen, jotta voidaan rakentaa malli ilmiön käyttäytymisen ennustamista varten. Laskennallisten tieteiden tutkimusaloja ovat matemaattinen mallintaminen, luotetta-va malli- ja datapohjainen simulointi, optimointi, adaptiiviset ja tehokkaat numeeriset laskentamenetelmät, epävarmuuden huomioiminen numeerisessa simuloinnissa, ha-jautettujen systeemien säätö, spline ja spline wavelet tekniikat signaalin ja kuvankäsit-telyssä, dynaamiset systeemit ja nanoelektroniikan mallinnus. Sovelletun matematiikan tutkimusaloja ovat mm. diskreetti matematiikka, matemaat-tinen mallintaminen, funktionaalianalyysi, mitta- ja integraaliteoria ja kompleksiana-lyysi. Jyväskylän yliopistossa data-analyysin tutkimusaloja ovat analysointimenetelmien kehittäminen, erityisesti numeriikka ja massiivisen datan luokittelutekniikat, hyper-spektrikameran datan analysointitekniikoiden kehittäminen ja tekniikan soveltaminen sen osa-alueilla, kuten solubiologia, lääketiede, ympäristötiede, maa- ja metsätalous, kemialliset aseet, rikospaikkatutkimustekniikka. Lisäksi tutkimukseen liittyviä yhteis-työhankkeita on mm. fysiikan ja aivotutkimuksen alueilla.
8
1.3.2 Data-analyysi Jyväskylän yliopiston kesäkoulussa 2013
Jyväskylän kansainvälisessä kesäkoulussa elokuussa 2013 professori Amir Averbuch piti kurssin (2 op) aiheesta: Advanced Methods for Classification of Big High Dimensional Data.
1.3.3 Big data-analyysiin liittyviä hankkeita
Data-analyysin alueella on toteutunut ja käynnissä seuraavia hankekokonaisuuksia.
Data-analyysin vuonna 2013 päättynyt hanke:
Professori Timo Hämäläinen: Suurien moniulotteisten datajoukkojen järjestä-minen ja analysointi, HIDE-hanke (1.1.2012–31.12.2013, Tekes)
Data-analyysin käynnissä olevia tutkimushankkeita:
Professori Pekka Neittaanmäki: New System for Cyber Attacks Protection of Critical Infrastructures 2012–2014, CAP-projekti (1.11.2012–31.10.2014, Tekes)
Professori Jari Veijalainen: Tiedonkaivuu sosiaalisesta mediasta, MineSocMed-projekti (1.9.2013–31.8.2017, SA) tarkoitus kehittää sosiaalisen median ana-lyysialgoritmeja.
Professori Timo Hämäläinen: Kiinteistöautomaatiojärjestelmien datan älykäs analysointi, KIIAUDATA-hanke (1.1.2013–31.12.2014, Tekes)
Professor Amir Averbuch: MeBUD: Methods for Big Unstructured High Dimen-sional Data (1.8.2014 - 30.7.2018, haettu rahoitusta SA)
9
2 DATA-ANALYYSIN KOULUTUS
Suurien tietomassojen analyysin opiskelu toteutetaan kolmen maisteriohjelman sisällä, joissa opiskelija voi profiloitua data-analyysiin. Tietotekniikan laitoksella toteutetaan laskennallisten tieteiden ja sovelletun matematiikan maisteriohjelmat ja Matematiikan ja tilastotieteen laitoksella toteutetaan tilastotieteen maisteriohjelma.
2.1.1 Tilastotieteen maisteritutkinto
Tilastotieteen maisteriopinnot sisältävät sekä teoreettisia opintoja että tilastotieteen sovelluksia ja tähtäävät ammattitilastotieteilijän taitoon. Tilastotiede kehittää malleja ja menetelmiä numeerisen havaintoaineiston keräämiseen, kuvaamiseen ja analysoin-tiin ja tähän liittyvään laskennalliseen toteuttamiseen. Tilastotieteellä on kiinteä yhteys lähes kaikkiin empiiristä tutkimusta tekeviin tieteenaloihin: tilastollisia menetelmiä sovelletaan niin informaatioteknologiassa, bio- ja ympäristötieteissä, taloustieteessä, lääketieteessä kuin yhteiskunta- ja kasvatustieteissäkin. Tilastotieteessä on kysymys reaalimaailman ilmiöiden mallintamisesta ja sen osaamista tarvitaan yhä enemmän yhteiskunnassa ja elinkeinoelämässä, missä tutkimusaineistojen ja tietovarantojenana-lyyseilla ja mallinnuksella halutaan tuottaa jalostettua tietoa päätöksenteon tueksi. Tilastotieteen opetuksen tavoitteena on antaa valmiudet edustavien havaintoaineisto-jen keräämiseen, aineistojen kuvaamiseen ja analysointiin sekä yleensä numeerisesti mitattavissa olevienilmiöiden pätevään tilastolliseen mallintamiseen. Tilastotieteellä on käytettävissä erilaisia analysointityökaluja data-analyysin toteuttamiseen.
2.1.2 Sovelletun matematiikan maisteritutkinto
Sovelletun matematiikan avulla pyritään ratkaisemaan tosielämän ongelmia. Sovelle-tun matematiikan tavoitteena on mallintaa erilaisia ilmiöitä, kuvailla niitä ja yrittää ymmärtää niitä. Sovelletun matematiikan opiskelussa yhdistyy tieteellisen laskennan käsitteet ja menetelmät, joita käytetään kysymyksiin, jotka ilmentyvät matematiikan ja muiden tieteenalojen rajapinnoissa. Jyväskylän yliopistossa opinnoissa keskitytään sel-laisiin osa-alueisiin, kuten funktionaalianalyysi, mitta- ja integraaliteoria, kompleksi-analyysi, numeerinen analyysi, optimointi ja simulointi.
Valmistunut maisteri hallitsee laaja-alaisesti sovelletun matematiikan ja tieteellisen laskennan käsitteitä ja menetelmiä, joita käytetään itsenäisen ajattelun ja tutkimuksen perustana. Ymmärtää matematiikan ja lähitieteenalojen rajapintojen tietoihin liittyviä laskennallisia kysymyksiä ja tarkastelee niitä ja uutta tietoa kriittisesti.
10
Sovellettu matematiikka tuottaa matemaattisia työkaluja data-analyysin toteuttami-seen.
2.1.3 Laskennallisten tieteiden maisteritutkinto
Laskennallisten tieteiden maisterikoulutuksessa käsitellään laaja-alaisesti tilastotie-teen, numeerisen laskennan ja ohjelmoinnin käsitteitä ja menetelmiä. Laskennallisten tieteiden maisteri tuntee jatkuvan ja diskreetin simuloinnin periaatteet ja sovelluskoh-teet. Hän osaa listata jatkuvien simulointimallien tavallisimmat diskretisointimenetel-mät ja niiden tehokkaan toteuttamisen perusperiaatteet moderneissa tietokonearkki-tehtuureissa. Lisäksi hän osaa nimetä yksi- ja monitavoitteisen epälineaarisen opti-moinnin periaatteet ja ratkaisumenetelmät.
Hän kykenee muodostamaan tekniikan ja luonnontieteiden ilmiöille matemaattisia simulointimalleja sekä osaa rakentaa mallien ratkaisemiseen tehokkaat ohjelmistot aliohjelmakirjastoja tai vastaavia valmiita komponentteja hyödyntäen. Hän osaa muo-dostaa ja ratkaista numeerisesti simulointimalleihin pohjautuvia optimointitehtäviä. Laskennalliset tieteet antavat erilaisia numeerisia työkaluja data-analyysin toteuttami-seen.
2.1.4 Data-analyysin osaamisprofiili
Edellä kuvatut kolme maisterikoulutusta antavat opiskelijalle mahdollisuuden profiloi-tua suurten datamassojen analyysiin kunkin tieteenalan näkökulmasta ja tutkimustyö-kaluja hyväksikäyttäen. Data-analyysissä opetetaan ja tutkitaan menetelmiä ja lähestymistapoja, joilla erita-voin kerätystä tiedosta (data) pyritään muodostamaan malleja ja korkeampaa tai tar-kempaa informaatiota. Opetuksessa korostuu keskeisinä tekijöinä datan kerääminen, käsittely, visualisointi ja arvon lisäys. Data-analyysiin erikoistuva opiskelija rakentaa osaamisprofiilinsa mukaisesti opinto-suunnitelmansa eri kurssikokonaisuuksista, kuten;
tilastotieteen kursseja
sovelletun matematiikan kursseja
tietoliikennetekniikan kursseja
sensoriverkkoihin liittyviä kursseja
kokonaisarkkitehtuurin rakentamiseen liittyviä kursseja Data-analyysin maisterikoulutus vastaa muuttuvan maailman tilanteeseen, jossa suuri-en data-aineistojen automaattisesta analysoinnista on tullut keskeinen työkalu useilla aloilla. Koulutuksen tavoitteena on antaa opiskelijoille data-analyysiin liittyvää erikois-osaamista sekä tilastollisista menetelmistä että niiden soveltamisesta tietokoneympä-ristöön.
11
Tiedot Maisteri hallitsee laaja-alaisesti tilastotieteen, numeerisen laskennan ja ohjelmoinnin käsitteitä ja menetelmiä, joita käytetään itsenäisen ajattelun ja tutkimuksen perustana. Ymmärtää tilastotieteen ja lähitieteenalojen rajapintojen tietoihin liittyviä tiedon käsit-telyyn liittyviä kysymyksiä ja tarkastelee niitä ja uutta tietoa kriittisesti. Taidot Maisteri kykenee ratkaisemaan vaativia ongelmia hyödyntämällä matemaattista, tilas-tollista, laskennallista ja tietoteknistä erikoisosaamista ja yhdistämällä sitä eri alojen tietoihin. Kykenee kartuttamaan alansa erikoisosaamista ja käytäntöjä sekä seuraa-maan ja arvioimaan tilastotieteen, sovelletun matematiikan ja laskennallisten tieteiden kehitystä. Osaa viestiä ja hyvin suullisesti ja kirjallisesti alan sisäisille ja ulkopuolisille kohderyhmille englannin kielellä. Asenteet Maisteri on kiinnostunut soveltamaan tilastotieteen, sovelletun matematiikan ja tie-teellisen laskennan menetelmiä ongelmien ratkaisuun. Maisteri on utelias ja avoin ti-lastotieteen, sovelletun matematiikan ja tieteellisen laskennan ongelmille. Maisteri on yhteistyökykyinen ja valmis ottamaan vastuuta. Maisteri on valmis opettelemaan ja opettamaan uutta tietoa. Maisteri asennoituu vakavasti eettisiin kysymyksiin ja nou-dattaa eettisiä periaatteita. Jyväskylän yliopiston laaja-alainen ja monitieteellinen toimintaympäristö antaa mah-dollisuuden data-analyysin opiskelijoille käyttää hyväkseen erilaisia datamassoja, ku-ten:
oppimiseen liittyvä data (Learning Analytics)
hiukkaskiihdyttimen tuottama havaintoaineisto
aivotutkimusyksikön tuottama havaintoaineisto
erilaiset prosessien tuottamat data-aineistot (Process mining)
muu empiirinen tutkimusaineisto Kuvassa 2 on esitetty data-analyysin osaamisprofiilin rakentuminen Jyväskylän yliopis-ton toimintaympäristössä.
12
KUVA 2 Data-analyysin osaamisprofiilin rakentuminen
Lukuvuonna 2014–2015 tarjotaan lisäksi muista maisteriohjelmista data-analyysiin liittyviä kursseja:
• ITKST47 Advanced Anomaly Detection: Theory, Algorithms and Applica-tions, 5 op
• ITKST48 Advanced Persistence Threat, 5 op • TJTSM61 Business Analytics and Big Data Management, 5 op • ITKA204 Tietokannat ja tiedonhallinnan perusteet, 5 op
2.1.5 Big data-analyysin jatkokoulutus
Vuonna 2013 julkaistiin seuraavat data-analyysiä käsittelevät väitöskirjat: • Guy Wolf: Big high-dimensional data analysis with diffusion maps. • Ilkka Pölönen: Discovering knowledge in various applications with a novel
hyperspectral imager • Tuomo Sipola: Knowledge discovery using diffusion maps
Valmisteilla on Limor Gavishin väitöskirja Memcached - noSQL and big data databased particularly for caching.
13
LIITE 1 SAATAVILLA OLEVIA VERKKOKURSSEJA
Jyu kurssi Sivusto Tyyppi Nimi URL Yliopisto TIES445 Tiedon-louhinta coursera Kurssi
Computational Methods for Data Analysis
https://www.coursera.org/course/compmethods
University of Washington
TIES445 Tiedon-louhinta coursera Kurssi Computing for Data Analysis
https://www.coursera.org/course/compdata
Johns Hopkins University
TIES445 Tiedon-louhinta coursera Kurssi Web Intelligence and Big Data https://www.coursera.org/course/bigdata
Indian Institute of Technology Delhi
TIES445 Tiedon-louhinta mit materiaali Data Mining
http://ocw.mit.edu/courses/sloan-school-of-management/15-062-data-mining-spring-2003/
Big data engi-neering mit materiaali
Statistics and Visualization for Data Analysis and Inference
http://ocw.mit.edu/resources/res-9-0002-statistics-and-visualization-for-data-analysis-and-inference-january-iap-2009/
Big data engi-neering coursera Kurssi Scientific Computing
https://www.coursera.org/course/scientificcomp
University of Washington
Big data engi-neering coursera Kurssi Computing for Data Analysis
https://www.coursera.org/course/compdata
Johns Hopkins University
Big data engi-neering coursera Kurssi Data Analysis
https://www.coursera.org/course/dataanalysis
Johns Hopkins University
Big data engi-neering coursera Kurssi
High Performance Scientific Computing
https://www.coursera.org/course/scicomp
University of Washington
Big data engi-neering coursera Kurssi Statistics: Making Sense of Data
https://www.coursera.org/course/introstats
University of Toronto
Big data engi-neering coursera Kurssi
Computational Methods for Data Analysis
https://www.coursera.org/course/compmethods
University of Washington
Big data engi-neering coursera Kurssi
Metadata: Organizing and Dis-covering Information
https://www.coursera.org/course/metadata
The University of North Caroli-na at Chapel Hill
Koneoppiminen / Neuroverkot coursera Kurssi Machine Learning https://www.coursera.org/course/ml
Stanford Uni-versity
Koneoppiminen / Neuroverkot coursera Kurssi
Neural Networks for Machine Learning
https://www.coursera.org/course/neuralnets
University of Toronto
Koneoppiminen / Neuroverkot coursera Kurssi Machine Learning
https://www.coursera.org/course/machlearning
University of Washington
Neurobiologia coursera Kurssi Computational Neuroscience https://www.coursera.org/course/compneuro
University of Washington
Neurobiologia coursera Kurssi Dynamical Modeling Methods for Systems Biology
https://www.coursera.org/course/dynamicalmodeling
Icahn School of Medicine at Mount Sinai
Tekoäly / Ko-neoppiminen udacity Kurssi
Introduction to Artificial Intelli-gence https://www.udacity.com/course/cs271
Tekoäly / Ko-neoppiminen edx Kurssi Artificial Intelligence
https://www.edx.org/courses/BerkeleyX/CS188.1x/2013_Spring/about UC Berkeley
TIES324 Signaa-lin osessointi ja -menetelm t coursera Kurssi Digital Signal Processing https://www.coursera.org/course/dsp
École Polytech-nique Fédérale de Lausanne
TIES324 Signaa-lin osessointi ja -menetelm t mit materiaali
Introduction to Communication, Control, and Signal Processing
http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-011-introduction-to-communication-control-and-signal-processing-spring-2010/
TIES324 Signaa-linprosessointi ja -menetelm t mit materiaali
Signal Processing: Continuous and Discrete
http://ocw.mit.edu/courses/mechanical-engineering/2-161-signal-processing-continuous-and-discrete-fall-2008/
TIES324 Signaa-lin osessointi ja -menetelm t mit materiaali Discrete-Time Signal Processing
http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-341-discrete-time-signal-processing-fall-
14
2005/
TIES324 Signaa-lin osessointi ja -menetelm t mit materiaali Digital Signal Processing
http://ocw.mit.edu/resources/res-6-008-digital-signal-processing-spring-2011/
TIES324 Signaa-lin osessointi ja -menetelm t mit materiaali Signals and Systems
http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-003-signals-and-systems-fall-2011/
TIES411 Kone-n k ja kuva-analyysi mit materiaali Machine Vision
http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-801-machine-vision-fall-2004/
TIES411 Kone-n k ja kuva-analyysi mit materiaali
Pattern Recognition for Machine Vision
http://ocw.mit.edu/courses/brain-and-cognitive-sciences/9-913-pattern-recognition-for-machine-vision-fall-2004/
TIES411 Kone-n k ja kuva-analyysi coursera Kurssi Computer Vision
https://www.coursera.org/course/compvision
Technische Universität München
TIES411 Kone-n k ja kuva-analyysi coursera Kurssi
Computer Vision: The Fundamen-tals https://www.coursera.org/course/vision
University of California, Berkeley
TIES411 Kone-n k ja kuva-analyysi coursera Kurssi
Computer Vision: From 3D Re-construction to Visual Recogni-tion
https://www.coursera.org/course/computervision
University of Michigan
TIES411 Kone-n k ja kuva-analyysi coursera Kurssi
Fundamentals of Digital Image and Video Processing https://www.coursera.org/course/digital
Northwestern University
15
LÄHTEET
[1] Synergistic Challenges in Data-Intensive Science and Exascale Computing, Summary Report of the Advanced Scienti Computing Advisory Committee (ASCAC) Subcommittee, March 2013, http://science.energy.gov/~/media/40749FD92B58438594256267425C4AD1.ashx)
[2] Työ- ja elinkeinoministeriö, 21 polkua Kitkattomaan Suomeen, ICT 2015 -työryhmän raportti 17.1.2013, http://www.tem.fi/ajankohtaista/julkaisut/julkaisujen_haku/21_polkua_kitkattomaan_suomeen.98249.xhtml
[3] Keski-Suomen maakunnallinen ICT-strategia 2013,
http://www.keskisuomi.fi/filebank/23660-ks_ict-strategia2013.pdf
[4] Tuottava ja uudistuva Suomi – Digitaalinen agenda vuosille 2011–2020, Valtio-
neuvoston selonteko eduskunnalle 2010,
http://www.lvm.fi/julkaisu/1225475/tuottava-ja-uudistuva-suomi-digitaalinen-
agenda-vuosille-2011-2020