data-analyysin tutkimus ja opetus › it › fi › ohjeita-opiskelijalle ›...

15
DATA-ANALYYSIN TUTKIMUS JA OPETUS 25.8.2014 JYVÄSKYLÄN YLIOPISTO INFORMAATIOTEKNOLOGIAN TIEDEKUNTA 2014

Upload: others

Post on 28-Jun-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

DATA-ANALYYSIN TUTKIMUS JA OPETUS

25.8.2014

JYVÄSKYLÄN YLIOPISTO

INFORMAATIOTEKNOLOGIAN TIEDEKUNTA

2014

Page 2: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

SISÄLLYS

1 DATA-ANALYYSI ........................................................................................................ 4

1.1 Data-analyysin osaamisen tarve ..................................................................... 4

1.2 Data-analyysin ajankohtaisuus ....................................................................... 5

1.3 Big datatutkimus ............................................................................................. 7

1.3.1 Perusteita .............................................................................................. 7

1.3.2 Data-analyysi Jyväskylän yliopiston kesäkoulussa 2013 ....................... 8

1.3.3 Big data-analyysiin liittyviä hankkeita ................................................... 8

2 DATA-ANALYYSIN KOULUTUS .................................................................................. 9

2.1.1 Tilastotieteen maisteritutkinto ............................................................. 9

2.1.2 Sovelletun matematiikan maisteritutkinto ........................................... 9

2.1.3 Laskennallisten tieteiden maisteritutkinto ......................................... 10

2.1.4 Data-analyysin osaamisprofiili ............................................................ 10

2.1.5 Big data-analyysin jatkokoulutus ........................................................ 12

LIITE 1 SAATAVILLA OLEVIA VERKKOKURSSEJA ............................................................... 13

LÄHTEET ........................................................................................................................... 15

Page 3: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

3

TIIVISTELMÄ Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut-kimukselle asetettuja vaatimuksia, joita on esitetty Suomen digitaalisessa agendassa (2011), ICT-2015 työryhmän raportissa (2013) ja Keski-Suomen ICT-strategiassa (2013). [2] [3] [4] Data-analyysikoulutus perustuu vahvaan tietotekniikan sekä matematiikan ja tilastotie-teen laitoksilla toteutettavaan tutkimukseen ja opetukseen. Koulutuksella vastataan muuttuvan maailman tilanteeseen, jossa suurien data-aineistojen automaattisesta analysoinnista on tullut keskeinen työkalu useilla aloilla. Digitalisoinnin ja erilaisten sensoritekniikoiden avulla tietomassat kasvavat huimaa vauhtia ja sekä tutkimus että teollisuus ovat havainneet data-analyysin tuomat mah-dollisuudet. Ala vaatii kuitenkin erikoistunutta osaamista, sekä tilastollisista menetel-mistä, että niiden soveltamisesta tietokoneisiin, eikä vastaava koulutusta ole riittävästi. Data-analyysiin profiloitumisen tarkoituksena on kouluttaa osaajia tämän tarpeen täyt-tämiseksi. Opiskelijoita koulutetaan matematiikan ja tilastotieteen sekä tietotekniikan laitoksen yhteistyönä. Opiskelijoilla on valmistuttuaan hyvät mahdollisuudet siirtyä teollisuuden ja elinkeinoelämän vaativiin asiantuntijatehtäviin tai jatkaa tutkimustyötä poikkitieteellisissä tutkimusryhmissä.

Page 4: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

1 DATA-ANALYYSI

1.1 Data-analyysin osaamisen tarve

Valtioneuvoston selonteon Tuottava ja uudistuva Suomi – Digitaalinen agenda vuosille 2011–2020 mukaan tieto- ja viestintäteknologinen kehitys vaikuttaa merkittävästi kou-lutuksen, tutkimuksen ja kulttuurin tuottamiseen, välittämiseen ja hyödyntämisen ta-poihin. Sähköisen asioinnin yleistyminen sekä tieto- ja viestintätekniikan hyödyntämi-nen laajasti kaikessa työelämässä edellyttää koko väestöltä riittäviä tietoyhteiskunta- ja mediataitoja. Lähes kaikki yhteiskunnan elintärkeät toiminnot, mukaan lukien kan-sallinen ja kansainvälisiin yhteisöihin liittyvä päätöksenteko, ovat jo sidoksissa tieto- ja viestintäinfrastruktuurin sekä tietojärjestelmien toimintaan. [4] Tieto- ja viestintäteknologinen kehitys vaikuttaa merkittävästi koulutuksen, tutkimuk-sen ja kulttuurin tuottamiseen, välittämiseen ja hyödyntämisen tapoihin. Sähköisen asioinnin yleistyminen sekä tieto- ja viestintätekniikan hyödyntäminen laajasti kaikessa työelämässä edellyttää koko väestöltä riittäviä tietoyhteiskunta- ja mediataitoja. [4] ICT 2015 työryhmä toteaa: ”Digitaalisessa maailmassa informaation ja tallennetun tie-don määrä on valtava. Kun yhdistetään älykkäästi ja reaaliajassa näennäisesti turhaa tietoa, pystytään luomaan täysin uudentyyppistä, toimialojen rajoja rikkovaa tietoa. Big data on maailmalla kuuma tutkimuksen ja soveltamisen kohde. Suomen osaaminen tällä alueella on kapeaa, vaikkakin tietyiltä aloilta löytyy huippuosaamista. Big data liittyy läheisesti muihin Suomen kriittisiin avainosaamisalueisiin. Tietoliikenteen osaaji-na olemme perinteisesti käsitelleet suuria datamääriä. Tietoturva on tärkeää kaikissa big data -tyyppisissä sovelluksissa ja tietovarannoista louhittavien tiedonjyvästen in-tegrointi vaatii vahvaa ohjelmisto- ja tietojenkäsittelyosaamista. Julkisella puolella tie-tovarantojen avaaminen, yhteinen ICT -palveluarkkitehtuuri ja perinteisesti Suomessa hyvin toimiva julkinen – yksityinen -yhteistyö avaa mielenkiintoisia mahdollisuuksia. Suurimmaksi ongelmaksi big data tiedon soveltamisessa ja tietojen avaamisessa toi-mijat kokevat, että organisaatioilla ei ole riittävästi asiantuntemusta. Organisaatiot tarvitsevat tähän osaajia ja koulutusta.” [2]

Maaliskuussa 2013 Advanced Scientic Computing Advisory Committee (ASCAC) alako-mitea julkaisi raportin “Synergistic Challenges in Data-Intensive Science and Exascale Computing”, jossa käsiteltiin “Big Data and the Fourth Paradigm” -teemaa. Raportin mukaan “Historically, the two dominant paradigms for scientific discovery have been theory and experiments, with large-scale computer simulations emerging as the third paradigm in the 20th century. In many cases, large-scale simulations are accompanied by the challenges of data-intensive computing. Overcoming the challenges of data-

Page 5: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

5

intensive computing has required optimization of data movement across multiple lev-els of memory hierarchies, and these considerations have become even more im-portant as we prepare for exascale computing. The approaches taken to address these challenges include (a) fast data output from a large simulation for future pro-cessing/archiving; (b) minimization of data movement across caches and other levels of the memory hierarchy; (c) optimization of communication across nodes using fast and low-latency networks, and communication optimization; and (d) effective co-design, usage and optimization of system components from architectures to software.” [1] Over the past decade, a new paradigm for scientific discovery is emerging due to the availability of exponentially increasing volumes of data from large instruments such as telescopes, colliders, and light sources, as well as the proliferation of sensors and high-throughput analysis devices. Further, data sources, analysis devices, and simulations are connected with current-generation networks that are faster and capable of moving significantly larger volumes of data than in previous generations. These trends are popularly referred to as big data. However, generation of data by itself is of not much value unless the data can also lead to knowledge and actionable insights. Thus, the fourth paradigm, which seeks to exploit information buried in massive datasets to drive scientific discovery, has emerged as an essential complement to the three exist-ing paradigms. The complexity and challenge of the fourth paradigm arises from the increasing velocity, heterogeneity, and volume of data generation.” [1] Jyväskylän yliopiston IT-tiedekunta on kehittänyt data-analyysin koulutusta ja tutki-musta systemaattisesti yhteistyössä matematiikan ja tilastotieteen laitoksen sekä kan-sainvälisten huippuyliopistojen, Tel Avivin ja Yalen yliopistojen, kanssa. IT-tiedekunnan monialainen osaaminen luo hyvän pohjan alan koulutuksen ja tutkimuksen kehittämi-seen. Kehitystyötä tullaan jatkamaan sekä metodien että sovellusten osalta (käsittäen kyberturvallisuuden, hyperspektrikameran kuvantamisdatan käsittelyn, big datan sekä Business Intelligent:iin liittyvän datan käsittelyn).

1.2 Data-analyysin ajankohtaisuus

Data-analyysillä tarkoitetaan menetelmiä ja lähestymistapoja, joilla eritavoilla (senso-rit, videokuvat, signaalit, raportointi) kerätystä tiedosta pyritään muodostamaan ky-seistä toimintaa kuvaavia malleja, sekä korkealuokkaista analysointia tai tarkempaa, tilastollisesti luotatettavaa informaatiota. Data-analyysin metodiikka voidaan tiivistää oheiseen kuvaan, joka mukailee Fayyed’n Knowledge Discovery in Databases -prosessia. Oleelliset vaiheet kaikessa tekemisessä ovat data valinta, sen esiprosessoin-ti, muuntaminen diskreeteiksi tai jatkuviksi havainnoiksi, rakenteiden löytäminen da-tan louhimisen avulla ja löydettyjen rakenteiden tulkitseminen ja varmistaminen. Ku-vassa 1 on esitetty data-analyysitutkimuksen prosessi.

Page 6: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

6

KUVA 1 Data-analyysin tutkimusprosessi

Googlen hallituksen puheenjohtaja Eric Schmidt totesi puheessaan, että 5 eksabittiä (1018) dataa on luotu ihmiskunnan alkuajoista vuoteen 2003 mennessä. Nyt yhtä paljon dataa syntyy joka toinen päivä. Data tulvan keskellä ilmaantuu suuria mahdollisuuksia niille, jotka pystyvät ymmärtämään dataa, irrottamaan siitä oleellisen ja visualisoimaan tai muuten selventämään tämän tiedon muille. Tähän massiivisen datan louhimiseen tarvitaan uusia työkaluja ja menetelmiä, mutta ennen kaikkea uusia osaajia – data ana-lyytikkoja. ICT 2015 – työryhmä [2] on raportissaan tunnistanut Suomen menestymisen kannalta seuraavat teknologiseen osaamiseen liittyvät kehityskohteet:

On kehitettävä syvää tietojenkäsittelyosaamista (Computer Science).

On varmistettava kriittinen osaamiskeskittymä avainteknologioissa, joita ovat digitaaliset palvelut ja sisällöt, pelillisyys, tietoturva, mobiliteetti ja big data.

On laitettava kuntoon tutkimuksen, soveltamisen, tuotteistamisen ja kaupallis-tamisen ketju.

On huomioitava ICT yleisen koulutuspolitiikan kehittämisessä. Big Datan markkina on voimakkaasti kasvava. Vuonna 2011 kokonaismarkkina oli noin 5,1 miljardia dollaria ja vuonna 2013 sen arvioidaan olevan vajaa 17 miljardia ja kasva-van vuoteen 2016 mennessä lähes 55 miljardiin dollariin. Eri yrityksille kertyy yhä suurempia datamääriä asiakkaista ja heidän ostotottumuksis-taan. Ihmisillä on useita eri liikkeiden kanta-asiakaskortteja, joiden käytön perusteella yritykset voivat luoda asiakaskohtaisia profiileita. Suurilla yrityksillä ongelmaksi on muodostunut valtavien asiakastietojen käsittely. Kuinka selviytyä miljoonien asiakkai-den päivittäisten ostotapahtumien käsittelystä ja analyysistä? Esimerkiksi peliyhtiö Roviolla on yli 260 miljoonaa aktiivista Angry Birds pelaajaa, joilta saadaan erilaista palautetta peleistä ja pelaamisesta. Big data-analyysi on tehokas vaihtoehto näin suu-rien käyttäjätietojen tehokkaaseen analyysiin.

Page 7: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

7

1.3 Big datatutkimus

1.3.1 Perusteita

Suurien datamassojen tutkimusta toteutetaan tilastotieteessä, laskennallisten tietei-den ja sovelletun matematiikan alueilla. Tilastotieteen tutkimusaloja ovat mm:

Spatiaalinen tilastotiede tarkastelee paikkatietoaineistojen tilastollista ana-lysointia ja mallinnusta sekä tilastollista kuva-analyysia

Aikasarja-analyysin tutkimus kohdistuu tila-avaruusmallien ja monimuuttujais-ten aikasarjamallien teoriaan ja metodikehitykseen.

Rakenneyhtälömallien tutkimus on kompleksisten monimuuttujaisten aineisto-jen ja pitkittäisaineistojen mallinnusta

Parametrittomien ja robustien monimuuttujamenetelmien tutkimus on merkki- ja järjestyslukuvektoreihin perustuvien monimuuttujamenetelmien teoreettista kehitystyötä

Biometrian ja ympäristötilastotiede on tutkimusalue, joka sisältää populaation mallinnusta ja vesistöjen ekologisen tilan arviointia

Erityisen kiinnostava tutkimusalue ovat spatiaaliset mallit. Paikkatietoon perustuvia ennustemalleja voidaan tuottaa päätöksentekijöitä varten muodostamalla datasta ja-kaumia, kasautumia, riippuvuuksia ja poikkeamia. Havainnoista voidaan tehdä päätel-miä luoda hypoteeseja jatkoanalyysiin. Mobiiliteknologian alueella paikkatiedolla on yhä suurempia sovellusalueita. Spatiaalisten mallien rakentamisen tavoitteena on tut-kittavan ilmiön ymmärtäminen, jotta voidaan rakentaa malli ilmiön käyttäytymisen ennustamista varten. Laskennallisten tieteiden tutkimusaloja ovat matemaattinen mallintaminen, luotetta-va malli- ja datapohjainen simulointi, optimointi, adaptiiviset ja tehokkaat numeeriset laskentamenetelmät, epävarmuuden huomioiminen numeerisessa simuloinnissa, ha-jautettujen systeemien säätö, spline ja spline wavelet tekniikat signaalin ja kuvankäsit-telyssä, dynaamiset systeemit ja nanoelektroniikan mallinnus. Sovelletun matematiikan tutkimusaloja ovat mm. diskreetti matematiikka, matemaat-tinen mallintaminen, funktionaalianalyysi, mitta- ja integraaliteoria ja kompleksiana-lyysi. Jyväskylän yliopistossa data-analyysin tutkimusaloja ovat analysointimenetelmien kehittäminen, erityisesti numeriikka ja massiivisen datan luokittelutekniikat, hyper-spektrikameran datan analysointitekniikoiden kehittäminen ja tekniikan soveltaminen sen osa-alueilla, kuten solubiologia, lääketiede, ympäristötiede, maa- ja metsätalous, kemialliset aseet, rikospaikkatutkimustekniikka. Lisäksi tutkimukseen liittyviä yhteis-työhankkeita on mm. fysiikan ja aivotutkimuksen alueilla.

Page 8: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

8

1.3.2 Data-analyysi Jyväskylän yliopiston kesäkoulussa 2013

Jyväskylän kansainvälisessä kesäkoulussa elokuussa 2013 professori Amir Averbuch piti kurssin (2 op) aiheesta: Advanced Methods for Classification of Big High Dimensional Data.

1.3.3 Big data-analyysiin liittyviä hankkeita

Data-analyysin alueella on toteutunut ja käynnissä seuraavia hankekokonaisuuksia.

Data-analyysin vuonna 2013 päättynyt hanke:

Professori Timo Hämäläinen: Suurien moniulotteisten datajoukkojen järjestä-minen ja analysointi, HIDE-hanke (1.1.2012–31.12.2013, Tekes)

Data-analyysin käynnissä olevia tutkimushankkeita:

Professori Pekka Neittaanmäki: New System for Cyber Attacks Protection of Critical Infrastructures 2012–2014, CAP-projekti (1.11.2012–31.10.2014, Tekes)

Professori Jari Veijalainen: Tiedonkaivuu sosiaalisesta mediasta, MineSocMed-projekti (1.9.2013–31.8.2017, SA) tarkoitus kehittää sosiaalisen median ana-lyysialgoritmeja.

Professori Timo Hämäläinen: Kiinteistöautomaatiojärjestelmien datan älykäs analysointi, KIIAUDATA-hanke (1.1.2013–31.12.2014, Tekes)

Professor Amir Averbuch: MeBUD: Methods for Big Unstructured High Dimen-sional Data (1.8.2014 - 30.7.2018, haettu rahoitusta SA)

Page 9: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

9

2 DATA-ANALYYSIN KOULUTUS

Suurien tietomassojen analyysin opiskelu toteutetaan kolmen maisteriohjelman sisällä, joissa opiskelija voi profiloitua data-analyysiin. Tietotekniikan laitoksella toteutetaan laskennallisten tieteiden ja sovelletun matematiikan maisteriohjelmat ja Matematiikan ja tilastotieteen laitoksella toteutetaan tilastotieteen maisteriohjelma.

2.1.1 Tilastotieteen maisteritutkinto

Tilastotieteen maisteriopinnot sisältävät sekä teoreettisia opintoja että tilastotieteen sovelluksia ja tähtäävät ammattitilastotieteilijän taitoon. Tilastotiede kehittää malleja ja menetelmiä numeerisen havaintoaineiston keräämiseen, kuvaamiseen ja analysoin-tiin ja tähän liittyvään laskennalliseen toteuttamiseen. Tilastotieteellä on kiinteä yhteys lähes kaikkiin empiiristä tutkimusta tekeviin tieteenaloihin: tilastollisia menetelmiä sovelletaan niin informaatioteknologiassa, bio- ja ympäristötieteissä, taloustieteessä, lääketieteessä kuin yhteiskunta- ja kasvatustieteissäkin. Tilastotieteessä on kysymys reaalimaailman ilmiöiden mallintamisesta ja sen osaamista tarvitaan yhä enemmän yhteiskunnassa ja elinkeinoelämässä, missä tutkimusaineistojen ja tietovarantojenana-lyyseilla ja mallinnuksella halutaan tuottaa jalostettua tietoa päätöksenteon tueksi. Tilastotieteen opetuksen tavoitteena on antaa valmiudet edustavien havaintoaineisto-jen keräämiseen, aineistojen kuvaamiseen ja analysointiin sekä yleensä numeerisesti mitattavissa olevienilmiöiden pätevään tilastolliseen mallintamiseen. Tilastotieteellä on käytettävissä erilaisia analysointityökaluja data-analyysin toteuttamiseen.

2.1.2 Sovelletun matematiikan maisteritutkinto

Sovelletun matematiikan avulla pyritään ratkaisemaan tosielämän ongelmia. Sovelle-tun matematiikan tavoitteena on mallintaa erilaisia ilmiöitä, kuvailla niitä ja yrittää ymmärtää niitä. Sovelletun matematiikan opiskelussa yhdistyy tieteellisen laskennan käsitteet ja menetelmät, joita käytetään kysymyksiin, jotka ilmentyvät matematiikan ja muiden tieteenalojen rajapinnoissa. Jyväskylän yliopistossa opinnoissa keskitytään sel-laisiin osa-alueisiin, kuten funktionaalianalyysi, mitta- ja integraaliteoria, kompleksi-analyysi, numeerinen analyysi, optimointi ja simulointi.

Valmistunut maisteri hallitsee laaja-alaisesti sovelletun matematiikan ja tieteellisen laskennan käsitteitä ja menetelmiä, joita käytetään itsenäisen ajattelun ja tutkimuksen perustana. Ymmärtää matematiikan ja lähitieteenalojen rajapintojen tietoihin liittyviä laskennallisia kysymyksiä ja tarkastelee niitä ja uutta tietoa kriittisesti.

Page 10: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

10

Sovellettu matematiikka tuottaa matemaattisia työkaluja data-analyysin toteuttami-seen.

2.1.3 Laskennallisten tieteiden maisteritutkinto

Laskennallisten tieteiden maisterikoulutuksessa käsitellään laaja-alaisesti tilastotie-teen, numeerisen laskennan ja ohjelmoinnin käsitteitä ja menetelmiä. Laskennallisten tieteiden maisteri tuntee jatkuvan ja diskreetin simuloinnin periaatteet ja sovelluskoh-teet. Hän osaa listata jatkuvien simulointimallien tavallisimmat diskretisointimenetel-mät ja niiden tehokkaan toteuttamisen perusperiaatteet moderneissa tietokonearkki-tehtuureissa. Lisäksi hän osaa nimetä yksi- ja monitavoitteisen epälineaarisen opti-moinnin periaatteet ja ratkaisumenetelmät.

Hän kykenee muodostamaan tekniikan ja luonnontieteiden ilmiöille matemaattisia simulointimalleja sekä osaa rakentaa mallien ratkaisemiseen tehokkaat ohjelmistot aliohjelmakirjastoja tai vastaavia valmiita komponentteja hyödyntäen. Hän osaa muo-dostaa ja ratkaista numeerisesti simulointimalleihin pohjautuvia optimointitehtäviä. Laskennalliset tieteet antavat erilaisia numeerisia työkaluja data-analyysin toteuttami-seen.

2.1.4 Data-analyysin osaamisprofiili

Edellä kuvatut kolme maisterikoulutusta antavat opiskelijalle mahdollisuuden profiloi-tua suurten datamassojen analyysiin kunkin tieteenalan näkökulmasta ja tutkimustyö-kaluja hyväksikäyttäen. Data-analyysissä opetetaan ja tutkitaan menetelmiä ja lähestymistapoja, joilla erita-voin kerätystä tiedosta (data) pyritään muodostamaan malleja ja korkeampaa tai tar-kempaa informaatiota. Opetuksessa korostuu keskeisinä tekijöinä datan kerääminen, käsittely, visualisointi ja arvon lisäys. Data-analyysiin erikoistuva opiskelija rakentaa osaamisprofiilinsa mukaisesti opinto-suunnitelmansa eri kurssikokonaisuuksista, kuten;

tilastotieteen kursseja

sovelletun matematiikan kursseja

tietoliikennetekniikan kursseja

sensoriverkkoihin liittyviä kursseja

kokonaisarkkitehtuurin rakentamiseen liittyviä kursseja Data-analyysin maisterikoulutus vastaa muuttuvan maailman tilanteeseen, jossa suuri-en data-aineistojen automaattisesta analysoinnista on tullut keskeinen työkalu useilla aloilla. Koulutuksen tavoitteena on antaa opiskelijoille data-analyysiin liittyvää erikois-osaamista sekä tilastollisista menetelmistä että niiden soveltamisesta tietokoneympä-ristöön.

Page 11: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

11

Tiedot Maisteri hallitsee laaja-alaisesti tilastotieteen, numeerisen laskennan ja ohjelmoinnin käsitteitä ja menetelmiä, joita käytetään itsenäisen ajattelun ja tutkimuksen perustana. Ymmärtää tilastotieteen ja lähitieteenalojen rajapintojen tietoihin liittyviä tiedon käsit-telyyn liittyviä kysymyksiä ja tarkastelee niitä ja uutta tietoa kriittisesti. Taidot Maisteri kykenee ratkaisemaan vaativia ongelmia hyödyntämällä matemaattista, tilas-tollista, laskennallista ja tietoteknistä erikoisosaamista ja yhdistämällä sitä eri alojen tietoihin. Kykenee kartuttamaan alansa erikoisosaamista ja käytäntöjä sekä seuraa-maan ja arvioimaan tilastotieteen, sovelletun matematiikan ja laskennallisten tieteiden kehitystä. Osaa viestiä ja hyvin suullisesti ja kirjallisesti alan sisäisille ja ulkopuolisille kohderyhmille englannin kielellä. Asenteet Maisteri on kiinnostunut soveltamaan tilastotieteen, sovelletun matematiikan ja tie-teellisen laskennan menetelmiä ongelmien ratkaisuun. Maisteri on utelias ja avoin ti-lastotieteen, sovelletun matematiikan ja tieteellisen laskennan ongelmille. Maisteri on yhteistyökykyinen ja valmis ottamaan vastuuta. Maisteri on valmis opettelemaan ja opettamaan uutta tietoa. Maisteri asennoituu vakavasti eettisiin kysymyksiin ja nou-dattaa eettisiä periaatteita. Jyväskylän yliopiston laaja-alainen ja monitieteellinen toimintaympäristö antaa mah-dollisuuden data-analyysin opiskelijoille käyttää hyväkseen erilaisia datamassoja, ku-ten:

oppimiseen liittyvä data (Learning Analytics)

hiukkaskiihdyttimen tuottama havaintoaineisto

aivotutkimusyksikön tuottama havaintoaineisto

erilaiset prosessien tuottamat data-aineistot (Process mining)

muu empiirinen tutkimusaineisto Kuvassa 2 on esitetty data-analyysin osaamisprofiilin rakentuminen Jyväskylän yliopis-ton toimintaympäristössä.

Page 12: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

12

KUVA 2 Data-analyysin osaamisprofiilin rakentuminen

Lukuvuonna 2014–2015 tarjotaan lisäksi muista maisteriohjelmista data-analyysiin liittyviä kursseja:

• ITKST47 Advanced Anomaly Detection: Theory, Algorithms and Applica-tions, 5 op

• ITKST48 Advanced Persistence Threat, 5 op • TJTSM61 Business Analytics and Big Data Management, 5 op • ITKA204 Tietokannat ja tiedonhallinnan perusteet, 5 op

2.1.5 Big data-analyysin jatkokoulutus

Vuonna 2013 julkaistiin seuraavat data-analyysiä käsittelevät väitöskirjat: • Guy Wolf: Big high-dimensional data analysis with diffusion maps. • Ilkka Pölönen: Discovering knowledge in various applications with a novel

hyperspectral imager • Tuomo Sipola: Knowledge discovery using diffusion maps

Valmisteilla on Limor Gavishin väitöskirja Memcached - noSQL and big data databased particularly for caching.

Page 13: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

13

LIITE 1 SAATAVILLA OLEVIA VERKKOKURSSEJA

Jyu kurssi Sivusto Tyyppi Nimi URL Yliopisto TIES445 Tiedon-louhinta coursera Kurssi

Computational Methods for Data Analysis

https://www.coursera.org/course/compmethods

University of Washington

TIES445 Tiedon-louhinta coursera Kurssi Computing for Data Analysis

https://www.coursera.org/course/compdata

Johns Hopkins University

TIES445 Tiedon-louhinta coursera Kurssi Web Intelligence and Big Data https://www.coursera.org/course/bigdata

Indian Institute of Technology Delhi

TIES445 Tiedon-louhinta mit materiaali Data Mining

http://ocw.mit.edu/courses/sloan-school-of-management/15-062-data-mining-spring-2003/

Big data engi-neering mit materiaali

Statistics and Visualization for Data Analysis and Inference

http://ocw.mit.edu/resources/res-9-0002-statistics-and-visualization-for-data-analysis-and-inference-january-iap-2009/

Big data engi-neering coursera Kurssi Scientific Computing

https://www.coursera.org/course/scientificcomp

University of Washington

Big data engi-neering coursera Kurssi Computing for Data Analysis

https://www.coursera.org/course/compdata

Johns Hopkins University

Big data engi-neering coursera Kurssi Data Analysis

https://www.coursera.org/course/dataanalysis

Johns Hopkins University

Big data engi-neering coursera Kurssi

High Performance Scientific Computing

https://www.coursera.org/course/scicomp

University of Washington

Big data engi-neering coursera Kurssi Statistics: Making Sense of Data

https://www.coursera.org/course/introstats

University of Toronto

Big data engi-neering coursera Kurssi

Computational Methods for Data Analysis

https://www.coursera.org/course/compmethods

University of Washington

Big data engi-neering coursera Kurssi

Metadata: Organizing and Dis-covering Information

https://www.coursera.org/course/metadata

The University of North Caroli-na at Chapel Hill

Koneoppiminen / Neuroverkot coursera Kurssi Machine Learning https://www.coursera.org/course/ml

Stanford Uni-versity

Koneoppiminen / Neuroverkot coursera Kurssi

Neural Networks for Machine Learning

https://www.coursera.org/course/neuralnets

University of Toronto

Koneoppiminen / Neuroverkot coursera Kurssi Machine Learning

https://www.coursera.org/course/machlearning

University of Washington

Neurobiologia coursera Kurssi Computational Neuroscience https://www.coursera.org/course/compneuro

University of Washington

Neurobiologia coursera Kurssi Dynamical Modeling Methods for Systems Biology

https://www.coursera.org/course/dynamicalmodeling

Icahn School of Medicine at Mount Sinai

Tekoäly / Ko-neoppiminen udacity Kurssi

Introduction to Artificial Intelli-gence https://www.udacity.com/course/cs271

Tekoäly / Ko-neoppiminen edx Kurssi Artificial Intelligence

https://www.edx.org/courses/BerkeleyX/CS188.1x/2013_Spring/about UC Berkeley

TIES324 Signaa-lin osessointi ja -menetelm t coursera Kurssi Digital Signal Processing https://www.coursera.org/course/dsp

École Polytech-nique Fédérale de Lausanne

TIES324 Signaa-lin osessointi ja -menetelm t mit materiaali

Introduction to Communication, Control, and Signal Processing

http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-011-introduction-to-communication-control-and-signal-processing-spring-2010/

TIES324 Signaa-linprosessointi ja -menetelm t mit materiaali

Signal Processing: Continuous and Discrete

http://ocw.mit.edu/courses/mechanical-engineering/2-161-signal-processing-continuous-and-discrete-fall-2008/

TIES324 Signaa-lin osessointi ja -menetelm t mit materiaali Discrete-Time Signal Processing

http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-341-discrete-time-signal-processing-fall-

Page 14: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

14

2005/

TIES324 Signaa-lin osessointi ja -menetelm t mit materiaali Digital Signal Processing

http://ocw.mit.edu/resources/res-6-008-digital-signal-processing-spring-2011/

TIES324 Signaa-lin osessointi ja -menetelm t mit materiaali Signals and Systems

http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-003-signals-and-systems-fall-2011/

TIES411 Kone-n k ja kuva-analyysi mit materiaali Machine Vision

http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-801-machine-vision-fall-2004/

TIES411 Kone-n k ja kuva-analyysi mit materiaali

Pattern Recognition for Machine Vision

http://ocw.mit.edu/courses/brain-and-cognitive-sciences/9-913-pattern-recognition-for-machine-vision-fall-2004/

TIES411 Kone-n k ja kuva-analyysi coursera Kurssi Computer Vision

https://www.coursera.org/course/compvision

Technische Universität München

TIES411 Kone-n k ja kuva-analyysi coursera Kurssi

Computer Vision: The Fundamen-tals https://www.coursera.org/course/vision

University of California, Berkeley

TIES411 Kone-n k ja kuva-analyysi coursera Kurssi

Computer Vision: From 3D Re-construction to Visual Recogni-tion

https://www.coursera.org/course/computervision

University of Michigan

TIES411 Kone-n k ja kuva-analyysi coursera Kurssi

Fundamentals of Digital Image and Video Processing https://www.coursera.org/course/digital

Northwestern University

Page 15: DATA-ANALYYSIN TUTKIMUS JA OPETUS › it › fi › ohjeita-opiskelijalle › tutkinto...Data-analyysin maisterikoulutus tukee big datan ja data-analyysin koulutukselle ja tut kimukselle

15

LÄHTEET

[1] Synergistic Challenges in Data-Intensive Science and Exascale Computing, Summary Report of the Advanced Scienti Computing Advisory Committee (ASCAC) Subcommittee, March 2013, http://science.energy.gov/~/media/40749FD92B58438594256267425C4AD1.ashx)

[2] Työ- ja elinkeinoministeriö, 21 polkua Kitkattomaan Suomeen, ICT 2015 -työryhmän raportti 17.1.2013, http://www.tem.fi/ajankohtaista/julkaisut/julkaisujen_haku/21_polkua_kitkattomaan_suomeen.98249.xhtml

[3] Keski-Suomen maakunnallinen ICT-strategia 2013,

http://www.keskisuomi.fi/filebank/23660-ks_ict-strategia2013.pdf

[4] Tuottava ja uudistuva Suomi – Digitaalinen agenda vuosille 2011–2020, Valtio-

neuvoston selonteko eduskunnalle 2010,

http://www.lvm.fi/julkaisu/1225475/tuottava-ja-uudistuva-suomi-digitaalinen-

agenda-vuosille-2011-2020