Årsrapport 2009-2010 visual analytics · det fortsatta utvecklingsarbetet med att ta fram en...

18
Årsrapport 2009-2010 Visual Analytics National Center for Visual Analytics VITA/ITN Linköpings Universitet

Upload: others

Post on 13-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

Årsrapport 2009-2010 Visual Analytics

National Center for Visual Analytics VITA/ITN Linköpings Universitet

Page 2: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

1. Projektets organisation och ledning

National Center of Visual Analytics NCVA etablerades i maj 2008 vid ITN/VITA Linköping universitet med finansiellt stöd från KK-stiftelsens Visualiseringsprogram, universitetet samt våra partners från näringslivet och statliga verk. Visualisering, interaktion, kognition och visuellt analytiskt tänkande ingår som grundläggande pelare i denna på senaste tiden etablerade vetenskapen Visual Analytics. Målsättning för NCVA är:

• avancerad GeoVisual och Visual Analytics verktygslåda utvecklas för att skräddarsy prototyper i nära samarbete med partners och som skapar nya möjligheter och synergieffekter.

• användningsområden inkluderar miljö, väder, energi, demografiska data, logistik och allmän infrastruktur, uthållighet, bioinformatik samt nästa generation mobila nätverk.

• plattform för att stärka samarbete med näringslivet genom utvärderingar, data, områdesexpertis, projektarbeten och finansiellt stöd.

• näringslivet hittar ingångar till pågående forsknings och utvecklingsarbete samt skapar intressanta synergieffekter genom ett samspel mellan kunskaper.

• plattform för samarbete med andra starka internationella forskningsmiljöer samt internationella projekt. • fokus på tillämpad forskning i samarbete med stark forskningsinriktade miljöer inom näringslivet.

Följande företag och institutioner ingår i NCVA’s nuvarande organisation: Sveriges meterologiska och hydrologiska institut SMHI (avd chef Jan-Olof Eriksson, Dr Lennart Cederberg) Unilever Research Port Sunlight England (Dr Jane Shaw) SCB Stockholm och Örebro (avd chef Marie Haroldsson) Danmark Statistik (avd chef Lars Trygesen) ny Ericsson Research Linköping (avd chef Ove Linell och Johan Moe) OECD (Chief Statistician and Director Trevor Fletcher) ny Göteborg Stad Stadskansliet (Jonas Andersson samhällsanalys och statistik) ny The Economist (Dr Helen Joyce) ny Norrköping Science Park (Bo Sundborn) Linköpings Universitet Organisationen leds av en styrkommitté med huvudfinansiärer (SMHI, Ericsson, Unilever, OECD) med Professor Anders Ynnerman som ordförande och professor Mikael Jern som ansvarig chef för verksamheten. Tre doktorander är associerade till NCVA och delvis finansierade av SMHI (Patrik Lundblad 65%), Unilever (Sara Johansson 65%) samt Ericsson/Vinnova (Ho Van Quan 45%). Varje doktorand har en aktiv bi-handledare på respektive företag/institut. Flera examensarbetare har under sina 5 arbetsmånader starkt bidragit till NCVA’s forskningsresultat och verksamhet inklusive Jonas Thoursie som är knuten till SMHI’s projektverksamhet, Markus Johnsson till OECD och Gunnar Strid till SMHI – samtliga med lokal förankring och handledning. Det fortsatta utvecklingsarbetet med att ta fram en avancerad verktygslåda anpassad till Web 2.0 miljön har involverat de flesta inom projektet och koordinerats av civilingenjör Tobias Åström. Denna verktygslåda GAV Flash Framework (legoteknik) är ett grundläggande fundament för NCVA’s så framgångsrika forskningsverksamhet (se nedan) och har använts inom samtliga projekt. Omfattande kvalitativa och kvantitativa utvärdering har genomförts i samarbete med våra partners. Många av våra partners (SCB, SMHI, Ericsson, Unilever, OECD och nya partners Danmark Statistik, Göteborgs Stad samt The Economist) har bidragit till projekten med 1000-tals arbetstimmar. Dessa har också medverkat i att utvärdera samt föreslå förbättringar för verktygslådan och dess tillämpningar samt bidragit med verkliga data. Samarbeter mellan universitetsforskning och områdesexperter har därför varit exceptionellt bra inom projektet vilket kan märkas på de många resultat som redovisas här. Detta speciellt starka engagemang från våra partners, som också har redovisats genom ett mycket stort antal investerade timmar i projekten, har troligen sin grund i att den nya verktygslåda som legat rätt i tiden för våra partners och gett dem en stärkt konkurrensposition.

Page 3: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

NCVA har fortsatt med att utveckla sin hemsida http://ncva.itn.liu.se för att kommunicera och sprida kunskap om resultaten till en bredare krets och som uppdateras regelbundet med text, bilder, tillämpningar och demonstratorer samt vilka andra aktiviteter som genomförts. Hemsidan fungerar därmed som en naturlig mötesplats för projektets partners men också som en vetenskaplig mötesplats för tillämpad forskning inom Visual Analytics.

Verktygslådan GAV Flash får användas fritt inom forskning med restriktion enligt GNU licens dvs. ej för ekonomisk vinning inom kommersiellt bruk samt källan måste alltid anges. Partners har access till verktygslådan som används för de applikationer som utvecklas tillsammans med NCVA. Se exempel nedan. GAV Flash används också inom undervisningen.

De första visionerna och idéer för en kommande spin-off med de viktigaste personerna involverade har påbörjats och då framförallt för eXplorer för statistisk visualisering samt verktygslådan GAV Flash. Ett spin-off inom Norrköping Science Park skulle uppfattas som en mycket positiv händelse av universitet, kommun och Science Park och säkert också Visualiseringsprogrammet.

2. Plan och måluppfyllelse Intresset för dynamisk analys och visualisering av väder och relaterade problem som väglaget och översvämningar, logistik och allmän infrastruktur, officiell regional statistik för ekonomi, miljö, utbildning mm, samt automatisering av mobila nätverk är några exempel på användningsområden inom NCVA’s verksamhet där behovet av avancerade och mycket interaktiva visualiseringsverktyg för Internet är grundläggande och en förutsättning. Dessa används för att först analysera komplexa, tidsrelaterade och stora flerdimensionella datamängder samt sedan effektivare kommunicera utvunnen analytisk kunskap.

Avancerad verktygslåda GAV Flash för Web 2 genom Adobe Flash/Flex Efter att först (2005-2008) ha fokuserat på dynamisk informationsvisualisering baserat på Microsoft’s .NET och DirectX miljö, så har NCVA med stöd från Visualiseringsprogrammet förbättrat och applicerat sina avancerade visualiseringsverktyg inom informations- och geovisualisering för Web 2.0 miljö genom Adobe Flash/Flex. Denna utvecklig genomfördes som en direkt följd av våra partners starka önskemål och baserad på den snabba utvecklingen inom Internet. Resultatet är världens mest avancerade verktygslåda för visualisering inom Geovisual Analytics anpassad till senaste dynamiska Web 2.0 miljön. Applikationer utvecklade i samarbete med våra partners med GAV Flash är nu tillgängliga för en bredare användarkrets vilket under året lett till en dramatisk ökad användning inom forskningsmiljöer men framförallt för kommersiell användning av statistiska data.

Denna omfattande och krävande utveckling att anpassa verktygslådan till ett nytt grafiksystem startade i maj 2008 som en direkt följd av vårt forskningssamarbete med SMHI, SCB och OECD. I september 2008 installerades OECD eXplorer (enligt många utlåtande ”världens mest avancerade statistikvisualisering”) på OECD hemsida. Redan under första vecka hade mer än 10,000 användare över hela världen tagit del av denna nya teknik som gör det möjligt att analysera, jämföra och mäta de ekonomiska, sociala, miljörelaterade samt innovativa framsteg som gjorts inom regioner för länder eller län och med en mycket hög positiv responsfaktor. NCVA har genom detta innovativa projekt bevisat att med en genomarbetad och stark underliggande objektorienterad programarkitektur så kan man utveckla dynamisk visualisering även för riktigt stora och komplexa datamängder på Internet - något som tidigare inte varit möjligt för de stora datamängder som används inom NCVA’s forskningsprojekt.

Under perioden 2009-2010 har NCVA fokuserat på att utveckla nya analytiska visualiseringsmetoder för statistisk visualisering (Statistics eXplorer) samt ytterligare kod för visualisering av större tidsrelaterade datamängder bland annat nödvändigt för att visualisera t.ex. större mängder regioner för den regionala statistiken för att dynamiskt analysera stora mängder statistikregioner som samtliga Sveriges nästan 10,000 postnummerområden (se figur). Men används också för projektet med Ericssons mobila tidsbaserade nätverksdata. Vidare har vår erkänt unika och integrerade snapshot och ”storytelling” system förbättrats med bl.a. möjlighet att i metatexten använda hyperlänkar som pekar på viktiga upplevelser (se figur).

Page 4: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

Denna senaste utveckling av verktygslådan presenteras i bl.a. en vetenskaplig artikel skriven för VAST konferensen i USA och är under utvärdering.

Figur: Dynamisk visualisering av statistik för 10,000 postnummerområden. Bilden visar andelen universitetsstuderande i % och bygger på Fokus & Kontext där man väljer ett område av intresse i den stora kartan och zoomar in på detta område i ett separat fönster. Parallella axlar visar bl.a. profilen för 2 utvalda områden i Norrköping respektive Linköping.

Figur: Storytelling inom statistisk visualisering där vi använder hyperlänkar som pekar på viktiga snapshots.

Page 5: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

Statistics Publisher Statistics eXplorer är ett avancerat verktyg för analys och visualisering av statistik utvecklat för analytiker och experter. Kommunikation av statistik till allmänheten kräver ett mera enkelt verktyg. I samarbete med OECD och internationell kända tidningen The Economist har ett nytt UNIKT publiceringsverktyg Statistics Publisher utvecklats. eXplorer fungerar här som ett ”authoring” verktyg som skapar en analytisk sammanfattning av utvalda indikatorer som sedan genom Publisher automatiskt överförs till HML kod som placeras på en hemsida eller blog.

Figur: Publisher Statistics är en kommunikationsprocess där man först laddar valda indikatorer, analyserar data samt skriver ner ett analytiskt resonemang som sedan kommuniceras med kolleger och slutligen publiceras som en ”Vislet” (liten dynamisk visualisering med tillhörande metatext) på en hemsida eller blogg för allmänheten. Se exempel på Statistics Publisher med OECD och the Economist på: http://www.economist.com/britain-in-context/ www.oecd.org/innovation/strategy/charting From: [email protected] [mailto:[email protected]] Cc: [email protected]; [email protected] Subject: RE: Dear NCVA Team, Thank you very much for this fantastic tool. I’ve been testing the Vislet and it works well. Our Colleagues from Directorate for Science, Technology and Industry want to embed some Vislets on OECD Innovation Strategy website. Can we already publish Vislets on our websites? Best Regards, Abdel Danmarks Statistik Vislet på: http://www.dst.dk/OmDS/BagTal/Arkiv/2010-05-06-Motorcykler.aspx

Page 6: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet
Page 7: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

Speciellt uppnådda mål 1. Utveckling av Statistics Publisher är utan tvekan det största och mest unika projektet under året – fem artiklar

har presenterats som beskriver tekniken samt utvärderingen har varit mycket positiv. Tillsammans med Statistics eXplorer har detta verktyg en stor framtida kommersiell potential;

2. Sedan hösten 2008 har OECD två centralt placerade versioner av Statistics eXplorer på sin publika hemsida; OECD eXplorer http://www.oecd.org/gov/regional/statisticsindicators/explorer för regional data samt Factbook eXplorer http://stats.oecd.org/oecdfactbook/ som visar statistik för länder. Genom dessa välbesökta (10,000 per vecka) hemsidor så marknadsför OECD nu intensivt resultatet av vårt forskningsarbete. OECD presenterar också dessa applikationer på internationella konferenser samt ger NCVA och eXplorer den viktiga kvalitetsstämpel som krävs för en fortsatt kommersiell utveckling av dessa produkter. OECD har som resultat av detta samarbete nu beslutat att eXplorer Statistics skall bli standard verktyg inom OECD för dynamisk visualisering av statistik – ett beslut som har betydelse för en kommersiell exploatering av eXplorer;

NCVA har inlett ett samarbete med den internationellt kända tidningen the Economist i samarbete med OECD. Projektet har resulterat i publicering av statistik på dynamiska Vislets på the Economist hemsidor http://www.economist.com/britain-in-context/ 3. NCVA är nu etablerad på SCB som visualiseringsexpert. En omfattande intern utredning av potentiell

visualiseringsprogramvara för statistik har genomförts under hösten 2009 där man konstaterar att eXplorer är den bästa programvaran i världen för interaktiv statistikvisualisering. SCB för nu en intern diskussion om hur detta beslut skall påverka organisationens användning av eXplorer på deras publika hemsidor. I samarbete med SCB har också en specialversion av eXplorer för analys och redovisning av valresultaten 2010 för detaljerade 4500 valdistrikt tagits fram;

4. NCVA har inlett ett nära samarbete med Göteborg Stad inom ett internationellt EU projekt URBACT II-projektet LC-FACIL. http://www.samhallsutvecklingen.se/explorer/

5. SMHI har i samarbete med doktoranden Patrik Lundblad utvecklat flera strategiska applikationer inom hydrologi, sjöfart, snöröjning, väder verifikation samt väder övervakning och som nu finns på SMHI’s hemsida; Framförallt samarbetet med Vägverket där man visar väglaget och temperatur med en prognos på 36 timmar finns nu i kommersiell drift;

6. I nära samarbete (doktoranden Ho Quan) med Ericssons forskargrupp i Linköping har en ny GAV Flash baserad demonstrator ANROSS (tidigare VoSON utvecklad med GAV .NET) som simulerar och visualiserar en algoritm inom Self Organising Systems (självkonfigurerande system). Prototypen tillåter operatören att följa utvecklingen av ett radionätverk över tiden, dåtid som nutid och visat sig vara en god katalysator för förståelsen av automatiska algoritmer inom Ericssons produktportfölj. Har utvecklats till ett strategiskt framtidsprojekt inom Ericsson och utvärderas tillsammans med operatörer som Telia.

7. NCVA har varit mycket aktiv för att kommunicera kunskap om resultaten från våra olika projekt – se lista. 8. NCVA har också haft åtskilliga möten med ledande Europeiska universitet inom området Geovisual Analytics

framförallt genom ett omfattande Europeiskt samarbete VisMaster med uppdrag att analysera behovet inom EU för detta forskningsområde. NCVA har deltagit i flera workshops under året samt skrivit ett gemensamt sammandrag om GeoAnalytics applicerat på spatiala tidsdata.

9. Behovet att utbilda nya studenter och forskare med en bred kompetens inom visualisering och Visual Analytics har ökat starkt under de senaste åren. NCVA i samarbete med Norrköping Science Park har blivit en naturlig mötesplats för nationell tillämpad forskning inom Visual Analytics. Erfarenheterna från våra gemensamma projekt med partners används inom både grundutbildning samt forskning. NCVA’s hemsida http://ncva.itn.liu.se uppdateras regelbundet med nya intressanta tillämpningar och prototyper som kan laddas ner och utvärderas.

10. Mikael har också varit handledare för en doktorand Linnea Stenliden som använt eXplorer till att utvärdera hur barn i åldrarna 10-12 år upplever dynamisk geografisk visualisering i undervisningen samt hur lärarna tar till sig detta verktyg och stimuleras. Två artiklar har tagits fram under perioden där den senast antagna är: Geovisual Analytics and Children´s Learning, till SIG2 konferensen i augusti, at the Knowledge Media Research Center (KMRC), Tübingen, Germany , temat är Tracing the mind: How do we learn from text and graphics?

Page 8: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

3. Exempel på tillämpad forskning i samarbete med partners Ericsson Under hösten 2008 slutförde Ericsson och NCVA den första versionen and en prototyp som simulerar och visualiserar en algoritm inom Self Organising Systems (självkonfigurerande system). Prototypen tillåter operatören att följa utvecklingen av ett radionätverk över tiden, dåtid som nutid. Prototypen möjliggör identifiering av såväl existerande som potentiella problem. Man kan påstå att Ericsson och NCVA tillsammans har kombinerat ett antal vyer och dynamiska filter för att underlätta förståelse och operation av radionätverk. Under våren har Ericsson demonstrerat prototypen för ett stort antal operatörer och prototypen har visat sig vara en god katalysator för förståelsen av automatiska algoritmer inom Ericssons produktportfölj. Ericsson har kunnat reducera hajpen och fokuserar på praktiska frågeställningar som kontroll, organisationspåverkan och systemsamverkan. Av kommentarer från operatörer att döma kan man också dra slutsatsen att det nya sättet att hantera nät känns nytt, kraftfullt och samtidigt enkelt. Där det senaste kanske är det viktigaste. Ericsson har nu bestämt att tillsammans med NCVA bygga en förprodukt (begränsat antal användare) för evaluering i operationell miljö och arbetet pågår sedan mars 2009.

Figure: Example from the ANROSS GAV Flash application that visualizes and explores self-organizing network data to show how the ANR works. It allows the operators to follow the evolution of the network and supports their understanding of how an automatic algorithm configures locally-unique physical cell identities and organizes neighbor cell relations of a self-organizing network. It can also help the operators to find existing problems or potential problems that can occur in the network in the future. Ericsson och NCVA presenterade gemensamt forskningsresultat på Eurographics 2010 i Norrköping. Två vetenskapliga artiklar har publicerats tillsammans med Ericsson: Q. Ho, T. Åström, M. Jern, J. Moe, F. Gunnarsson, and H. Kallin, “Visualization of self-organizing networks operated by the ANR algorithm,” accepted to 2009 IEEE International Conference on Research, Innovation and Vision for the Future in Computing Communications Technologies, 2009. Ho Q, Åström T, and Jern M, “Geovisual analytics for self-organizing network data,” reviewed proceedings in IEEE Conference and Symposium on Visual Analytics Science and Technology (IEEE VAST), Atlantic City, USA, 2009.

Page 9: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

SMHI Vägverket har nu installerat beslutstödssystemet RoadVis, utvecklat med nya verktygskådan GAV Flash i samarbete med SMHI och NCVA. RoadVis ger en översiktsvy över det aktuella väderläget på Sveriges vägar och visar till skillnad mot tidigare system en bättre överblick och större förståelse för trender och situationer som förväntas uppstå. Vägverket använder RoadVis för att bl.a. dirigera t.ex. snöskottning till vägar där behov finns. För sjöfart har forskning bedrivits inom både efteranalys av fartygsresor (containertrafik) samt övervakning av nuvarande resor. Detta för att dels öka säkerheten för fartygen, men även så att de kan köra med eko-speed och därmed minska utsläppen av koldioxid. För pågående resor ska en marinmeteorolog (med hjälp av NCVA programvara) inom en snar framtid kunna övervaka 500-1000 resor dagligen med dynamiska visualiseringsverktyg och snabbt kunna ta fram de fartyg och områden som behöver assistans.

Figur: RoadVis visar i denna punktkarta temperaturen på vägnätet i södra Sverige med en prognos för 36 timmar. Två mätstationer Ölandsbron och Öresundsbron är markerade och lokala data visas i tidsdiagrammet till höger, Två vetenskapliga artiklar har publicerats i samarbete med SMHI. Unilever Research Port Sunlight UK Unilever’s forskningscenter i Port Sunlight med över 2000 forskare är en viktig industriell forskningspartner till NCVA. Deras tillgång till framstående forskare och riktiga data med spännande utmaningar inom Visual Analytics har varit en viktig förutsättning för vår forskning. Doktoranden Sara Johansson har samarbetat med Unilever med Dr Jane Shaw som handledare. Sara är med 65 % finansierad av Unilever och har besökt Unilever vid flera tillfällen under perioden. Tre artiklar i samarbete med Unilever har presenterats vid internationella konferenser under perioden: Workshop on Visual Analytics and Knowledge Discovery in connection to the ACM SIGKDD Conference on Knowledge Discovery and Data Mining (Paris); one at the International Conference on Information Visualisation (Barcelona) and one at the IEEE Information Visualization Conference (Atlantic City).

Page 10: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

Visualization of high dimensional mixed data sets using data-mining methods The research on visualization of data sets including a large number of variables and data sets including a combination of categorical and numerical variables (mixed data sets) mainly focus on developing methods for guided discovery of interesting patterns and relationships in data sets. This research project takes place with researchers at Unilever R&D in Port Sunlight, UK. Due to this, the requirements within industrial applications are of high significance for the project, as well as keeping in the front edge of information visualization research. Within the research project interactive information visualization techniques are combined with algorithmic data-mining methods, with the goal of creating interactive environments where both the efficiency of algorithmic approaches as well as the expertise of domain specialists and data analysts can be made use of. The research project has included two main projects so far; one focusing on quantification of categorical data and explorative analysis of mixed data sets and the other focusing on interactive dimensionality reduction and exploration of data sets including hundreds of variables. Quantification of categorical data means that categories within a categorical variable are represented by a numerical value. This provides the possibility of using visual representations and analysis methods developed for numerical data when analysing categorical variables. Within the project an application, MiDAVisT (short for Mixed Data Analysis VISualization Tool), has been developed. MiDAVisT has been developed in close collaboration with researchers at Unilever R&D and several refinements have been made due to specific analysis tasks and characteristics of data common within for instance the area of micro biology. The tool provides an algorithmic quantification based on relationships and similarities within both the categorical and numerical variables of a mixed data set. The algorithmic quantification provides guidance when identifying relationships between categories and variables; however, MiDAVisT provides possibilities for the analyst to interactively modify the quantification based on domain knowledge. Within MiDAVisT the result of the algorithmic quantification is displayed using visual representations commonly used within the information visualization society. Furthermore, the tool provides an environment for exploratory analysis of the quantified mixed data set using multiple coordinated views and common algorithmic pattern identification methods, such as Pearson correlation and k-means clustering. Ongoing work within this project is to design and perform a thorough evaluation of the system together with researchers at Unilever R&D. The second project is focused on interactive dimensionality reduction and exploration of data sets including hundreds of variables. As a first part of this project an interactive system for quality guided dimensionality reduction has been developed, where algorithmic methods are used to identify interesting patterns within the high dimensional data set and to assign an overall value of interestingness to each individual variable in the data set. The variable interestingness is achieved by combining several quality metrics, each representing the variables involvement in a specific structure in the data, and through this the interestingness of a variable is based on several different patterns – in contrast to many other dimensionality reduction systems where the main focus is on preserving one specific pattern within the data. Through a display facilitating analysis of the trade-off between loss of quality and number of variables to keep in the reduced data set, all based on the identified patterns and values of interestingness, the user is guided into selecting an appropriate number of variables to keep when reducing the data. This system also provides different methods for ordering the variables of the reduced data set, each facilitating the perception of different structures within the data. The ongoing development of the dimensionality reduction project is mainly driven by the collaboration with Unilever R&D and of the requirements of industrial data analysts, and has resulted in a submitted paper co-authored by a researcher at Unilever. It aims at providing a more intuitive and stable way of assigning variable interestingness when several quality metrics are used, using a well known ranking method. A main focus also lies on exploration and understanding of the structures within the high dimensional data set, and on interactive methods for efficient selection and explorative analysis of different subsets of the high dimensional data set.

Page 11: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

Figure: A high dimensional data set including 127 variables (top) reduced to a subset of the16 variables with highest value of interestingness (bottom), displayed using parallel coordinates and a scatter plot matrix. The cells in the top left half of the scatter plot matrix represent the correlation of variable pairs through colour, red representing negative correlation and blue representing positive. Visualisering av statistik Intresset för eXplorer Statistics har kraftigt ökat under perioden både internationellt men också inom Sverige:

Figur: OECD, Italien Statistik byrå, Danmark Statistik, SCB, SKL, Eurostat är några exempel på användningen av eXplorer Statistics.

Page 12: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

Figur: Exempel på samarbetet med SCB och 9000 postnummer regioner. Nya optimerade metoder för dynamisk visualisering av stora mängder regioner har utvecklats under perioden. Figuren visar en åldrande befolkning på mycket detaljerad postnummernivå. Andra indikatorer är köpkraft, utbildning, bostad och åldersfördelningar. Denna statistik är bl.a. intressant för detaljhandeln.

Figur: Tidsanimering av barnfödande i relation till arbetande kvinnor under perioden 1970-2010. En tidsanimering som väckt stort uppseende vid konferenser.

Page 13: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

4. Vilka aktiviteter har genomförts NCVA har under första året maj 2009-maj 2010 varit produktivt med vetenskapliga artiklar, presentationer på internationella konferenser samt deltagit i flera seminarier för att sprida kunskaper om tillämpad Visual Analytics. Större Presentationer 1. VisMaster EU workshop, Hamburg, Mars 2009 2. IV 2009, Barcelona juli 2009 3. 3rd ICA Workshop on Geospatial Analysis and Modeling augusti Gävle Sverige 4. CDVE 2009 – international conference Luxembourg 20-23 september, 2009 5. Japan Tokyo i samarbete med Visualiseringsprogrammet december 2009 6. International Education & Research Conference INTED 2010, Valencia February 2009 7. Regionala dagar Stockholm 21-22 april 2010 organiserat av SCB 8. International conference on computer supported education CSEDU 2010, Valencia April 2009 9. Eurographics 2010 Norrköping föredrag och presentation av artikel maj 2010. 10. Eurographics Visual Forum Norrköping – Utställning tillsammans med Ericsson Linköping maj 2010 11. Workshop on Exploratory Data Analysis and Visualisation organized by EuroStat Vienna Maj 2010

http://www.statistik.tuwien.ac.at/edavis/ Se även NCVA’s hemsida: http://ncva.itn.liu.se/events?l=en Publicerade och accepterade artiklar sedan projektstart maj 2008- maj 2010 Jern M: “Visual Analytics in Flood Forecasting “, reviewed book, Geospatial Information Technology for Emergency Response, edited by Sisi Zlatanova&Jonathan Li, Taylor&Francis Delft University, 2008, ISBN 978-0-4154-2247-5. http://www.isprs.org/publications/bookseries/6_ZLATANOVA.pdf http://www.amazon.co.uk/Geospatial-Information-Technology-Emergency-Response/dp/0415422477 Jern M: “Geovisual Analytics tool “GeoWizard” applied in Education and Research”. Reviewed proceedings, International Technology, Education and Development Conference INTED, Valencia, 2008. ISBN: 978-84-612-0190-7. http://www.iated.org/inted2008/INTED2008_Programme%20Web.pdf Lundblad P, Jern M: “Geovisual Analytics applied to a Swedish Road Warning Prediction System”, reviewed paper in proceedings, GI4DM Conference on Geo-Information Systems for Crisis Management - Harbin, China Aug 2008. www.iscram.org/dmdocuments/ISCRAMCHINA2008/GI4/149.doc Quan Ho, Jern M: “Exploratory 3D geovisual analytics”, Reviewed Proceedings in RIVF '08 IEEE International Conference on Research, Innovation and Vision for the Future - Ho Chi Minh City, Vietnam July 2008, ISBN: 978-1-4244-2379-8. http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=4586367 Jern, Åström, Johansson: “GeoAnalytics Tools Applied to Large Geospatial Datasets”, Reviewed Proceedings in 12th International Conference Information Visualization (IV08), London, July 2008, pp. 362-372, IEEE Computer Society, ISBN 978-0-7695-3268-4. http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=4577974 Lundblad P, Jern M, Forsell C: “Voyage Analysis Applied to Geovisual Analytics”, Reviewed Proceedings in 12th International Conference Information Visualization (IV08), London, July 2008, pp. 381-388, IEEE Computer Society, ISBN 978-0-7695-3268-4. http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?isnumber=4577908&arnumber=4577976&count=110&index=67 Jern M, Rogstadius J, Åström T, Ynnerman A: ”Visual Analytics Presentation Tools applied in HTML Documents”, Reviewed Proceedings in 12th International Conference Information Visualization (IV08), London, July 2008, pp. 200-207, IEEE Computer Society, ISBN 978-0-7695-3268-4. http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=4577948 Johansson S, Jern M. Johansson J: “Interactive Quantification of Categorical Variables in Mixed Data Sets”, Reviewed Proceedings in 12th International Conference Information Visualization (IV08), London, July 2008, pp. 3-10, IEEE Computer Society, ISBN 978-0-7695-3268-4. http://ieeexplore.ieee.org/search/wrapper.jsp?arnumber=4577918 Jern M: “Collaborative Explorative Data Analysis Applied in HTML”, Reviewed article in “Cooperative Design, Visualization, and Engineering", pages 36-45, 5th International Conference CDVE Mallorca, September 2008, Springer Berlin Heidelberg New York, ISBN 3-540-88010-0 http://www.springerlink.com/content/m16195tr63t56143/ Jern M, Thygesen L, Brezzi M: “Geovisual Analytics Web-enabled tools for dissemination of OECD regional statistics”, Reviewed article in “ICA (CEWaCM) & JB Gi4DM Symposium 'Cartography and Geoinformatics for Early Warning and Emergency Management: Towards Better Solutions', Prague, January, 2009 Jern M, Thygesen L, Brezzi M: “A web-enabled Geovisual Analytics tool applied to OECD Regional Data”, Reviewed Proceedings in Eurographics 2009, Munchen, March 2009 Jern M: “Collaborative Web-enabled Geovisual Analytics applied to regional data”, Reviewed proceedings, International Technology, Education and Development Conference INTED, Valencia, 2009. Q. Ho, T. Åström, M. Jern, J. Moe, F. Gunnarsson, and H. Kallin, “Visualization of self-organizing networks operated by the ANR algorithm,” accepted to 2009 IEEE International Conference on Research, Innovation and Vision for the Future in Computing Communications Technologies, 2009.

Page 14: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

Johansson S, Johansson J, “Interactive Dimensionality Reduction Through User-defined Combinations of Quality Metrics”, reviewed Proceedings in IEEE Information Visualization Conference IV09, Barcelona 2009. Johansson S, “Visual Exploration of Categorical and Mixed Data Sets”, reviewed proceedings at ACM SIGKDD Workshop on Visual Analytics and Knowledge Discovery (VAKD), Paris 2009. Johansson S, Knaving K, Lane A, Johansson J, Jern M, “Interactive Exploration of Ingredient Mixtures Using Multiple Coordinated Views”, reviewed proceedings in IEEE Information Visualization Conference IV09, Barcelona 2009. Jern M, Åström T, Rogstadius J, “Treemaps and Choropleth Maps Applied to Regional Hierarchical”, reviewed proceedings in IEEE Information Visualization Conference IV09, Barcelona 2009. Ho Q, Åström T, and Jern M, “Geovisual analytics for self-organizing network data,” reviewed proceedings in IEEE Conference and Symposium on Visual Analytics Science and Technology (IEEE VAST), Atlantic City, USA, 2009. Jern M, “Collaborative Educational GeoAnalytics applied to large statistics temporal data”, Reviewed proceedings, CSEDU 2010, Conference on computer supported education, Valencia April 2010. Jern M, “Educating students in official statistics using embedded geovisual analytics storytelling methods”, Reviewed Proceedings in Eurographics 2010, Norrköping, May 2010. Jern M, Brezzi M, Lundblad P, “Geovisual Analytics Tools for Communicating Emergency and Early Warning”, Book about Geographic Information and Cartography for Risk and Crisis Management, Springer Berlin-Heidelberg, pp 379-394. http://www.springerlink.com/content/j1n243660xmh1r45/ Stenliden L, Jern M, “Educating official statistics using geovisual analytics storytelling methods”, Reviewed proceedings, International Technology, Education and Development Conference INTED, Valencia, 2010.

5. Resultat De viktigaste forskningsresultaten under 2009-2010 med störst uppmärksamhet både vetenskapligt (artiklar) och publikt (Internet) summeras här: Publisher Statistics Det största och kanske mest uppmärksammade forskningsresultatet både internationellt och i Sverige är utan tvekan Statistics Publisher. En stor del av vår forskning under 2009-2010 har fokuserat på denna uniks metod att låta en eXploreranvändare automatiskt publicera utvalda resultat med tillhörande analys på hemsidor eller bloggar. Projektet initierades genom OECD projektet Wikiprogess som vi rapporterade om i förra rapporten. Ett unikt samarbete har nu initierats med OECD, the Economist och NCVA för att utvärdera framtida möjligheter att dynamiskt och digitalt publicera intressanta statistiska nyheter. http://www.economist.com/britain-in-context/ www.oecd.org/innovation/strategy/charting http://www.dst.dk/OmDS/BagTal/Arkiv/2010-05-06-Motorcykler.aspx http://swedeneurostat.blogspot.com/2010/03/education-in-eu-example-with-vislets.html#links

Page 15: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

Statistics eXplorer Vidareutvecklingen av vår unika programvara för statistisk visualisering har utvecklats enormt under perioden. Version V3.6 är den utan konkurrens det mest avancerade programmet i världen (utvärderat och konfirmerat bl.a. av OECD, Woldbank, WHO, SCB, Danmark statistik). OECD har etablerat denna programvara över hela sin organisation och sprider viktig reklam och marknadsför eXplorer på alla sina internationella konferenser. OECD’s engagemang i eXplorer utvecklingen är en grundförutsättning för en kommersialisering av produkten.

'I have always believed that the very best results in dynamic visualization - the truly breakthrough innovations - are the results of cross-disciplinary collaboration. The NCVA-OECD project brings together 'right brain' statisticians with 'left brain' visualization designers. The interactions are incredible!' (Chief Statistician Enrico Giovannini)

SMHI och Vägverket Dynamiskt väglagsövervakningsverktyget RoadVis som är utvecklat i samarbete mellan NCVA, SMHI och Vägverket. Vägverket har runt 740 mätstationer utmed Sveriges vägar, som kontinuerligt rapporterar in data om väder och vägförhållanden. Tillsammans med NCVA’s GAV Flash - baserad visualisering och SMHI:s prognosberäkningar kan applikationen visualisera vägarnas nuvarande status, samt hur det kommer vara inom den närmsta framtiden. På så sätt kan man se om det finns risk för t.ex. halka i förväg för respektive mätstation. Vägverket har under denna vintersäsong testat RoadWizard som ger en översiktsvy över det aktuella väderläget på Sveriges vägar och visar till skillnad mot tidigare system en bättre överblick och större förståelse för trender och situationer som förväntas uppstå. Vägverket har beslutat att ta detta system i drift under hösten 2009. SCB, SKL och Sveriges Kommuner Geovisual Analytics verktyg för att analysera och kommunicera regional kommunal statistik. Detta verktyg har under december-juni utvecklats och prövats i samarbete med SKL samt SCB har genomfört en omfattande utvärdering under hösten-våren 2009-2010 av tillgänglig statistikprogramvara för dynamisk visualisering och bekräftat att Statistics eXplorer är bäst.

Page 16: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

Tidsanimering GAV Flash har idag den mest avancerade tekniken i världen för tidsanimering av större datamängder.

Figur: Dynamisk tidsanimering uppdateras simultant i alla vyer.

Utvärdering genomförd av Worldbank

Page 17: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet
Page 18: Årsrapport 2009-2010 Visual Analytics · Det fortsatta utvecklingsarbetet med att ta fram en verktygslåda anpassad till Web 2.0 miljöavancerad n har involverat de flesta inom projektet

Ekonomisk Redovisning

Norrköping 2010-05-28 Norrköping 2010-05-28

Professor Mikael Jern Professor Anders Ynnerman Projektledare ansvarig och ordförande i NCVA