workshop pratico ddj - bari

72
OPEN DATA ______IN ACTION!_______ Workshop pratico DDJ su dati OpenCoesione Bari 27 ott 2013

Upload: andrea-zedda

Post on 18-Nov-2014

539 views

Category:

Technology


2 download

DESCRIPTION

sessione Openrefine e Libreoffice su dati OpenCoesione

TRANSCRIPT

Page 1: Workshop pratico DDJ - Bari

OPEN DATA ______IN ACTION!_______

Workshop pratico DDJ su dati OpenCoesione

Bari 27 ott 2013

Page 2: Workshop pratico DDJ - Bari

WORKFLOW DDJ

TROVARE E PRENDERE I DATI

SISTEMARE E PULIRE I DATI ANALIZZARE I DATI

SINTETIZZARE E RAPPRESENTARE

I DATI RACCONTARE UNA STORIA

Page 3: Workshop pratico DDJ - Bari

INFRASTRUTTURE PUGLIA1. esploriamo i soggetti attuatori per capire

chi le sta costruendo e quali tipologie di progetti sono stati finanziati

2. facciamo una veloce analisi territoriale

3. scopriamo e monitoriamo i dieci progetti più grossi

Page 4: Workshop pratico DDJ - Bari

TROVARE E PRENDERE I

DATI

Page 5: Workshop pratico DDJ - Bari
Page 6: Workshop pratico DDJ - Bari
Page 7: Workshop pratico DDJ - Bari
Page 8: Workshop pratico DDJ - Bari
Page 9: Workshop pratico DDJ - Bari
Page 10: Workshop pratico DDJ - Bari

INFRASTRUTTURE PUGLIA1) esploriamo i soggetti attuatori per capire chi le sta costruendo

❏ pulizia delle anagrafiche❏ somma di euro per tipologia di attuatori ❏ conteggio di progetti

Page 11: Workshop pratico DDJ - Bari

SISTEMARE E PULIRE I DATI

Page 12: Workshop pratico DDJ - Bari
Page 13: Workshop pratico DDJ - Bari

OPEN REFINE❏ non è excel un foglio di calcolo

❏ Estrae

❏ Pulisce

❏ Sistema

❏ Esporta

Page 14: Workshop pratico DDJ - Bari

CODIFICA ERRATA

IL SEPARATORE È “;”

SE VOGLIO CAMBIO IL

NOME DA QUI

DA QUI LA CORREGGO

Page 15: Workshop pratico DDJ - Bari

DAL CAMPO “ALL” CONTROLLO TUTTI I

CAMPI E POSSO ANCHE METTERE UN

PO’ D’ORDINE

DI TANTE RIGHE NE VEDO POCHE… MA NON IMPORTA

QUESTO È UN “TEXT FACET”. GRAZIE A QUESTA

FUNZIONALITÀ POSSO FILTRARE, MODIFICARE E

ESPLORARE IL DATASET IN MANIERA MAI VISTA!

Page 16: Workshop pratico DDJ - Bari

QUESTI CAMPI NON MI SERVONO E DA QUI LI POSSO CANCELLARE

DA CAMPO ALL -> RE-ORDER / REMOVE COLUMNS CON UN

SEMPLICE DRAG&DROP

POSSO ORDINARE I CAMPI COME VOGLIO IN MODO DA TENERE

NEI PRIMI POSTI QUELLI CHE MI

INTERESSANO DI PIÙ

Page 17: Workshop pratico DDJ - Bari

INFRASTRUTTURE PUGLIA1. esploriamo i soggetti attuatori per capire chi le sta costruendo e quali tipologie di progetti sono stati finanziati

❏ pulizia delle anagraficheIL CAMPO CHE CI INTERESSA È “SOGGETTI

ATTUATORI”DOBBIAMO ESPLORARLO E CAPIRE SE SI

PUÒ TIRAR FUORI QUALCHE INFORMAZIONE SINTETICA ED EFFICACE

Page 18: Workshop pratico DDJ - Bari

PER ATTIVARE UN FACET CLICCO SUL MENU DEL CAMPO “SOGGETTI_ATTUATORI”

E SELEZIONO TEXT FACET, ADATTO AI CAMPI DI TESTO

Page 19: Workshop pratico DDJ - Bari

AHI AHI! SON TANTISSIMI! 513 VALORI DIVERSI...COME FARE?

CLUSTERIZZO!

Page 20: Workshop pratico DDJ - Bari

IL CLUSTER DI UN FACET È UNA FUNZIONE CHE PERMETTE DI RAGGRUPPARE INSIEMI DI VALORI CHE PUR AVENDO LO STESSO SIGNIFICATO ED ESSENDO SIMILI SI PRESENTANO IN MODALITÀ

DIFFERENTI

QUI MODIFICO L’ALGORITMO E

CAMBIA IL METODO DI RICERCA DEI

VALORI SIMILI

Page 21: Workshop pratico DDJ - Bari

INFRASTRUTTURE PUGLIA1. esploriamo i soggetti attuatori per capire chi le sta costruendo

❏ pulizia delle anagrafiche

LA CLUSTERIZZAZIONE IN QUESTO CASO È INEFFICACE, OCCORRE TROVARE NUOVE

INFORMAZIONI SUGLI ATTUATORI CHE INTEGRINO QUELLE CHE GIÀ ABBIAMO

Page 22: Workshop pratico DDJ - Bari

MERGE TRA DUE DATASET

PROGETTI SOGGETTI

Page 23: Workshop pratico DDJ - Bari

CON REFINE POSSO APRIRE PIÙ PROGETTI CONTEMPORANEAMENTE

Page 24: Workshop pratico DDJ - Bari

CREO UN NUOVO PROGETTO SEGUENDO LA SOLITA PROCEDURA.

STAVOLTA APRO IL FILE DEI SOGGETTI

Page 25: Workshop pratico DDJ - Bari

QUESTO È IL CAMPO CHE MI SERVE!(campodaprendere)

OPS! PROBLEMI DI CODIFICA CHE REFINE NON È RIUSCITO A RISOLVERE

IN FASE DI IMPORTAZIONE

QUESTO È IL CAMPO CHE I DUE DATASET HANNO IN COMUNE. È LA

CHIAVE CHE CI PERMETTE DI UNIRLI IN MODO CORRETTO

(campochiave)

Page 26: Workshop pratico DDJ - Bari

TORNO AL DATASET INIZIALE “progetti_infrastrutture”

ORA PER FARE UN MERGE TRA I DUE DATASET DEVO PORTARMI SULLA COLONNA CHE HANNO IN

COMUNE “COD_LOCALE_PROGETTO” E DAL MENU ANDARE SU EDIT

COLUMN -> ADD COLUMN BASED ON THIS COLUMN E…..

Page 27: Workshop pratico DDJ - Bari

:-(

Page 28: Workshop pratico DDJ - Bari

ORA MI TOCCA USARE DEL

CODICE. REFINE NON RIESCE A

COMPIERE TUTTE LE SUE FUNZIONI DA INTERFACCIA GRAFICA, PER

CUI SI AVVALE DI UN CODICE

INFORMATICO SEMPLIFICATO IL

“GREL”

CAMPO PER INSERIRE L’

ESPRESSIONE

ANTEPRIMA

Page 29: Workshop pratico DDJ - Bari

INSERISCO IL NOME DELLA

NUOVA COLONNA

UTILIZZO LA FUNZIONE “cell.

cross”

Page 30: Workshop pratico DDJ - Bari

FUNZIONE GREL PER MERGE

cell.cross("nomedataset", "campochiave").cells["campodaprendere"].value[0]

(basta semplicemente sostituire i grasseti )

Page 31: Workshop pratico DDJ - Bari

ECCOLO QUI

Page 32: Workshop pratico DDJ - Bari

ATTIVANDO UN TEXT FACET SUL NUOVO CAMPO NOTIAMO COME ESSO RIESCA A

INTERLACCIARSI CON 3 TIPI DI SOGGETTI PER CATEGORIA ATECO. BUONA PARTE DI ESSI PERÒ NON VENGONO TROVATI E ABBIAMO

CELLE BIANCHE (blank)

GLI ERRORI DI CODIFICA PER ORA NON CI DANNO FASTIDIO

Page 33: Workshop pratico DDJ - Bari

POSSIAMO MODIFICARE TUTTI I VALORI DELLE CELLE CORRISPONDENTI ALLE CATEGORIE,

SEMPLICEMENTE MODIFICANDO IL TESTO DEL FACET. BASTA CLICCARE “EDIT” CHE APPARE A

FIANCO DEL “COICHE”.

Page 34: Workshop pratico DDJ - Bari

ORA ABBIAMO SEMPLIFICATO TUTTE LE CATEGORIE. DOBBIAMO SCOPRIRE A QUALI CATEGPRIE APPARTENGONO LE 872 CELLE

BIANCHE

SE CLICCLIAMO SU UNA CATEGORIA IL FACET FUNGE DA FILTRO E SELEZIONA SOLO LE CELLE

CORRISPONDENTI ALLA CHOICE ILLUMINATA

Page 35: Workshop pratico DDJ - Bari

IL FACET È UNO STRUMENTO POTENTISSIMO PERCHÈ POSSIAMO AGGIUNGERNE PER OGNI CAMPO PERMETTENDOCI DI FARE UN FILTRO GERARCHICO ED ESTREMAMENTE DINAMICO

IN QUESTO CASO AGGUNGO UN TEXT FACET AL CAMPO SOGGETTI ATTUATORI. LE CATEGORIE SI RIFERISCONO A QUELLA SELEZIONATA NEL FACET PRECEDENTE! QUINDI POSSO CAPIRE

QUALI CATEGORIE DI SOGGETTI ATTUATORI CI SONO IN BASE ALLE CELLE BIANCHE DELLE

TIPOLOGIA SOGGETTI

Page 36: Workshop pratico DDJ - Bari

POSSO AGGIUNGERE TANTI FACET COME DETTO PRIMA, MA SPESSO È UTILE AGGIUNGERE

ANCHE UN SEMPLICE FILTRO DI TESTO. PER FARLO BASTA SELEZIONARLO DAL MENU DEL

CAMPO, IN QUESTO CASO SEMPRE SOGGETTI_ATTUATORI.

INSERENDO “comune” TROVO TUTTI I SOGGETTI CHE SONO UN COMUNE E CHE APPARTENGONO ALLE CELLE BIANCHE DEL CAMPO TIPOLOGIA

SOGGETTI

Page 37: Workshop pratico DDJ - Bari

GUARDANDO IL PRIMO FACET CAPISCO CHE QUESTO PROCESSO MI HA FATTO INDIVIDUARE

BEN 515 CELLE BIANCHE NEL CAMPO TIPOLOGIA SOGGETTI. ESSENDO DEI COMUNI LI

VOGLIO INTEGRARE NELLA CATEGORIA amministrazione. PER FARLO BASTA

MODIFICARE LA CATEGORIA (blank) CHE IN QUESTO MOMENTO RIGUARDA SOLO ED

ESCLUSIVAMENTE LE CELLE CORRISPONDENTI AI SOGGETTI ATTUATORI CHE CONTENGONO LA

PAROLA “comune”.

Page 38: Workshop pratico DDJ - Bari

CONTINUANDO A LAVORARE TRA FACET E FILTRI OTTENGO FINALMENTE DELLE

CATEGORIE CHE IDENTIFICANO I SOGGETTI ATTUATORI

Page 39: Workshop pratico DDJ - Bari

1. esploriamo i soggetti attuatori per capire chi le sta costruendo e quali tipologie di progetti sono stati finanziati

❏ pulizia delle anagrafiche❏ somma di euro per per tipologia di attuatori❏ conteggio di progetti

INFRASTRUTTURE PUGLIA

PER ANALIZZARE I DATI OCCORRE ANCORA QUALCHE RITOCCO

Page 40: Workshop pratico DDJ - Bari

IL NUMERO È MEMORIZZATO COME TESTO

RISOLVIAMO DA QUI (SEMPRE

GREL)

Page 41: Workshop pratico DDJ - Bari

SOSTITUISCO LA VIRGOLA CON IL PUNTO (DANNATI

INGLESI)

Page 42: Workshop pratico DDJ - Bari

FUNZIONE GREL PER SOSTITUIRE

value.replace("caratteredatogliere","caratteredamettere")

(basta semplicemente sostituire i grasseti )

Page 43: Workshop pratico DDJ - Bari

CONVERTO IN NUMERO

Page 44: Workshop pratico DDJ - Bari

POSSO DECIDERE QUALI CAMPI

ESPORTARE, E IN QUALE ORDINE

CON IL CUSTOM TABUALR EXPORTER POSSO AVERE TANTE

OPZIONI PER L’ESPORTAZIONE

Page 45: Workshop pratico DDJ - Bari

ANALIZZARE I DATI

Page 46: Workshop pratico DDJ - Bari

INFRASTRUTTURE PUGLIA1. esploriamo i soggetti attuatori per capire chi le sta costruendo e quali tipologie di progetti sono stati finanziati

❏ pulizia delle anagrafiche❏ somma di euro per tipologia di attuatori ❏ conteggio di progetti

Page 47: Workshop pratico DDJ - Bari
Page 48: Workshop pratico DDJ - Bari

LIBREOFFICE CALC

❏ è un foglio di calcolo ma non è excel

❏ è open source

❏ è open data friendly

❏ gestisce meglio i csv

Page 49: Workshop pratico DDJ - Bari

PER OTTENERE UN DELLE TABELLE

RIASSUNTIVE DAL MIO DATASET, USO LA

FUNZIONE TABELLA PIVOT.

PRIMA SELEZIONO I CAMPI CHE MI

INTERESSANO E POI CLICCO SU CREA

Page 50: Workshop pratico DDJ - Bari

SPOSTANDO I CAMPI CON UN DRA&DROP SULLE DIVERSE

PARTI DELLA PIVOT CREO LA MIA TABELLA

Page 51: Workshop pratico DDJ - Bari

OTTENGO COSÌ UNA TABELLA A DOPPIA ENTRATA DOVE INCROCIO

IL TEMA SINTETICO DPS CON I SOGGETTI DIVISI PER TIPOLOGIA

Page 52: Workshop pratico DDJ - Bari

INFRASTRUTTURE PUGLIA1. esploriamo i soggetti attuatori per capire chi le sta costruendo e quali tipologie di progetti sono stati finanziati

❏ pulizia delle anagrafiche❏ somma di euro per tipologia di attuatori ❏ conteggio di progetti

Page 53: Workshop pratico DDJ - Bari

FACENDO DOPPIO CLIC SU UN CAMPO DENTRO IL “CAMPO DATI”

POSSO DECIDERE IN BASE A QUALE FUNZIONE OTTENERE I DATI DELLA

TABELLA

Page 54: Workshop pratico DDJ - Bari

ED ECCO LA TABELLA CON IL

NUMERO DI PROGETTI E NON LA SOMMA DEL LORO

VALORE

Page 55: Workshop pratico DDJ - Bari

PER AVERE VALORI PIÙ SIGNIFICATIVI

POSSO DECIDERE DI VISUALIZZARE LA

TABELLA IN %

Page 56: Workshop pratico DDJ - Bari
Page 57: Workshop pratico DDJ - Bari

INFRASTRUTTURE PUGLIA❏ esploriamo i soggetti attuatori per capire

chi le sta costruendo e quali tipologie di progetti sono stati finanziati

❏ facciamo una veloce analisi territoriale

❏ scopriamo e monitoriamo i dieci progetti più grossi

Page 58: Workshop pratico DDJ - Bari

DAL CAMPO TERRITORI, NOTO CHE PIÙ TERRITORI SONO

CONCATENATI IN UN UNICO CAMPO, SEPARATI DA “:::”

Page 59: Workshop pratico DDJ - Bari

POSSO SEPARARE LE CELLE DAL COMANDO SPLIT MULTI-VALUED CELLS CHE TROVO IN

EDIT CELLS

Page 60: Workshop pratico DDJ - Bari

SCELGO IL SEPARATORE CHE COME DETTO È “:::”

Page 61: Workshop pratico DDJ - Bari

CON LA FUNZIONE SPLIT HO CREATO NUOVE RIGHE IN

BASE AL CAMPO TERRITORI. LE RIGHE SONO PERÒ VUOTE IN TUTTI GLI ALTRI CAMPI, MA DALLA FUNZIONE FILL DOWN

POSSO PORRE RIMEDIO

Page 62: Workshop pratico DDJ - Bari

IN SEGUITO FACCIO UNA ESPORAZIONE IN LIBREOFFICE SELEZIONANDO I CAMPI CHE MI SERVONO COL CUSTO TABLUAR

EXORTER

Page 63: Workshop pratico DDJ - Bari

SE FACCIO UNA PIVOT POSSO CONTARE I PROGETTI PER

TERRITORIO E TIPOLOGIA DEI SOGGETTI ATTUATORI

Page 64: Workshop pratico DDJ - Bari
Page 65: Workshop pratico DDJ - Bari

INFRASTRUTTURE PUGLIA❏ esploriamo i soggetti attuatori per capire

chi le sta costruendo e quali tipologie di progetti sono stati finanziati

❏ facciamo una veloce analisi territoriale

❏ scopriamo e monitoriamo i dieci progetti più grossi

Page 66: Workshop pratico DDJ - Bari

DEVO RIPRISTINARE IL DATASET A PRIMA DELLO SPLITTAMENTO CHE MI HA AGGIUNTO RIGHE CHE NON MI SERVONO IN QUESTO CASO E CHE ANZI RENDONO

PIÙ DIFFICOLTOSA L’ANALISI

PER FARLO USO UNDO/REDO

Page 67: Workshop pratico DDJ - Bari

PER SELEZIONARE IL RANGE DEGLI IMPORTI DEI

PROGETTI FINANZIATI INSERISCO NEL CAMPO

FIN_TOTALE_PROGETTO UN NUMERIC FACET

Page 68: Workshop pratico DDJ - Bari

SPOSTANDO GLI ESTREMI DELLA BARRA POSSO

SELEZIONARE IL RANGE DESIDERATO

Page 69: Workshop pratico DDJ - Bari

SINTETIZZARE E

RAPPRESENTAREI DATI

Page 71: Workshop pratico DDJ - Bari

RACCONTARE UNA STORIA

Page 72: Workshop pratico DDJ - Bari

[email protected]

Grazie a tutti!

@andria_tzedda