curs sobre open data i visualització de dades
TRANSCRIPT
Hola hola hola Hola hola hola
Hola hola hola hola hola hola hola hola hola
Curs d’Open Data
Marc Garriga: http://mgarrigap.info/ Ignasi Alcalde: http://ignasialcalde.es/ Cibernàrium, Barcelona Activa Barcelona, del 13 al 16 de juliol de 2015
Dades obertes i visualització
Marc Garriga - @mgarrigap Ignasi Alcalde - @ignasialcalde
Curs d’Open Data 2
Curs d’Open Data
• Introducció a les dades obertes (Open Data) • Característiques de les dades obertes. • Beneficis de les dades obertes. • Portals de dades obertes. • Exercicis pràctics.
• Legislació i dades obertes. • Bones pràctiques en la publicació de dades. • Plataformes d’obertura de dades. • Per què no es reutilitza més? • Negocis i dades obertes. • Exercicis pràctics.
Dilluns 13/07 Dimarts 14/07
Guió
• Projectes de dades: fases i processos. • Rols professionals en un projecte de dades. • Com iniciar un projecte de dades. Propostes. • Categories i tipus de visualitzacions de
dades. • Introducció a Tableau Públic.Exercicis
pràctics.
• Projecte de dades obertes i visualització. • Presentació dels treballs realitzats.
Dimecres 15/07 Dijous 16/07
Curs d’Open Data 3
Curs d’Open Data
• Introducció a les dades obertes (Open Data) • Característiques de les dades obertes. • Beneficis de les dades obertes. • Portals de dades obertes. • Exercicis pràctics.
• Legislació i dades obertes. • Bones pràctiques en la publicació de dades. • Plataformes d’obertura de dades. • Per què no es reutilitza més? • Negocis i dades obertes. • Exercicis pràctics.
Dilluns 13/07 Dimarts 14/07
Guió
• Projectes de dades: fases i processos. • Rols professionals en un projecte de dades. • Com iniciar un projecte de dades. Propostes. • Categories i tipus de visualitzacions de
dades. • Introducció a Tableau Públic.Exercicis
pràctics.
• Projecte de dades obertes i visualització. • Presentació dels treballs realitzats.
Dimecres 15/07 Dijous 16/07
Contingut d’aquesta presentació (la part del curs realitzada per Marc Garriga)
“In God we trust.
Everyone else, bring data”
http
://r
t.com
/new
s/sn
owde
n-m
ep-in
vite
-nsa
-146
/
Algú creu que no estem vivint en la Societat de les Dades?
http
://w
ww
.nat
han.
com
/tho
ught
s/un
ified
/3.h
tml
Segons Nathan Shedroff (1994)
Què és una dada? http://www.systems-thinking.org/dikw/dikw.htm
Open Government Directive
http
://w
ww
.whi
teho
use.
gov/
sites
/def
ault/
files
/om
b/as
sets
/mem
oran
da_2
010/
m10
-06.
#oGov Transparència – Participació – Col·laboració
Segons Alberto Ortiz de Zárate
Tipus de transparències 1. Transparència passiva:
• Dret de la ciutadania a rebre la informació que sol·liciti. • Sustentat en lleis i procediments d'accés a la informació
2. Transparència activa: • Compromís de publicar la informació rutinàriament. • Tot visible, cercable i usable.
3. Transparència col·laborativa (= dades obertes, “Open Data”): • Compromís de publicar les dades crues. • Dret de la ciutadania a processar per produir nova
informació.
Open Data Proporcionar les dades (públiques) en formats digitals, estàndards i oberts per a ser reutilitzades de forma automàtica.
Qualsevol pot usar-les (reutilitzar-les) gratuïtament
quan vulgui pel que vulgui (inclosa la finalitat comercial)
Open Data
“Los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen”.
Open Data
El adjetivo abierto se define como un “formato cuya especificación esté disponible públicamente y de manera gratuita, además, para su uso no se deben imponer restricciones de tipo monetario u otras”.
Open Data
“Son considerados datos abiertos todos aquellos datos accesibles y reutilizables, sin exigencia de permisos específicos. No obstante, los tipos de reutilización pueden estar controlados mediante algún tipo de licencia.”
Open Data vs Open Doc
Open Data vs Open Gov
Open Data vs Transparency
Com han de ser les dades? http://www.zaragoza.es/ciudad/risp/
”Dato único / dato compartido / dato accesible / dato abierto /
dato georreferenciado / dato descrito semánticamente.” • El dato es único, lo mejor es ir siempre a la fuente de los datos, no tener
copias intermedias. • El dato hay que compartirlo (internamente y externamente: dato
abierto), compartiendo es cuando multiplicamos su valor. • Para poder compartir el dato tiene que estar accesible (de forma fácil y
estable a lo largo del tiempo). • La inmensa mayoría (por no decir todos) de los datos tienen la capacidad
de estar georreferenciados. Actualmente ya no se entiende un dato sin esta característica.
• El dato tiene que ir acompañado de sus metadatos que le describen semánticamente.
Classificació de les dades
Classificació de les dades
FORMATS • CSV • XLS • XML • RDF • RSS • JSON • Etc…
Dades reutilitzables!
http://www15.gencat.cat/ecofin_wpres12/02_llei.htm
http://dadesobertes.gencat.cat/
Quina diferència hi havia?…
http
://e
adm
inbl
og.n
et/2
013/
05/0
6/so
cial
-dat
a-pa
pel-a
dmin
istra
cion
-soc
ieda
d-da
to/
PQ? PQ ARA?
Open Data
Pel valor, riquesa de les dades Per poder retre comptes. Per ètica Per la universalització de l’accés
a les dades Per la investigació (I+D+i) Per validar qualitat de les dades Per augmentar els serveis públics i conèixer millor a l’AP. Per ser un primer pas a oGov
La actividad infomediaria española se calcula que es de 330-550 M € (anual). Hay un universo de 150 empresas que generan aplicaciones, productos y servicios con valor destinados a terceros, a partir de la información del sector público. El 30% tiene clientes en la UE y 25% fuera de UE. Ocupa 3600-4400 trabajadores * Según el estudio 'Caracterización del sector Infomediario en España'. Proyecto Datos.gob.es. Junio 2012.
Dades = Valor econòmic
http
://w
ww
.foia
.gov
/
“…es más barata y satisfactoria una política de oferta (data.gov) que una de demanda (foia.gov)” 500M$ vs 34M$ (2010) Alberto Ortiz de Zárate, Blog Administraciones en Red
Apps for Democracy
http
://w
ww
.app
sfor
dem
ocra
cy.o
rg/
Ingressos/Despeses a Aragó
http
://p
resu
pues
to.a
rago
n.es
/
Dades = Valor democràtic
Dades = Valor democràtic
Dades = Valor democràtic
http
://w
ww
.pub
lico.
es/in
tern
acio
nal/3
4796
1/tr
ansp
aren
cia-
y-po
litic
a-tr
as-e
l-esc
anda
lo-e
n-re
ino-
unid
o
Dades = Valor democràtic
Open Data per la transparència (exp.)
¿Quin és el preu del sulfat de ferro + àcid fòlic?
Dades = “Valor humà”
Open Data per la transparència (exp.)
¿Quin és el preu del sulfat de ferro + àcid fòlic?
A Ruanda 0,12 $ (per 100 tabletes)
Dades = “Valor humà”
Open Data per la transparència (exp.)
¿Quin és el preu del sulfat de ferro + àcid fòlic?
A la República Democràtica del Congo 0,2 $ (per 100 tabletes)
Dades = “Valor humà”
Open Data per la transparència (exp.)
¿Quin és el preu del sulfat de ferro + àcid fòlic?
A Namíbia 0,9 $ (per 100 tabletes)
Dades = “Valor humà”
Open Data per la transparència (exp.)
¿Quin és el preu del sulfat de ferro + àcid fòlic?
A Swazilàndia 3,0 $ (per 100 tabletes)
Dades = “Valor humà”
Open Data per la transparència (exp.)
Swazilàndia paga 25 vegades més que Ruanda pel mateix fàrmac
Dades = “Valor humà”
Open Data per la transparència (exp.)
Botswana: “We used the R10.00 tender
price in South Africa to push Bayer for a lower price (the new price should hopefully be
implemented in the next 2-3 weeks). We are currently paying R99 per pack, but we have paid
as high as R152 in the past. This will amount to a
saving of around P10,000,000 per year.”
http
://u
npan
1.un
.org
/intr
adoc
/gro
ups/
publ
ic/d
ocum
ents
/un-
dpad
m/u
npan
0503
47.p
df
1er impediment: Polític
2on impediment: Endreçar dades…
3er impediment: Díficil de mesurar
4rt impediment: Desconeixement
http
://d
atos
.fund
acio
nctic
.org
/san
dbox
/cat
alog
/fac
eted
/
Data.Gov
Edm
onto
n
http
://d
atos
.fund
acio
nctic
.org
/san
dbox
/cat
alog
/fac
eted
/
http://opendata.euskadi.eus/
Datos.Gob.es
http
://w
ww
.dat
osab
iert
os.jc
yl.e
s/
https://www.zaragoza.es/ciudad/risp/
http
s://
ww
w.z
arag
oza.
es/c
iuda
d/ris
p/
• Ajuntament de Badalona. • Ajuntament de Barcelona. • Ajuntament de Cornellà de
Llobregat. • Ajuntament de Gavà. • Ajuntament de Granollers. • Ajuntament de Lleida. • Ajuntament de Manresa. • Ajuntament del Prat de
Llobregat. • Ajuntament de Rubí. • Ajuntament de Sabadell.
• Ajuntament de Sant Boi de Llobregat.
• Ajuntament de Sant Cugat del Vallès.
• Ajuntament de Sant Feliu de Llobregat.
• Ajuntament de Tarragona. • Ajuntament de Terrassa. • Ajuntament de Viladecans. • Diputació de Barcelona. • Generalitat de Catalunya.
Forta presència catalana
h
ttp:
//da
deso
bert
es.g
enca
t.cat
/
http
s://
gava
ober
t.gav
aciu
tat.c
at/
http
://w
ww
.sed
ecat
astr
o.go
b.es
/ Reutilització no només en els portals Open Data
Més info? EPSI Platform http://epsiplatform.eu/
“Right now we now that the biggest disease of all it's not a disease. It's corruption.
But there's a vaccine for that. It's called transparency, open data sets”
http
://w
ww
.ted.
com
/tal
ks/b
ono_
the_
good
_new
s_on
_pov
erty
_yes
_the
re_s
_goo
d_ne
ws.
htm
l
Curs d’Open Data 64
Curs d’Open Data
• Introducció a les dades obertes (Open Data) • Característiques de les dades obertes. • Beneficis de les dades obertes. • Portals de dades obertes. • Exercicis pràctics.
• Legislació i dades obertes. • Bones pràctiques en la publicació de dades. • Plataformes d’obertura de dades. • Per què no es reutilitza més? • Negocis i dades obertes. • Exercicis pràctics.
Dilluns 13/07 Dimarts 14/07
Guió
• Projectes de dades: fases i processos. • Rols professionals en un projecte de dades. • Com iniciar un projecte de dades. Propostes. • Categories i tipus de visualitzacions de
dades. • Introducció a Tableau Públic.Exercicis
pràctics.
• Projecte de dades obertes i visualització. • Presentació dels treballs realitzats.
Dimecres 15/07 Dijous 16/07
"The ability of third parties to participate is what makes
Open Data truly transformative" Beth Noveck, (former US CTO for oGov initiative)
“Open Data – The Democratic Imperative" (2012)
http
://w
ww
.nat
han.
com
/tho
ught
s/un
ified
/3.h
tml
Segons Nathan Shedroff (1994)
Recordeu: Què és una dada?
http://www.systems-thinking.org/dikw/dikw.htm
Una dada té propietat intel·lectual?
http
://e
s.cr
eativ
ecom
mon
s.or
g/
Avís legal
http
://d
atos
.gob
.es/
dato
s/?q
=avi
so-le
gal
Llicència d’ús de dades obertes
http
://w
ww
.nat
iona
larc
hive
s.go
v.uk
/doc
/ope
n-go
vern
men
t-lic
ence
/
LEGAL HARMONISATION ht
tps:
//ec.
euro
pa.e
u/di
gita
l-age
nda/
en/n
ews/
com
mis
sion
-no
tice-
guid
elin
es-r
ecom
men
ded-
stan
dard
-lice
nces
-dat
aset
s-an
d-ch
argi
ng-r
e-us
e ht
tp://
ww
w.la
psi-p
roje
ct.e
u/
BIG LEGAL
UNCERTAINTY
Négy
Dir. 2003/98/CE
http
://e
ur-le
x.eu
ropa
.eu/
LexU
riSer
v/Le
xUriS
erv.
do?u
ri=CE
LEX:
3200
3L00
98:E
S:HT
ML
http
://e
psip
latfo
rm.e
u/co
nten
t/eu
rope
s-ne
w-p
si-di
rect
ive
Nova Directiva
Llei 37/2007
http
://w
ww
.boe
.es/
boe/
dias
/200
7/11
/17/
pdfs
/A47
160-
4716
5.pd
f
http
://b
oe.e
s/bo
e/di
as/2
011/
11/0
8/pd
fs/B
OE-
A-20
11-1
7560
RD 1495/2011
Llei 18/2015
Llei 19/2013
Llei CAT 19/2014
Norma AENOR http://www.aenor.es/aenor/actualidad/actualidad/noticias.asp?campo=1&codigo=35264#
Bones pràctiques
Este decálogo es fruto de las conclusiones del Día Open Data en Euskadi celebrado en Donostia-San Sebastián, el 09/05/12, en el marco del #CICD.
0. Armonización entre Administraciones. 1. Publicar datos en formatos abiertos y estándares. 2. Usar esquemas y vocabularios consensuados. 3. Inventario en un catálogo de datos estructurado (Ejp. DCAT). 4. Datos accesibles desde direcciones web persistentes y amigables. 5. Exponer un mínimo conjunto de datos relativos al nivel de competencias
del organismo y su estrategia de exposición de datos 6. Compromiso de servicio, actualización y calidad del dato, manteniendo
un canal eficiente de comunicación reutilizador <-> AAPP. 7. Monitorizar y evaluar el uso y servicio mediante métricas. 8. Datos bajo condiciones de uso no restrictivas y comunes. 9. Evangelizar y educar en el uso de datos. 10. Recopilar aplicaciones, herramientas y manuales para motivar y facilitar
la reutilización.
http
://r
ed.g
noss
.com
/com
unid
ad/O
penD
ata
Decàleg Open Data Espanya
Obrir dades… no es només obrir
http
://w
ww
.slid
esha
re.n
et/a
lorz
a/za
rago
za-t
rans
pare
ncia
open
data
Obertura com a rutina
Sost
enib
ilita
t
Información de base
Toda la información
en el 010
Toda la información
en la web
Los datos en la web:
Open Data
eficiencia servicio a la ciudadanía
Open Data integrat en el circuit d’informació
http
://w
ww
.slid
esha
re.n
et/a
lorz
a/za
rago
za-t
rans
pare
ncia
open
data
Qualitat de la dada http://www.zaragoza.es/ciudad/risp/
”Dato único / dato compartido / dato accesible / dato abierto /
dato georreferenciado / dato descrito semánticamente.” • El dato es único, lo mejor es ir siempre a la fuente de los datos, no tener
copias intermedias. • El dato hay que compartirlo (internamente y externamente: dato
abierto), compartiendo es cuando multiplicamos su valor. • Para poder compartir el dato tiene que estar accesible (de forma fácil y
estable a lo largo del tiempo). • La inmensa mayoría (por no decir todos) de los datos tienen la capacidad
de estar georreferenciados. Actualmente ya no se entiende un dato sin esta característica.
• El dato tiene que ir acompañado de sus metadatos que le describen semánticamente.
Open Raw Data Now! ...
http
://w
ww
.ted.
com
/tal
ks/t
im_b
erne
rs_l
ee_o
n_th
e_ne
xt_w
eb.h
tml
http
://w
ww
.slid
esha
re.n
et/a
lorz
a/za
rago
za-t
rans
pare
ncia
open
data
Obrir ≠ tenir reutilització
Cal generar confiança
http
://w
ww
.slid
esha
re.n
et/a
lorz
a/za
rago
za-t
rans
pare
ncia
open
data
http
://c
caa.
elpa
is.co
m/c
caa/
2013
/10/
21/c
atal
unya
/138
2380
347_
2830
11.h
tml
http
://p
resu
pues
to.a
rago
n.es
/
Met
adad
es
http
://w
ww
.bcn
.cat
/ope
ndat
a/
Obertura de dades per a la eficiència administrativa
http
://w
ww
.w3.
org/
com
mun
ity/o
pend
atas
pain
/201
3/05
/13/
revi
sion-
de-la
-esp
ecifi
caci
on-p
ara-
la-in
tero
pera
bilid
ad-d
e-lo
s-ca
talo
gos-
open
-dat
a-eu
rope
os/
DCAT = Metaportal OD
A SPANISH CASE OF FEDERATED OD PORTALS
http
://da
tos.
gob.
es/
http
://w
ww
.boe
.es/
diar
io_b
oe/t
xt.p
hp?i
d=BO
E-A-
2013
-238
0
Interoperabilitat i RISP
Guia de la NTI de RISP
http
://d
atos
.gob
.es/
dato
s/?q
=nod
e/26
76
Plataformes tecnològiques
Is Open Data the best solution? The hard reality: BUILDING OPEN DATA SERVICES IS, STILL, A PAIN
REASONS/COMMENTS:
#1: “We need more data opened”.
#2: “Open the Data is expensive”.
#3: “The Law don’t enforce me to open data”.
#4: “The open data quality is so low”.
#5: “Governments open data that we don’t want”.
#6: “We need all data, we don’t want only the ‘cooked’ data”.
#7: “We need to homogenize all open data offer”.
#8: “From close data to open data… but in silos”.
#9: “I don’t know what the hell license is applicable”.
#10: “I have a strong distrust towards the government”. Etc. Source: http://www.caldocasero.es/2013/09/por-que-no-se-reutilizan-los-datos.html
Image Source: “Trepidation” by Julia Shashkina, CC BY-NC-ND 2.0 https://www.flickr.com/photos/81179994@N03/16477447647/in/photostream/
Open Data v1 vs. Open Data v2
Centrat en l’obertura de
dades
Descàrregues
Centrat en la reutilització de
les dades
APIs
La actividad infomediaria española se calcula que es de 330-550 M € (anual). Hay un universo de 150 empresas que generan aplicaciones, productos y servicios con valor destinados a terceros, a partir de la información del sector público. El 30% tiene clientes en la UE y 25% fuera de UE. Ocupa 3600-4400 trabajadores * Según el estudio 'Caracterización del sector Infomediario en España'. Proyecto Datos.gob.es. Junio 2012.
Dades = Valor econòmic
Hi ha negoci?
http://www.mckinsey.com/insights/business_technology/open_data_unlocking_innovation_and_performa
nce_with_liquid_information
Según Carlos Iglesias: http://www.slideshare.net/carlosiglesiasmoro/el-valor-de-los-datos-abiertos
• Modelos 100% de pago. • Servicios relacionados: consultoría, desarrollos
ad-hoc. • Freemium: gratuito de entrada y pago por
servicios de valor añadido. • Efectos colaterales: p. ejp. mejorando la
reputación. • Efecto Red: negocio derivado de los beneficios de
la colaboración en entornos ricos de datos. Por ejp: Green Button, Blue Button.
Possibles models de negoci
“Solo hay espacio para una o dos aplicaciones que te dicen
a qué hora llega el bus”
https://www.youtube.com/watch?v=wZf5C0H8teE
Open Data per generar complementar (fer més eficients) els negocis (exp.)
J. P. Licks
El principal ús de les dades (obertes) és complementar els negocis tradicionals, és a dir, que les dades obertes siguin un input més. En poc temps obtenir dades (obertes) serà un fet quotidià i senzill, serà considerar una utility més: electricitat, gas, aigua… dades.
Open Data as another utility
Control de plagues
AirText
Diag
nost
icat
http
://w
ww
.bizk
aia.
net/
ekon
omi_
sust
apen
a/ca
lend
ario
/cal
enda
rio.a
sp?T
em_C
odig
o=15
20&
Idio
ma=
CA&
bnet
mob
ile=0
Cale
ndar
io la
bora
l
http
://e
lpre
ciod
elag
asol
ina.
com
/
El Precio de la Gasolina
Dades meteorològiques
The Weather Channel
wikidata.org
ca.wikipedia.org/ wiki/Viquiprojecte:Xucladors
ca.wikipedia.org/wiki/Usuari:Amical-bot
Creació automàtica d’articles a la Wikipedia
Open Data i Wikipedia
http
://w
ww
.soc
rata
.com
/dat
a-as
-a-u
tility
/
Més enllà de l’Open Data… These are the
cities involved in iCity Project in
June, 2015. Cities of iCity Consortium. Other cities involved in iCity. Cities that have signed a letter of interest. Cities that have interested in iCity Project.
Amsterdam (NL) Barcelona (ES) Birmingham (UK) Belfast (UK) Berlin (DE) Bologna (IT) Bordeaux (FR) Croydon (UK) Cornellà (SP) Genova (IT) Ghent (BE) Istanbul (TR) Lamia (GR) Manchester (UK) Milan (IT) Murcia (SP) Oulu (FI) Piacenza (IT) Red Bridge (UK) Reggio Emilia (IT) Tallinn(EE) Torino (IT) Vienna (AT) Viladecans (SP) Vilanova i la Geltru (SP) Zaragoza(SP)
118
119
An example
iCity Platform
API manager
Terrassa (?)
Smart Parking
Translation layer
Croydon (London) (?)
Smart Parking
iCity API
Just one App that works in all cities ONE FOR ALL!!!
Barcelona Smart Parking +
Traffic + Agenda + Facilities
Bologna (?)
Parking + Traffic
http
://ic
itypr
ojec
t.eu/
“Every government degenerates when trusted to the rulers of the people alone.
The people themselves, therefore, are its only safe depositories."
Thomas Jefferson, Virginia, USA (1782)
Hola hola hola Hola hola hola
Hola hola hola hola hola hola hola hola hola
Curs d’Open Data
Ignasi Alcalde: http://ignasialcalde.es/ Marc Garriga: http://mgarrigap.info/ Cibernàrium, Barcelona Activa Barcelona, del 13 al 16 de juliol de 2015
Dades obertes i visualització
Marc Garriga - @mgarrigap Ignasi Alcalde - @ignasialcalde