gestión digital de la información, isummit loxa 2012

Post on 25-Jun-2015

1.553 Views

Category:

Technology

5 Downloads

Preview:

Click to see full reader

DESCRIPTION

Presentación para iSummit Loxa 2012

TRANSCRIPT

Gestión digital de la informacióndel papel a la web semántica

Christian Sifaqui

25.10.2012

Congreso Nacional de Chile

Roles de la BCN

Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país

Roles de la BCN

Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país

Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria

Roles de la BCN

Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país

Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria

Rol público, ser el espacio de conocimiento y comprensión de los ámbitos de interés social prioritarios para el país con énfasis en lo político y lo jurídico

Roles de la BCN

Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país

Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria

Rol público, ser el espacio de conocimiento y comprensión de los ámbitos de interés social prioritarios para el país con énfasis en lo político y lo jurídico

Atendemos y entregamos servicios

Papel

Ha durado miles de años…

… y durará miles de años más

Una historia: procesamiento de diarios

Unidad de Recortes de Prensa:analizaba las noticiasrecortaba físicamente (con tijeras)almacenaba estos recortes en sobres clasificados por

materia, previa asignación de una tarjeta de identificación

actualmente son más de 5 millones de recortes de prensa

Una historia: procesamiento de diarios

ActualmenteDigitalizando recortes (estándares, resolución, …)Metadata (Dublin core, propias …)OCR (calidad, ICR, …)

Estos documentos se ingresan como noticias históricas a nuestro sistema noticias.bcn.cl (después lo veré en detalle)

Una historia: procesamiento de diarios

Unidad de Indización de la prensa: revisaba los diariosredactaba fichas con un resumen y con una referencia al

diariocerrada en 1990 (pasó al olvido)existen 15 ficheros con estas fichas

Una historia: procesamiento de diarios

Prototipo¿será posible relacionar las fichas con los recortes?

Una historia: procesamiento de diarios

Se digitalizaron algunas fichas

Una historia: procesamiento de diarios

Encontró artículo(mismo medio, fecha y contenido)

Encontró para el mismo día contenidossimilares pero de diferentes medios

Encontró en la semana artículos decontenidos similares

Una historia: procesamiento de diarios

Después de 22 años se pudo integrar información on-the-fly, ya que se dispuso digitalmente

Pero…sólo para Senador Anselmo Sule107 fichasdigitalización 107 fichas 10 minutosOCR 5 minutos sin correccióndos personas usaron 2:45 hrs. c/u para revisar OCRs

Tenemos 400.000 fichas app.Sólo un prototipo

http://noticias.bcn.cl 2009-

http://noticias.bcn.cl 2009-

http://noticias.bcn.cl 2009-

radio

tv

http://noticias.bcn.cl 2009-

http://noticias.bcn.cl 2009-

temas “candentes” para la prensa

Definiciones

Open Data: es un idea que impulsa la publicación de datos de forma libre y asequible a cualquier persona para usar y republicar sin restricciones de ningún tipo

Linked Data: es usar la web para conectar datos relacionados que no estaban enlazados previamente. Usa algunas de las mejores prácticas de la Web Semántica

Motivación

Acciones y datos del Estado pueden ser supervisadosMejora transparencia y confianza

Valor público (genera experiencia ciudadana)Colaboración e invetigaciónReutilización de los datos

Información pública pertenece a los ciudadanosFinanciado con recursos públicosROI

Dominios de aplicación

Legislación

Historia política

Legislación

Legislación es información pública…

… y debe ser de dominio público

Legislación

Hacer disponible y facilitar el acceso a la comunidad de las fuentes jurídicas de uso en el Congreso Nacional, junto con educar y fomentar las redes sociales en torno a temas jurídicos

Legislación

Certeza jurídica

Certeza del contenido de la norma legal

Legislación

En los años 50compilación mediante fichas con referencias entre las normas y clasificadas por materia

Legislación

En los 80el sistema de fichas fue reemplazado por un sistema automático basado en STAIRS

A mediados de los 90el sistema anterior se reemplaza por una arquitctura cliente-servidor basada en BASIS PLUS, reconstruyendo en línea en texto completo de las normas

LeyChile

Liberado el 2008

LeyChile

Biblioteca del Congreso Nacional de Chile

Biblioteca del Congreso Nacional de Chile

Ley 220001.- abc2.- def3.- ghi

Ley 220001.- abc2.- def3.- ghi

(original)1.- abc2.- def3.- ghi

(original)1.- abc2.- def3.- ghi

Diario OficialDiario Oficial

Ley 22000Ley 22000

LeyChile

Biblioteca del Congreso Nacional de Chile

Biblioteca del Congreso Nacional de Chile

Ley 253451.- Modifica

ley 22000Art. 1

sustitúyase apor xyz

Ley 253451.- Modifica

ley 22000Art. 1

sustitúyase apor xyz

(original)1.- abc2.- def3.- ghi

(original)1.- abc2.- def3.- ghi

(actualizada)1.- xyzbc

2.- def3.- ghi

(actualizada)1.- xyzbc

2.- def3.- ghi

Ley 253451.- Modifica

ley 22000Art. 1

sustitúyase apor xyz

Ley 253451.- Modifica

ley 22000Art. 1

sustitúyase apor xyz

Ley 22000Ley 22000

Ley 25345Ley 25345

Diario OficialDiario Oficial

LeyChile

Modelar la “vida” de una norma

LeyChile

Modelar la “vida” de una norma

LeyChile

Modelar la “vida” de una norma

LeyChile

Modelar la “vida” de una norma

LeyChile

Modelar la “vida” de una norma

LeyChile

Modelar la “estructura” de una norma

LeyChile

XMLTexto: versiones, hypervículos, referencias, notas

Estructura: Organización jerárquica de las partes de una norma

Metadata: información adicional del documento, como identificación de la norma, materias, términos libres, etc.

LeyChile: nuestra oferta a seres humanos

LeyChile: nuestra oferta a máquinas

WSDL (http://www.leychile.cl/ws/LeyChile.wsdl)

LeyChile: nuestra oferta a máquinas

WSDL (http://www.leychile.cl/ws/LeyChile.wsdl)Links, widgets, web services

(http://llevatelo.bcn.cl)

LeyChile: ¿es posibe incorporarle linked-open data (LOD)?

Extensión natural

Mejorar la interoperabilidad (más formatos)

Crear ontologías del dominio

Ofrecer una solución a consultas complejas usando un endpoint SPARQL

Primer paso: exponer metadata de las normas

Principios LOD: URIs

Diseño cuidadoso (leyes, decretos, reglamentos, resoluciones, decretos ley…)

FRBR

WorkWork ley 20000ley 20000

ExpressionExpression Versión actualizadapara el año 2012

Versión actualizadapara el año 2012

ManisfestationManisfestation archivo XMLarchivo XML

1

N1

1

N

N

ItemItem Archivo físico XML enun servidor específico

Archivo físico XML enun servidor específico

Principios LOD: URIs

http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341Decreto 341; publicado el 11/11/2008; del Ministerio de Educación

http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2008-11-07http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2008-11-07

http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2010-07-20http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2010-07-20

Versión original

Otra versión

Principios LOD: RDF

Principios LOD: enlaces

Relaciones a otros datasets: países (Tratados internacionales)DBPedia, Geonames

Reuso de vocabularios/ontologíasSKOS, DC, FOAF, DBPedia, ORG

Consulta compleja

Encontrar todas las ordenanzas municipales publicadas entre 1995 y 2000, pero que hayan sido modificadas después del 2005

PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?Fecha_modificacionWHERE { ?norm n:createdBy ?creator . ?creator n:hasName ?creatorName . ?norm dc:title ?normTitle . ?norm n:publishDate ?pubDate . ?norm n:isModifiedBy ?otherNorm . ?otherNorm n:publishDate ?pubDateOther . FILTER (regex(?creatorName,"MUNICIPALIDAD","i")) FILTER (?pubDate > xsd:date("1995") && ?pubDate < xsd:date("2000") && ?pubDateOther > xsd:date("2005"))}ORDER BY (?pubDate)

PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?Fecha_modificacionWHERE { ?norm n:createdBy ?creator . ?creator n:hasName ?creatorName . ?norm dc:title ?normTitle . ?norm n:publishDate ?pubDate . ?norm n:isModifiedBy ?otherNorm . ?otherNorm n:publishDate ?pubDateOther . FILTER (regex(?creatorName,"MUNICIPALIDAD","i")) FILTER (?pubDate > xsd:date("1995") && ?pubDate < xsd:date("2000") && ?pubDateOther > xsd:date("2005"))}ORDER BY (?pubDate)

http://datos.bcn.cl

Primera etapa finalizada en mayo del 2011Más de 300.000 normas exportadas≈27 triplas por norma≈8 millones de triplas

200 a 400 triplas se agregan cada día

David Robinson and Harlan Yu in “El desafío hacia el gobierno abierto en la hora de la igualdad”, Gastón Concha y Alejandra Naser (eds.), Santiago, CEPAL, 2012

“Open data does not create its own demand. The government should compromise the developers”

Visualizaciones

Visualizaciones

Historia política

Rescatar  y poner en servicio a la comunidad la memoria política chilena, resguardando los discursos, actos y rol de los parlamentarios y el Congreso, como al mismo tiempo, el contexto en que se desenvuelve la política chilena y con ello contribuir a que los ciudadanos reconozcan su identidad y sentido político en una perspectiva histórica

Historia política

Reseñas biográficas

Historia política

Reseñas biográficas

Historia políticahttp://datos.bcn.cl/recurso/persona/2371http://datos.bcn.cl/recurso/persona/2371

Historia política

Reseñas biográficas

no tenemos todos los años de nacimiento, ni fallecimiento, ni los lugarespor ejemplo, Salvador de la Cavareda Trucios diputado

suplente por Valparaíso 1824 a 1825 (hermano de Salvador y José Joaquín)

Pero sabemos lo que nos falta:PREFIX bcnbio: <http://datos.bcn.cl/ontologies/bcn-biographies#> select * where { ?a a foaf:Person . OPTIONAL {?a bcnbio:hasBorn ?ano } . FILTER (!bound(?ano)) . }

PREFIX bcnbio: <http://datos.bcn.cl/ontologies/bcn-biographies#> select * where { ?a a foaf:Person . OPTIONAL {?a bcnbio:hasBorn ?ano } . FILTER (!bound(?ano)) . }

Historia política

Reseñas biográficas

Manuel Joaquín Díaz (diputado Congreso Constituyente 1891)

Manuel Joaquín Díaz Besoaín (diputado 1906-1908)

¡No es la misma persona!el primero es Liberal-Democrático y el segundo

Conservador

Historia política

Reseñas biográficas

Juan Esteban Manzano de la Sotta (diputado 1825-1826)

Esteban Ignacio Fernández del Manzano y de la Sotta

¡Es la misma persona!

Historia política

Reseñas biográficas

Carlos Larraín Claro (diputado 1912- 1915)Carlos Larraín Claro, suegro de Jorge Astaburuaga

Lyon (diputado 1924-1927)

¿Es la misma persona?

Visualizaciones

ConformacionesDetalle del

parlamentario

Árbol genealógico Relaciones deparentezco

datos.bcn.cl/GenealogiaParlamentaria

Desarrollo actual

Trabajo actual y futuro

Más datasets: biografías, transparencia, datos geográficos, historia de la ley, documentos legislativos…

Exponer partes de una norma y su metadata

Conclusiones

Open data, open linked data, web semántica es más que una tecnología… es una manera de administrar información

Visualización no es un producto final, es un proceso de realimentación para “purificar” los datos y mejorar la visualización

Crea valor para nosotros mismos 1

Muchos detalles técnicos y desafíos permanecen sin resolver 1

1.- David Robinson and Harlan Yu in “El desafío hacia el gobierno abierto en la hora de la igualdad”, Gastón Concha y Alejandra Naser (eds.), Santiago, CEPAL, 2012

top related