gestión digital de la información, isummit loxa 2012
Post on 25-Jun-2015
1.553 Views
Preview:
DESCRIPTION
TRANSCRIPT
Gestión digital de la informacióndel papel a la web semántica
Christian Sifaqui
25.10.2012
Congreso Nacional de Chile
Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país
Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país
Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria
Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país
Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria
Rol público, ser el espacio de conocimiento y comprensión de los ámbitos de interés social prioritarios para el país con énfasis en lo político y lo jurídico
Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país
Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria
Rol público, ser el espacio de conocimiento y comprensión de los ámbitos de interés social prioritarios para el país con énfasis en lo político y lo jurídico
Atendemos y entregamos servicios
Papel
Ha durado miles de años…
… y durará miles de años más
Una historia: procesamiento de diarios
Unidad de Recortes de Prensa:analizaba las noticiasrecortaba físicamente (con tijeras)almacenaba estos recortes en sobres clasificados por
materia, previa asignación de una tarjeta de identificación
actualmente son más de 5 millones de recortes de prensa
Una historia: procesamiento de diarios
ActualmenteDigitalizando recortes (estándares, resolución, …)Metadata (Dublin core, propias …)OCR (calidad, ICR, …)
Estos documentos se ingresan como noticias históricas a nuestro sistema noticias.bcn.cl (después lo veré en detalle)
Una historia: procesamiento de diarios
Unidad de Indización de la prensa: revisaba los diariosredactaba fichas con un resumen y con una referencia al
diariocerrada en 1990 (pasó al olvido)existen 15 ficheros con estas fichas
Una historia: procesamiento de diarios
Prototipo¿será posible relacionar las fichas con los recortes?
Una historia: procesamiento de diarios
Se digitalizaron algunas fichas
Una historia: procesamiento de diarios
Encontró artículo(mismo medio, fecha y contenido)
Encontró para el mismo día contenidossimilares pero de diferentes medios
Encontró en la semana artículos decontenidos similares
Una historia: procesamiento de diarios
Después de 22 años se pudo integrar información on-the-fly, ya que se dispuso digitalmente
Pero…sólo para Senador Anselmo Sule107 fichasdigitalización 107 fichas 10 minutosOCR 5 minutos sin correccióndos personas usaron 2:45 hrs. c/u para revisar OCRs
Tenemos 400.000 fichas app.Sólo un prototipo
Definiciones
Open Data: es un idea que impulsa la publicación de datos de forma libre y asequible a cualquier persona para usar y republicar sin restricciones de ningún tipo
Linked Data: es usar la web para conectar datos relacionados que no estaban enlazados previamente. Usa algunas de las mejores prácticas de la Web Semántica
Motivación
Acciones y datos del Estado pueden ser supervisadosMejora transparencia y confianza
Valor público (genera experiencia ciudadana)Colaboración e invetigaciónReutilización de los datos
Información pública pertenece a los ciudadanosFinanciado con recursos públicosROI
Dominios de aplicación
Legislación
Historia política
Legislación
Legislación es información pública…
… y debe ser de dominio público
Legislación
Hacer disponible y facilitar el acceso a la comunidad de las fuentes jurídicas de uso en el Congreso Nacional, junto con educar y fomentar las redes sociales en torno a temas jurídicos
Legislación
Certeza jurídica
Certeza del contenido de la norma legal
Legislación
En los años 50compilación mediante fichas con referencias entre las normas y clasificadas por materia
Legislación
En los 80el sistema de fichas fue reemplazado por un sistema automático basado en STAIRS
A mediados de los 90el sistema anterior se reemplaza por una arquitctura cliente-servidor basada en BASIS PLUS, reconstruyendo en línea en texto completo de las normas
LeyChile
Liberado el 2008
LeyChile
Biblioteca del Congreso Nacional de Chile
Biblioteca del Congreso Nacional de Chile
Ley 220001.- abc2.- def3.- ghi
Ley 220001.- abc2.- def3.- ghi
(original)1.- abc2.- def3.- ghi
(original)1.- abc2.- def3.- ghi
Diario OficialDiario Oficial
Ley 22000Ley 22000
LeyChile
Biblioteca del Congreso Nacional de Chile
Biblioteca del Congreso Nacional de Chile
Ley 253451.- Modifica
ley 22000Art. 1
sustitúyase apor xyz
Ley 253451.- Modifica
ley 22000Art. 1
sustitúyase apor xyz
(original)1.- abc2.- def3.- ghi
(original)1.- abc2.- def3.- ghi
(actualizada)1.- xyzbc
2.- def3.- ghi
(actualizada)1.- xyzbc
2.- def3.- ghi
Ley 253451.- Modifica
ley 22000Art. 1
sustitúyase apor xyz
Ley 253451.- Modifica
ley 22000Art. 1
sustitúyase apor xyz
Ley 22000Ley 22000
Ley 25345Ley 25345
Diario OficialDiario Oficial
LeyChile
Modelar la “vida” de una norma
LeyChile
Modelar la “vida” de una norma
LeyChile
Modelar la “vida” de una norma
LeyChile
Modelar la “vida” de una norma
LeyChile
Modelar la “vida” de una norma
LeyChile
Modelar la “estructura” de una norma
LeyChile
XMLTexto: versiones, hypervículos, referencias, notas
Estructura: Organización jerárquica de las partes de una norma
Metadata: información adicional del documento, como identificación de la norma, materias, términos libres, etc.
LeyChile: nuestra oferta a seres humanos
LeyChile: nuestra oferta a máquinas
WSDL (http://www.leychile.cl/ws/LeyChile.wsdl)
LeyChile: nuestra oferta a máquinas
WSDL (http://www.leychile.cl/ws/LeyChile.wsdl)Links, widgets, web services
(http://llevatelo.bcn.cl)
LeyChile: ¿es posibe incorporarle linked-open data (LOD)?
Extensión natural
Mejorar la interoperabilidad (más formatos)
Crear ontologías del dominio
Ofrecer una solución a consultas complejas usando un endpoint SPARQL
Primer paso: exponer metadata de las normas
Principios LOD: URIs
Diseño cuidadoso (leyes, decretos, reglamentos, resoluciones, decretos ley…)
FRBR
WorkWork ley 20000ley 20000
ExpressionExpression Versión actualizadapara el año 2012
Versión actualizadapara el año 2012
ManisfestationManisfestation archivo XMLarchivo XML
1
N1
1
N
N
ItemItem Archivo físico XML enun servidor específico
Archivo físico XML enun servidor específico
Principios LOD: URIs
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341Decreto 341; publicado el 11/11/2008; del Ministerio de Educación
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2008-11-07http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2008-11-07
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2010-07-20http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2010-07-20
Versión original
Otra versión
Principios LOD: RDF
Principios LOD: enlaces
Relaciones a otros datasets: países (Tratados internacionales)DBPedia, Geonames
Reuso de vocabularios/ontologíasSKOS, DC, FOAF, DBPedia, ORG
Consulta compleja
Encontrar todas las ordenanzas municipales publicadas entre 1995 y 2000, pero que hayan sido modificadas después del 2005
PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?Fecha_modificacionWHERE { ?norm n:createdBy ?creator . ?creator n:hasName ?creatorName . ?norm dc:title ?normTitle . ?norm n:publishDate ?pubDate . ?norm n:isModifiedBy ?otherNorm . ?otherNorm n:publishDate ?pubDateOther . FILTER (regex(?creatorName,"MUNICIPALIDAD","i")) FILTER (?pubDate > xsd:date("1995") && ?pubDate < xsd:date("2000") && ?pubDateOther > xsd:date("2005"))}ORDER BY (?pubDate)
PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?Fecha_modificacionWHERE { ?norm n:createdBy ?creator . ?creator n:hasName ?creatorName . ?norm dc:title ?normTitle . ?norm n:publishDate ?pubDate . ?norm n:isModifiedBy ?otherNorm . ?otherNorm n:publishDate ?pubDateOther . FILTER (regex(?creatorName,"MUNICIPALIDAD","i")) FILTER (?pubDate > xsd:date("1995") && ?pubDate < xsd:date("2000") && ?pubDateOther > xsd:date("2005"))}ORDER BY (?pubDate)
http://datos.bcn.cl
Primera etapa finalizada en mayo del 2011Más de 300.000 normas exportadas≈27 triplas por norma≈8 millones de triplas
200 a 400 triplas se agregan cada día
David Robinson and Harlan Yu in “El desafío hacia el gobierno abierto en la hora de la igualdad”, Gastón Concha y Alejandra Naser (eds.), Santiago, CEPAL, 2012
“Open data does not create its own demand. The government should compromise the developers”
Visualizaciones
Visualizaciones
Historia política
Rescatar y poner en servicio a la comunidad la memoria política chilena, resguardando los discursos, actos y rol de los parlamentarios y el Congreso, como al mismo tiempo, el contexto en que se desenvuelve la política chilena y con ello contribuir a que los ciudadanos reconozcan su identidad y sentido político en una perspectiva histórica
Historia política
Reseñas biográficas
Historia política
Reseñas biográficas
Historia políticahttp://datos.bcn.cl/recurso/persona/2371http://datos.bcn.cl/recurso/persona/2371
Historia política
Reseñas biográficas
no tenemos todos los años de nacimiento, ni fallecimiento, ni los lugarespor ejemplo, Salvador de la Cavareda Trucios diputado
suplente por Valparaíso 1824 a 1825 (hermano de Salvador y José Joaquín)
Pero sabemos lo que nos falta:PREFIX bcnbio: <http://datos.bcn.cl/ontologies/bcn-biographies#> select * where { ?a a foaf:Person . OPTIONAL {?a bcnbio:hasBorn ?ano } . FILTER (!bound(?ano)) . }
PREFIX bcnbio: <http://datos.bcn.cl/ontologies/bcn-biographies#> select * where { ?a a foaf:Person . OPTIONAL {?a bcnbio:hasBorn ?ano } . FILTER (!bound(?ano)) . }
Historia política
Reseñas biográficas
Manuel Joaquín Díaz (diputado Congreso Constituyente 1891)
Manuel Joaquín Díaz Besoaín (diputado 1906-1908)
¡No es la misma persona!el primero es Liberal-Democrático y el segundo
Conservador
Historia política
Reseñas biográficas
Juan Esteban Manzano de la Sotta (diputado 1825-1826)
Esteban Ignacio Fernández del Manzano y de la Sotta
¡Es la misma persona!
Historia política
Reseñas biográficas
Carlos Larraín Claro (diputado 1912- 1915)Carlos Larraín Claro, suegro de Jorge Astaburuaga
Lyon (diputado 1924-1927)
¿Es la misma persona?
Visualizaciones
ConformacionesDetalle del
parlamentario
Árbol genealógico Relaciones deparentezco
datos.bcn.cl/GenealogiaParlamentaria
Desarrollo actual
Trabajo actual y futuro
Más datasets: biografías, transparencia, datos geográficos, historia de la ley, documentos legislativos…
Exponer partes de una norma y su metadata
Conclusiones
Open data, open linked data, web semántica es más que una tecnología… es una manera de administrar información
Visualización no es un producto final, es un proceso de realimentación para “purificar” los datos y mejorar la visualización
Crea valor para nosotros mismos 1
Muchos detalles técnicos y desafíos permanecen sin resolver 1
1.- David Robinson and Harlan Yu in “El desafío hacia el gobierno abierto en la hora de la igualdad”, Gastón Concha y Alejandra Naser (eds.), Santiago, CEPAL, 2012
top related