the build of access points to government's datasets based on a multidimensional model

Download The build of access points to Government's Datasets based on a Multidimensional Model

If you can't read please download the document

Upload: fernando-de-assis-rodrigues

Post on 19-Jan-2017

40 views

Category:

Science


0 download

TRANSCRIPT

II Encontro Internacional Dados, Tecnologia e Informao II DTI

A construo de pontos de acessos a conjuntos de dados governamentais baseado em um modelo multidimensional

Fernando de Assis [email protected]

Programa em Ps-Graduao em Cincia da InformaoFaculdade de Filosofia e CinciasMarlia, SP

Introduo

Novo modelo de administrao pblica:Redistribuir competncias e recursos de coordenao:Governamentais e no-governamentais. (MALIN, 2006)

Transparncia de suas atividades perante sociedade civil atravs da participao do cidado da administrao pblica (BOHMAN, 1996)

Comprometimento do Estado em criar ambientes de acesso conjuntos de dados governamentais para acompanhamento de suas aes/atividades (BERTOT et. al., 2010)

Uso de TIC externas gesto para a elaborao de ambientes para interao Estado/Sociedade (SANT'ANA, 2009; RODRIGUES; SANT'ANA, 2012)Aumento da transparncia do Estado (SANT'ANA, 2008; 2009)

Introduo

LegislaoConstituio (BRASIL, 1988)

Lei de Acesso Informao (BRASIL, 2011)Acesso dados:Uso de Internet;

Transparente, claro e de fcil compreenso.

Introduo

Stio com acesso aos dados governamentais de esfera federal:Portal da Transparncia do Governo Federalhttp://www.portaltransparencia.gov.br

Business Intelligence

Iniciativa privada:Transformao conjunto de dados de transaes dirias em informaes para suporte a tomada de deciso.

[] conjunto de teorias, metodologias, mtodos e tecnologias que formam este processo de transformao de dados em informaes para a tomada deciso denominado Business Intelligence (BI). (BARBIERI, 2001; INMON, 1992; KIMBALL, 1996; SAGGION et. al, 2007)

Business Intelligence

Este banco de dados, elaborado para auxiliar o gestor de uma empresa pblica ou privada na tomada de deciso:Data Warehouse (DW)Orientada assuntos;

Integrada;

Varivel no tempo

No voltil

Estruturado com foco especfico para a realizao de consultas, e anlises orientadas uma demanda especfica. (KIMBALL, 1996; INMON, 1992)

Business Intelligence

Cada Data Warehouse possui um ou mais Data Marts:Cada Data Mart formado por tabelas de banco de dados, contendo fatos e dimenses:

O Data Mart representa dados de um nico processo de negcios de uma instituio.Ex: um fato uma venda.

Business Intelligence

Dimenses:Componentes essenciais;

[] contm os atributos descritivos para cada identificador nico (chaves estrangeiras) encontrado na tabela fato. Cada uma dessas chaves estrangeiras deve fazer relao com uma tabela dimenso.

Business Intelligence

Representao do modelo dimensional em Esquema Estrela

Business Intelligence

Uso somente de dados do fato e das dimenses necessrias:Ganho de performance;

Cenrio especfico ao atendimento da demanda pedida;

Antecipao de novas demandas;

Citizen Intelligence

Citizen Intelligence: conjunto de teorias, fontes e mtodos que determinam elementos necessrios na construo de mecanismos para suporte a tomada de deciso dos cidados a partir de dados governamentais. (P2P FOUNDATION, 2011)

Cidado: falta ou deficincia de dados governamentais para futuros questionamentos sobre as aes do Estado:Ex.: Como tomar uma deciso sobre repasses para um municpio se no sei o que foi repassado?

Objetivo

[...] apresentar uma proposta de um modelo multidimensional que permita a criao de diferentes pontos de acesso a um mesmo conjunto de dados governamental na fase de recuperao de dados, a partir do conceito de Data Warehouse, propiciando alternativas para ampliar possibilidades de acesso a uma base de dados existente e a antecipao de demanda estes dados.

Coleta de Dados

Fonte: Recorte dos autores de Controladoria-Geral da Unio (2006)

Coleta de Dados

Fonte: Recorte dos autores de Controladoria-Geral da Unio (2006)

Coleta de Dados

[] apresenta ao cidado dados detalhados e diariamente atualizados sobre os atos praticados pelas unidades gestoras do Poder Executivo Federal no decorrer da execuo das suas despesas. (CONTROLADORIA-GERAL DA UNIO, 2006)

Coleta de Dados

Fonte: Recorte dos autores de Controladoria-Geral da Unio (2006)

Coleta de Dados

Consulta retorna:Um perodo de 1 dia se no selecionado um rgo superior;

Um perodo obrigatoriamente menor que 31 dias se selecionado um rgo superior.

Volume de dados muito grande para retornar de uma s vez:Justificativa: muitos campos, muitos registros...

Paginao

Coleta de Dados

Coleta de Dados

Despesas de um determinado rgo em um perodo anual:12 consultas;Visitando de 15 em 15 registros por pgina para cada consulta:Coletando dados de cada registro individualmente.

Caso queira totalizar o valor repassado para este rgo:Clculo dever ser realizado fora do stio, 'tabulando' os resultados acima em uma planilha, por exemplo.

Resultados

A partir dos atributos identificados:Na recuperao dos dados;

Na pgina com dados apenas de um registro (de uma despesa).

Identificao de atributos que so do Fato Despesa;

Identificao de atributos que podem ser Dimenses.

Resultados

Proposta de um modelo dimensional, em esquema estrela:Fato: Despesa

Dimenses: Data, Esfera, Entidade Vinculada, Favorecido, Tipo de Crdito, Fonte de Recurso, Fase da Despesa, rgo Superior e Unidade Gestora Emitente

Resultados

Fonte: Autores

Resultados

Com isso, os atributos de cada uma das tabelas dimenses podem representar um ponto de partida para a construo de diferentes tipos de consultas de um mesmo fato (as despesas), criando uma percepo temtica nos elementos de origem e destino das despesas, para um pblico especfico (no caso, cidados interessados neste tipo de informao).

Concluses

Construo de um modelo dimensional:Novos pontos de acessos novas consultas, com novas percepes sobre os mesmos dados

Consultas via dimenses

Fonte: Autores

Concluses

Novos novas consultas poderiam aumentar o volume (de dados) na recuperao de dados:Recuperao de dados que so teis unicamente ao contexto do solicitante.Ex.: Retorne data do documento, mas no o rgo vinculado.
Retorne apenas o total (em reais) de todos os registros encontrados na minha consulta.
Retorne apenas a quantidade de registros encontrados na minha consulta.

Concluses

Consulta original apresenta:Quatro filtros

Recuperao de dados em 10 colunas, contendo uma diviso entre pginas de 15 em 15 registros

Fonte: Recorte dos autores de Controladoria-Geral da Unio (2006)

Concluses

Criao de novos pontos de acesso:Preocupaes em no existirem inmeras dimenses pois pode complicar o acesso;

A elaborao de um modelo multidimensional no anula a criao de outros modelos no mesmo Data Mart.

Tentativa de criar um suporte (de dados) para o cidado tomar suas decises (Citizen Intelligence);

Antecipao da demanda pelo dados tentativa de satisfazer futuros questionamentos da sociedade.

Reflexes

Aplicao em outros stios;

Construo de Wireframes;

...

Referncias

ABRCIO, F. L. O impacto do modelo gerencial na Administrao Pblica: um breve estudo sobre a experincia internacional recente. Braslia: Escola Nacional de Administrao Pblica. Cadernos ENAP, n. 10, 1997. Disponvel em: . Acesso em: 17 jul. 2014.BARBIERI, C. BI - Business Intelligence Modelagem & Tecnologia. Rio de Janeiro: Excel Books, 2001. p. 424.BERTOT, J. C.; JAEGER, P. T.; GRIMES, J. M. Using ICTs to create a culture of transparency: E-government and social media as openness and anti-corruption tools for societies. Elsevier. Government Information Quarterly, v. 27, n. 3, abr., 2010. p. 264-271. Disponvel em: . Acesso em: 15 jul. 2014.BOHMAN, J; Public Deliberation, Pluralism, Complexity and Democracy. London: MIT Press, 1996.BRASIL. Constituio da Repblica Federativa do Brasil de 1988. Portal do Planalto, Braslia, DF. Disponvel em: . Acesso em: 20 jun. 2014._______. Lei nmero 11.111, de 05 de maio de 2005. Regulamenta a parte final do disposto no inciso XXXIII do caput do art. 5o da Constituio Federal e d outras providncias. Portal do Planalto, Braslia, DF, 05 mai. 2005. Disponvel em: . Acesso em: 20 jun. 2014.

Referncias

_______. Lei nmero 12.527, de 18 de novembro de 2011. Regula o acesso a informaes previsto no inciso XXXIII do art. 5o, no inciso II do 3o do art. 37 e no 2o do art. 216 da Constituio Federal; altera a Lei no 8.112, de 11 de dezembro de 1990; revoga a Lei no 11.111, de 5 de maio de 2005, e dispositivos da Lei no 8.159, de 8 de janeiro de 1991; e d outras providncias. Portal do Planalto, Braslia, DF, 18 nov. 2011. Disponvel em: . Acesso em: 20 jun. 2014.CONTROLADORIA-GERAL DA UNIO. Portal da Transparncia do Governo Federal. Braslia, 2006. Disponvel em: . Acesso em: 20 jun. 2014.___________________________________. Detalhamento das Despesas Dirias. In: Portal da Transparncia do Governo Federal. Braslia, 2004. Disponvel em: . Acesso em: 20 jun. 2014.___________________________________. Transparncia Ativa: Internet. In: Portal da Transparncia do Governo Federal. Braslia, 2014. Disponvel em: . Acesso em: 19 jul. 2014.DHW Schemas. In: DWH World Online Data Warehouse Source. 2010. Disponivel em: . Acesso em: 20 jun. 2014.FIERRO, A. E.; GIL-GARCIA, J. R. Transparency Websites as Tools for Decision Making in a Democratic Government. In: Transatlantic Conference on Transparency Research. Transatlantic Conference on Transparency Research, Utrecht, Holanda: Utrecht University, 2012. Disponvel em . Acesso em: 20 jun. 2014.

Referncias

INMON, W.H. Building the Data Warehouse. John Wiley & Sons, 1992. 543 p.KIMBALL, R. The Data Warehouse Toolkit. John Wiley & Sons, 1996. 388 p. ISBN 978-0-471-15337-5KIMBALL, R.; ROSS, M. The Data Warehouse Toolkit: The complete guide to Dimensional Modeling. John Wiley & Sons, 2002. 393 p. ISBN 0-471-20024-7MALIN, A. M. B. Gesto da Informao Governamental: em direo a uma metodologia de avaliao. DataGramaZero, v. 7, n. 5, out., 2006. Disponvel em: . Acesso em: 20 jun. 2014.MUSSI, C. Data Warehouse - a experincia da Agncia Nacional de Vigilncia Sanitria do Brasil. In: I Congreso Internacional Online sobre Tecnologas de la Informacin en Ciencias de la Vida (TICvida'2005), 2005, Madrid. I Congreso Internacional Online sobre Tecnologas de la Informacin en Ciencias de la Vida (TICvida'2005), 2005.P2P FOUNDATION. Introduction to Citizen Intelligence Sources and Methods. P2P Foundation, 11 fev. 2011. Disponvel em: . Acesso em: 20 jun. 2014.

Referncias

RODRIGUES F. A. Restries tecnolgicas e de acesso a dados disponveis sobre destinos de repasses financeiros federais para a sade pblica em ambientes informacionais digitais. In: XIII Encontro Nacional de Pesquisa em Cincia da Informao (ENANCIB). XIII Encontro Nacional de Pesquisa em Cincia da Informao, Rio de Janeiro, 2012. ISSN: 978-85-62454-02-8. Disponvel em: . Acesso em: 20 jun. 2014.RODRIGUES, F. A.; SANTANA, R. C. G. Restries tecnolgicas e de acesso a dados disponveis sobre destinos de repasses financeiros federais para a Sade Publica em Ambientes Informacionais Digitais. In: XIII Encontro Nacional de Pesquisa em Cincia da Informao, 13., 2012, Rio de Janeiro/RJ. Anais... Rio de Janeiro: ANCIB, 2012. 19 p.SAGGION, H.; FUNK, A.; MAYNARD, D.; BONTCHEVA, K. Ontology-Based Information Extraction for Business Intelligence. The Semantic Web. Lecture Notes in Computer Science, v. 4825, 2007. p. 843-856. SANT'ANA, R. C. G. Ciclo de Vida dos Dados e o papel da Cincia da Informao. In: XIV Encontro Nacional de Pesquisa em Cincia da Informao, 14., 2013, Florianpolis/SC. Anais... Rio de Janeiro: ANCIB, 2013. 21 p._________________. Mensurao da disponibilizao de informaes e do nvel de interao dos ambientes informacionais digitais da administrao municipal com a sociedade. Tese de Doutorado em Cincia da Informao Universidade Estadual Paulista, Marlia, So Paulo, 2008. 153 p.

Referncias

_________________. Tecnologia e gesto pblica municipal: mensurao da interao com a sociedade. So Paulo: Cultura Acadmica, 2009. 181 p.SENAY, H.; IGNATIUS, E. Rules and Principles of Scientific Data Visualization. ACM SIGGRAPH Education Committee. Association for Computing Machinery, 1999. Disponvel em: . Acesso em: 20 jun. 2014.