the build of access points to government's datasets based on a multidimensional model
TRANSCRIPT
II Encontro Internacional Dados, Tecnologia e Informao II DTI
A construo de pontos de acessos a conjuntos de dados governamentais baseado em um modelo multidimensional
Fernando de Assis [email protected]
Programa em Ps-Graduao em Cincia da InformaoFaculdade de Filosofia e CinciasMarlia, SP
Introduo
Novo modelo de administrao pblica:Redistribuir competncias e recursos de coordenao:Governamentais e no-governamentais. (MALIN, 2006)
Transparncia de suas atividades perante sociedade civil atravs da participao do cidado da administrao pblica (BOHMAN, 1996)
Comprometimento do Estado em criar ambientes de acesso conjuntos de dados governamentais para acompanhamento de suas aes/atividades (BERTOT et. al., 2010)
Uso de TIC externas gesto para a elaborao de ambientes para interao Estado/Sociedade (SANT'ANA, 2009; RODRIGUES; SANT'ANA, 2012)Aumento da transparncia do Estado (SANT'ANA, 2008; 2009)
Introduo
LegislaoConstituio (BRASIL, 1988)
Lei de Acesso Informao (BRASIL, 2011)Acesso dados:Uso de Internet;
Transparente, claro e de fcil compreenso.
Introduo
Stio com acesso aos dados governamentais de esfera federal:Portal da Transparncia do Governo Federalhttp://www.portaltransparencia.gov.br
Business Intelligence
Iniciativa privada:Transformao conjunto de dados de transaes dirias em informaes para suporte a tomada de deciso.
[] conjunto de teorias, metodologias, mtodos e tecnologias que formam este processo de transformao de dados em informaes para a tomada deciso denominado Business Intelligence (BI). (BARBIERI, 2001; INMON, 1992; KIMBALL, 1996; SAGGION et. al, 2007)
Business Intelligence
Este banco de dados, elaborado para auxiliar o gestor de uma empresa pblica ou privada na tomada de deciso:Data Warehouse (DW)Orientada assuntos;
Integrada;
Varivel no tempo
No voltil
Estruturado com foco especfico para a realizao de consultas, e anlises orientadas uma demanda especfica. (KIMBALL, 1996; INMON, 1992)
Business Intelligence
Cada Data Warehouse possui um ou mais Data Marts:Cada Data Mart formado por tabelas de banco de dados, contendo fatos e dimenses:
O Data Mart representa dados de um nico processo de negcios de uma instituio.Ex: um fato uma venda.
Business Intelligence
Dimenses:Componentes essenciais;
[] contm os atributos descritivos para cada identificador nico (chaves estrangeiras) encontrado na tabela fato. Cada uma dessas chaves estrangeiras deve fazer relao com uma tabela dimenso.
Business Intelligence
Representao do modelo dimensional em Esquema Estrela
Business Intelligence
Uso somente de dados do fato e das dimenses necessrias:Ganho de performance;
Cenrio especfico ao atendimento da demanda pedida;
Antecipao de novas demandas;
Citizen Intelligence
Citizen Intelligence: conjunto de teorias, fontes e mtodos que determinam elementos necessrios na construo de mecanismos para suporte a tomada de deciso dos cidados a partir de dados governamentais. (P2P FOUNDATION, 2011)
Cidado: falta ou deficincia de dados governamentais para futuros questionamentos sobre as aes do Estado:Ex.: Como tomar uma deciso sobre repasses para um municpio se no sei o que foi repassado?
Objetivo
[...] apresentar uma proposta de um modelo multidimensional que permita a criao de diferentes pontos de acesso a um mesmo conjunto de dados governamental na fase de recuperao de dados, a partir do conceito de Data Warehouse, propiciando alternativas para ampliar possibilidades de acesso a uma base de dados existente e a antecipao de demanda estes dados.
Coleta de Dados
Fonte: Recorte dos autores de Controladoria-Geral da Unio (2006)
Coleta de Dados
Fonte: Recorte dos autores de Controladoria-Geral da Unio (2006)
Coleta de Dados
[] apresenta ao cidado dados detalhados e diariamente atualizados sobre os atos praticados pelas unidades gestoras do Poder Executivo Federal no decorrer da execuo das suas despesas. (CONTROLADORIA-GERAL DA UNIO, 2006)
Coleta de Dados
Fonte: Recorte dos autores de Controladoria-Geral da Unio (2006)
Coleta de Dados
Consulta retorna:Um perodo de 1 dia se no selecionado um rgo superior;
Um perodo obrigatoriamente menor que 31 dias se selecionado um rgo superior.
Volume de dados muito grande para retornar de uma s vez:Justificativa: muitos campos, muitos registros...
Paginao
Coleta de Dados
Coleta de Dados
Despesas de um determinado rgo em um perodo anual:12 consultas;Visitando de 15 em 15 registros por pgina para cada consulta:Coletando dados de cada registro individualmente.
Caso queira totalizar o valor repassado para este rgo:Clculo dever ser realizado fora do stio, 'tabulando' os resultados acima em uma planilha, por exemplo.
Resultados
A partir dos atributos identificados:Na recuperao dos dados;
Na pgina com dados apenas de um registro (de uma despesa).
Identificao de atributos que so do Fato Despesa;
Identificao de atributos que podem ser Dimenses.
Resultados
Proposta de um modelo dimensional, em esquema estrela:Fato: Despesa
Dimenses: Data, Esfera, Entidade Vinculada, Favorecido, Tipo de Crdito, Fonte de Recurso, Fase da Despesa, rgo Superior e Unidade Gestora Emitente
Resultados
Fonte: Autores
Resultados
Com isso, os atributos de cada uma das tabelas dimenses podem representar um ponto de partida para a construo de diferentes tipos de consultas de um mesmo fato (as despesas), criando uma percepo temtica nos elementos de origem e destino das despesas, para um pblico especfico (no caso, cidados interessados neste tipo de informao).
Concluses
Construo de um modelo dimensional:Novos pontos de acessos novas consultas, com novas percepes sobre os mesmos dados
Consultas via dimenses
Fonte: Autores
Concluses
Novos novas consultas poderiam aumentar o volume (de dados) na
recuperao de dados:Recuperao de dados que so teis unicamente ao
contexto do solicitante.Ex.: Retorne data do documento, mas no o
rgo vinculado.
Retorne apenas o total (em reais) de todos os registros encontrados
na minha consulta.
Retorne apenas a quantidade de registros encontrados na minha
consulta.
Concluses
Consulta original apresenta:Quatro filtros
Recuperao de dados em 10 colunas, contendo uma diviso entre pginas de 15 em 15 registros
Fonte: Recorte dos autores de Controladoria-Geral da Unio (2006)
Concluses
Criao de novos pontos de acesso:Preocupaes em no existirem inmeras dimenses pois pode complicar o acesso;
A elaborao de um modelo multidimensional no anula a criao de outros modelos no mesmo Data Mart.
Tentativa de criar um suporte (de dados) para o cidado tomar suas decises (Citizen Intelligence);
Antecipao da demanda pelo dados tentativa de satisfazer futuros questionamentos da sociedade.
Reflexes
Aplicao em outros stios;
Construo de Wireframes;
...
Referncias
ABRCIO, F. L. O impacto do modelo gerencial na Administrao Pblica: um breve estudo sobre a experincia internacional recente. Braslia: Escola Nacional de Administrao Pblica. Cadernos ENAP, n. 10, 1997. Disponvel em: . Acesso em: 17 jul. 2014.BARBIERI, C. BI - Business Intelligence Modelagem & Tecnologia. Rio de Janeiro: Excel Books, 2001. p. 424.BERTOT, J. C.; JAEGER, P. T.; GRIMES, J. M. Using ICTs to create a culture of transparency: E-government and social media as openness and anti-corruption tools for societies. Elsevier. Government Information Quarterly, v. 27, n. 3, abr., 2010. p. 264-271. Disponvel em: . Acesso em: 15 jul. 2014.BOHMAN, J; Public Deliberation, Pluralism, Complexity and Democracy. London: MIT Press, 1996.BRASIL. Constituio da Repblica Federativa do Brasil de 1988. Portal do Planalto, Braslia, DF. Disponvel em: . Acesso em: 20 jun. 2014._______. Lei nmero 11.111, de 05 de maio de 2005. Regulamenta a parte final do disposto no inciso XXXIII do caput do art. 5o da Constituio Federal e d outras providncias. Portal do Planalto, Braslia, DF, 05 mai. 2005. Disponvel em: . Acesso em: 20 jun. 2014.
Referncias
_______. Lei nmero 12.527, de 18 de novembro de 2011. Regula o acesso a informaes previsto no inciso XXXIII do art. 5o, no inciso II do 3o do art. 37 e no 2o do art. 216 da Constituio Federal; altera a Lei no 8.112, de 11 de dezembro de 1990; revoga a Lei no 11.111, de 5 de maio de 2005, e dispositivos da Lei no 8.159, de 8 de janeiro de 1991; e d outras providncias. Portal do Planalto, Braslia, DF, 18 nov. 2011. Disponvel em: . Acesso em: 20 jun. 2014.CONTROLADORIA-GERAL DA UNIO. Portal da Transparncia do Governo Federal. Braslia, 2006. Disponvel em: . Acesso em: 20 jun. 2014.___________________________________. Detalhamento das Despesas Dirias. In: Portal da Transparncia do Governo Federal. Braslia, 2004. Disponvel em: . Acesso em: 20 jun. 2014.___________________________________. Transparncia Ativa: Internet. In: Portal da Transparncia do Governo Federal. Braslia, 2014. Disponvel em: . Acesso em: 19 jul. 2014.DHW Schemas. In: DWH World Online Data Warehouse Source. 2010. Disponivel em: . Acesso em: 20 jun. 2014.FIERRO, A. E.; GIL-GARCIA, J. R. Transparency Websites as Tools for Decision Making in a Democratic Government. In: Transatlantic Conference on Transparency Research. Transatlantic Conference on Transparency Research, Utrecht, Holanda: Utrecht University, 2012. Disponvel em . Acesso em: 20 jun. 2014.
Referncias
INMON, W.H. Building the Data Warehouse. John Wiley & Sons, 1992. 543 p.KIMBALL, R. The Data Warehouse Toolkit. John Wiley & Sons, 1996. 388 p. ISBN 978-0-471-15337-5KIMBALL, R.; ROSS, M. The Data Warehouse Toolkit: The complete guide to Dimensional Modeling. John Wiley & Sons, 2002. 393 p. ISBN 0-471-20024-7MALIN, A. M. B. Gesto da Informao Governamental: em direo a uma metodologia de avaliao. DataGramaZero, v. 7, n. 5, out., 2006. Disponvel em: . Acesso em: 20 jun. 2014.MUSSI, C. Data Warehouse - a experincia da Agncia Nacional de Vigilncia Sanitria do Brasil. In: I Congreso Internacional Online sobre Tecnologas de la Informacin en Ciencias de la Vida (TICvida'2005), 2005, Madrid. I Congreso Internacional Online sobre Tecnologas de la Informacin en Ciencias de la Vida (TICvida'2005), 2005.P2P FOUNDATION. Introduction to Citizen Intelligence Sources and Methods. P2P Foundation, 11 fev. 2011. Disponvel em: . Acesso em: 20 jun. 2014.
Referncias
RODRIGUES F. A. Restries tecnolgicas e de acesso a dados disponveis sobre destinos de repasses financeiros federais para a sade pblica em ambientes informacionais digitais. In: XIII Encontro Nacional de Pesquisa em Cincia da Informao (ENANCIB). XIII Encontro Nacional de Pesquisa em Cincia da Informao, Rio de Janeiro, 2012. ISSN: 978-85-62454-02-8. Disponvel em: . Acesso em: 20 jun. 2014.RODRIGUES, F. A.; SANTANA, R. C. G. Restries tecnolgicas e de acesso a dados disponveis sobre destinos de repasses financeiros federais para a Sade Publica em Ambientes Informacionais Digitais. In: XIII Encontro Nacional de Pesquisa em Cincia da Informao, 13., 2012, Rio de Janeiro/RJ. Anais... Rio de Janeiro: ANCIB, 2012. 19 p.SAGGION, H.; FUNK, A.; MAYNARD, D.; BONTCHEVA, K. Ontology-Based Information Extraction for Business Intelligence. The Semantic Web. Lecture Notes in Computer Science, v. 4825, 2007. p. 843-856. SANT'ANA, R. C. G. Ciclo de Vida dos Dados e o papel da Cincia da Informao. In: XIV Encontro Nacional de Pesquisa em Cincia da Informao, 14., 2013, Florianpolis/SC. Anais... Rio de Janeiro: ANCIB, 2013. 21 p._________________. Mensurao da disponibilizao de informaes e do nvel de interao dos ambientes informacionais digitais da administrao municipal com a sociedade. Tese de Doutorado em Cincia da Informao Universidade Estadual Paulista, Marlia, So Paulo, 2008. 153 p.
Referncias
_________________. Tecnologia e gesto pblica municipal: mensurao da interao com a sociedade. So Paulo: Cultura Acadmica, 2009. 181 p.SENAY, H.; IGNATIUS, E. Rules and Principles of Scientific Data Visualization. ACM SIGGRAPH Education Committee. Association for Computing Machinery, 1999. Disponvel em: . Acesso em: 20 jun. 2014.