data warehouse e data mart

25
Universidade Federal de Uberlândia - UFU Monte Carmelo Sistemas de Informação Data Warehouse e Data Mart Adelson Pacheco dos Reis Bruno Kamino Yamamoto Lucas Rodriguês da Cunha Raphael Araújo de Faria Monte Carmelo 2012

Upload: adelson-pacheco-dos-reis

Post on 24-Jul-2015

558 views

Category:

Documents


2 download

TRANSCRIPT

Universidade Federal de Uberlândia - UFU Monte Carmelo

Sistemas de Informação

Data Warehouse e Data Mart

Adelson Pacheco dos Reis Bruno Kamino Yamamoto

Lucas Rodriguês da Cunha Raphael Araújo de Faria

Monte Carmelo

2012

Adelson Pacheco dos Reis Bruno Kamino Yamamoto

Lucas Rodriguês da Cunha Raphael Araújo de Faria

Data Warehouse e Data Mart

Monografia apresentada como exigência para obtenção do grau de Bacharelado em Sistemas de Informação da Universidade Federal de Uberlândia - UFU.

Orientador: Daniel Duarte Abdala

Monte Carmelo

2012

RESUMO Desde a década de 1960 ,quando surgíramos primeiros sistemas para auxilio no fluxo dos dados nas organizações, as dificuldades no armazenamento, gerenciamento e transformação desses dados em informações esteve presente como obstáculo em praticamente todas as empresas. De acordo com esse contexto, surge uma ferramenta eficiente para suporte à tomada de decisões organizacionais que é responsável em armazenar e analisar dados, os Data Warehouse. Incorporados a esses sistemas organizacionais, existem outros sistemas menores de nível departamental, chamados Data Marts. Palavras-chave: Data Warehouse, Data Mart, dados.

SUMÁRIO 1 JUSTIFICATIVA ....................................................................................................... 4

2 INTRODUÇÃO ......................................................................................................... 5

3 DEFINIÇÃO .............................................................................................................. 6

3.1 O que é um Data Warehouse............................................................................. 6

3.2 O que é um Data Mart ........................................................................................ 8

4 HISTÓRIA ................................................................................................................ 9

5 ARQUITETURA ...................................................................................................... 12

5.1 Modelo Top-Down ............................................................................................ 12

5.2 Modelo Bottom-up ............................................................................................ 12

5.3 Modelo Híbrido ................................................................................................. 12

5.4 Modelo Federado ............................................................................................. 13

6 PROCESSO DE CRIAÇÃO DE DATA MART ........................................................ 14

7 INFRAESTRUTURA DOS DATA WAREHOUSE ................................................... 15

7.1 Ferramentas ..................................................................................................... 15

7.1.1 OLAP ......................................................................................................... 16

7.1.1.1 ROLAP - Relational On Line Analytical Processing ............................. 16

7.1.1.2 MOLAP - Multidimensional On Line Analytical Processing .................. 16

7.1.1.3 HOLAP - Hybrid On Line Analytical Processing .................................. 16

7.1.2 Data Mining ................................................................................................ 17

7.2 Modelagem Multidimensional ........................................................................... 17

7.3 Metadados ....................................................................................................... 17

8 SEGURANÇA ......................................................................................................... 18

9 PROJETOS DE DATA WAREHOUSE ................................................................... 19

10 CICLO DE VIDA DOS DATA WAREHOUSE ....................................................... 20

11 EXEMPLOS DA UTILIZAÇÃO DOS DATA WAREHOUSE .................................. 21

12 CONCLUSÃO ....................................................................................................... 22

REFERÊNCIAS ......................................................................................................... 23

4

1 JUSTIFICATIVA

Aplicações OLAP (On-line Analytical Processing ), são ferramentas a cada dia

mais úteis no mundo dos negócios, e ,nada melhor para nós, que somos

universitários e iniciantes no mundo de TI, do que desde inicio, ficar inteirados da

vasta gama de áreas da computação, principalmente do ramo dos negócios , área a

qual o curso de Sistemas de Informações tem grande relação.

5

2 INTRODUÇÃO

Frente ao grande número de empresas e a grande concorrência no cenário

mundial atual, qualquer erro na administração, uma informação errada, pode

significar um grande prejuízo, e dependendo do erro, pode resultar na falência de tal

empresa. Nesse contexto surge a Business Intelligence, que em súmula, seria o uso

da tecnologia, aliada aos dados de uma empresa, resultando em gráficos, relatórios

e informações úteis, que auxiliam gestores a tomar decisões difíceis da melhor

maneira.

Os Data Warehouse e Data Marts, são algumas das mais importantes e mais

difundidas dessas ferramentas, que a cada dia se tornam mais comuns nas grandes

empresas. Elas são responsáveis por analisar e comparar dados, revelando

informações que antes passariam despercebidas (como por exemplo, a relação na

venda de fraldas e de cervejas), mas que, se utilizadas corretamente, pode resultar

no sucesso da empresa.

6

3 DEFINIÇÃO

3.1 O que é um Data Warehouse

As empresas modernas, seguindo o ritmo da globalização, têm investido em

sistemas que as auxiliem, no processo de armazenamento, cruzamento de dados,

análise, e obtenção de informação para sobressair funcionalmente em relação às

suas concorrentes. E para isso, elas contam com o uso dos recursos de TI –

sistemas de informação – em diversas aplicações.

Esses sistemas muita das vezes rodam em um banco de dados transacional

(sistema que contém informações detalhadas, que permite às empresas controlarem

seus processos organizacionais). Mas sentiam carência de sistemas que

suportassem e auxiliassem as áreas estratégicas e administrativas das

organizações. Os chamados Data Warehouse foram concebidos com o propósito de

atuar nessas áreas.

Um Data Warehouse (armazém de dados), segundo W. H. Inmon é uma coleção

de dados orientada por assuntos, integrada, variante no tempo e não volátil, que tem

por objetivo dar suporte aos processos de tomada de decisão.

As principais diferenças entre os bancos de dados transacionais e os Data

Warehouse são vistas na tabela a seguir:

Características Banco de Dados Tradicional

Banco de Dados Suporte Decisão

Objetivo Atividades cotidianas Análise de negócio

Uso Operacional Informativo

Processamento OLTP OLAP

Unidade de trabalho

Inclusão, alteração, exclusão

Carga e consulta

Usuários Operadores (Muitas pessoas)

Gerência (poucas pessoas)

7

Dados Operacionais Analíticos

Granularidade Detalhada (baixa) Detalhada e consolidada (alta)

Redundância Não ocorre Pode ocorrer

Manutenção Raramente Constantemente

Estrutura Estática Variável

Atualização Contínua Periódica

Índices Poucos Muitos

Função dos índices Localizar um registro Agilizar consultas

Os DW são a solução para alguns problemas, como:

• A falta de padrão dos dados: os DW têm a função de padronizar dados, já que

cada área da empresa gera um tipo de dado, que precisa ser convertido para um

formato único, evitando assim discrepâncias. Um a decisão tem que ser tomada com

base em dados sólidos, concisos, que sejam confiáveis.

• Facilitar o acesso a informações: em uma empresa, os dados são

armazenados em vários locais, o que torna o seu acesso mais difícil. Nos DW, os

dados são armazenados em um único lugar, ou separados por área, o que resulta

em um acesso mais rápido e mais fácil.

• Eliminar informações repetidas e desnecessárias: no momento da assimilação

dos dados ao DW, o sistema executa uma limpeza em dados repetidos,

desnecessários, os quais poderiam resultar em equívocos.

Os DW ainda possuem quatro características marcantes:

• Variável com o tempo;

• Integrado;

• Orientado por assunto;

• Não volátil.

8

3.2 O que é um Data Mart

Um Data Mart é necessariamente uma parte funcional do Data Warehouse, de

escopo limitado, projetados de acordo com a necessidade de seus usuários e

voltado para um departamento ou área especifica da empresa.

Um DW é um sistema integrado, não volátil, utilizado no processo de tomada de

decisões estratégicas em nível executivo e de gerência de uma organização. O Data

Mart melhora esse processo, pois foca na gerência sumarizada, dados

exemplificativos e não em dados históricos.

No passado, os DM eram desenvolvidos de forma rígida e conseguiam responder

a um número limitado de questões. Hoje, com o necessidade das empresas, esse

método não é mais utilizado, agora eles estão mais flexíveis.

As principais diferenças entre Data Warehouse e Data Mart estão relacionadas

na tabela abaixo:

Data Warehouse Data Mart

Corporativo Departamental

Altamente granular Sumarizado e Agregado

Dados Históricos Dados Recentes

Grandes Volumes de Dados Volumes de Dados Limitados

Versatilidade Especificidade

9

4 HISTÓRIA

Para que se possa compreender melhor a utilização dos Data Warehouse,

devemos voltar a década de 60, quando os computadores passaram a ser uma

ferramenta essencial dentro de uma grande empresa.

As configurações das maquinas daquela época, são hoje motivo de riso pela

baixa capacidade de armazenamento e processamento. Eram capazes de executar

apenas um programa de cada vez, mas para aquela época, isso era algo fantástico,

que realizava o trabalho de vários funcionários.

Os dados inicialmente eram armazenados em fitas magnéticas, que eram de

baixo custo, mas de difícil acesso, que era feito de maneira seqüencial. Se fez

necessário, uma nova forma de armazenar os dados.

Na década de 70, surge uma nova forma de armazenar dados: armazenamento

em disco. Paralelo a isso surge à idéia de “banco de dados”, um local onde se

armazenaria todos os dados de uma empresa, para que depois eles fossem

transformados em informações, que resultariam em alguma vantagem para a

empresa frente a concorrência.

Os anos seguintes foram de grande crescimento da área da computação.

Computadores mais modernos, mais eficientes e consequentemente novos

softwares. Inicialmente esses softwares foram suficientes para atender as

necessidades das empresas nas transações, mas não ajudavam muito no apoio a

decisões. Não que os sistemas não fossem capazes de cumprir tal tarefa, mas como

essa não era a função principal deles, havia muitas falhas, como dados

equivocados, dificuldade de lidar com grandes quantidades de dados.

Surgiram idéias a respeito de sistemas com a finalidade especifica de analisar

dados, e, retornar informações úteis para as decisões que deveriam ser tomadas

nas empresas. Os sistemas empresariais passaram a ser divididos em dois grupos:

Sistemas operacionais (On-line Transaction Processing - OLTP): sistemas que

dão suporte ao dia a dia do negócio da empresa, que mantém a empresa em

funcionamento e são chamados de sistemas de produção;

Sistemas informacionais (On-line Analitycal Processing - OLAP): sistemas que

dão suporte aos processos decisórios da empresa, que irão dar subsídios para as

decisões estratégias da empresa e compreendem os SADs e os SIGs.

10

Ainda na década de 70, Bill Inmom começa a usar o termo Data Warehouse, um

sistema separado do sistema operacional, o qual teria a função de armazenar todos

os dados que eram gerados pelos sistemas operacionais da empresa. Nesse novo

sistema, os dados não seriam alterados, mas armazenados com sua essência fiel e

não poderiam ser modificados, apenas consultados.

Essa tecnologia foi, e ainda é fundamental para o sucesso de grandes marcas,

frente a um mundo globalizado de alta concorrência.

Abaixo, segue uma estrutura com algumas datas do advento dos Data

Warehouse.

• 1960 - General Mills e Dartmouth College , em um projeto de pesquisa

conjunta, desenvolver as dimensões termos e fatos.

• 1970 - ACNielsen e IRI fornecer Data Marts dimensionais para as vendas no

varejo.

• 1970 - Bill Inmon começa a definir e discutir o termo: Data Warehouse

• 1975 - Sperry Univac Introduzir MAPPER (manter, preparar e produzir

relatórios executivos) é uma gestão de dados e sistema de comunicação que inclui

4GL primeiros do mundo. Foi a primeira plataforma projetada especificamente para a

construção de Centros de Informação (um precursor das atuais plataformas

empresariais de Armazenamento de Dados)

• 1983 - Teradata apresenta um sistema de gerenciamento de banco de dados

projetado especificamente para apoio à decisão.

• 1983 - Sperry Corporation Martyn Richard Jones define a abordagem Sperry

Information Center, que embora não sendo um DW verdade no sentido Inmon, que

contém muitas das características das estruturas de DW e processo, tal como

definido anteriormente por Inmon, e mais tarde por Devlin. Usado pela primeira vez

na Inglaterra e País de Gales TSB

• 1984 - Sistemas de Computação Metáfora, fundada por David Liddle e

Massaro Don, lançamentos Sistema de Interpretação de Dados (DIS). DIS era um

pacote de hardware / software e interface gráfica para usuários de negócios para

criar um sistema de gerenciamento de banco de dados e analítica.

• 1988 - Barry Devlin e Paul Murphy publicar o artigo Uma arquitetura para um

negócio e sistema de informação no IBM Systems Journal, onde introduzem o termo

"business warehouse".

• 1990 - Sistemas Red Brick, fundada por Ralph Kimball , introduz Red

11

armazém de tijolo, um sistema de gerenciamento de banco de dados

especificamente para armazenamento de dados.

• 1991 - Soluções de prisma, fundada por Bill Inmon , introduz Prism

Warehouse Manager, software para o desenvolvimento de um data warehouse.

• 1992 - Bill Inmon publica o livro Construindo o Data Warehouse.

• 1995 - O Data Warehousing Institute, uma organização sem fins lucrativos

que promove o armazenamento de dados, é fundada.

• 1996 - Ralph Kimball publica o livro The Data Warehouse Toolkit.

• 2000 - Daniel Linstedt libera o cofre de dados, permitindo em tempo real

auditável, acesso aos Data warehouse .

12

5 ARQUITETURA

Os sistemas OLTP, no geral são feitos seguindo uma base, um molde único, é

usado em vários sistemas. Um DW é feito de maneira diferente, onde cada um é

feito de acordo com as necessidades da empresa.

Embora cada armazém seja feita de uma maneira, existe alguns moldes que são

os mais utilizados. Tais como, Top-Down, Bottom-up, Híbrido e Federado.

5.1 Modelo Top-Down

Modelo proposto por Inmon, o qual se baseia em uma única máquina que possui

um sistema paralelo ao sistema transacional, onde todos os dados que circulam na

empresa são armazenados. Tem como prós, a maximização do processamento e

busca de dados. Como contras, podemos citar o alto investimento em uma máquina

com grande capacidade de armazenamento e processamento.

5.2 Modelo Bottom-up

Modelo proposto por Kimball, que consiste em vários Data Marts, espalhados por

áreas chave da empresa (cada um referente à apenas sua área), e conectados a um

servidor Data Warehouse, ou considera-se como Data Warehouse a união de todos

os Data Marts.

5.3 Modelo Híbrido

Um modelo que consiste em uma mistura dos dois citados anteriormente. Iniciada

por Hackney, esse modelo tende a aproveitar os prós de ambos os modelos

anteriores: a rapidez do Top-down e a praticidade oferecida pelo modelo Bottom-up.

13

5.4 Modelo Federado

O modelo Federado propõe a divisão do Data Warehouse por níveis. Podemos

colocar em um nível, dados de uma determinada área da empresa, como por

exemplo, vendas, em outro, compras, e utilizar um software que faz a conversão de

um armazém para o outro, quando for necessária a análise de todos os dados.

14

6 PROCESSO DE CRIAÇÃO DE DATA MART

As fases de criação e atualização de um Data Warehouse são:

I. Extração;

II. Transformação;

III. Leitura de dados.

A quantidade de sistemas transacionais implicados, suas estruturas de dados, e

quantidade de documentação impactam diretamente no tamanho do Data Mart.

Também influenciam no tamanho do Data Marts, as regras de negócio dos sistemas

transacionais e sua forma de extração.

Em I, é feita a extração, leitura e compreensão dos dados. Esses dados são

copiados para uma staging area para serem utilizados posteriormente. Os dados

armazenados em sistemas diferentes quase não se relacionam, pois as aplicações

dos sistemas que os contém não são integradas. A integração desses sistemas é a

parte mais difícil da construção de um Data Warehouse.

Na fase II é implantada a mudança na estrutura do armazenamento dos dados e

ocorrem alterações como filtragem de dados (verificação de similaridade de dados,

erros de digitação, implementação de formatos padrão). Nesta fase também esta

presente a desnormalização e renormalização (que basicamente é separação de

dados por normas), combinação e auditoria, que contribuem também no tamanho do

Data Mart. A fase III é a utilização real do Sistema, é nesse momento que os dados

são inseridos, atualizados ou implementados. Alterações na fonte dos dados

refletem diretamente na leitura final. A leitura final dos dados é a última parte da fase

III e é nessa parte que os dados são cuidadosamente analisados e com base neles,

são implantadas as soluções de negócio da empresa.

15

7 INFRAESTRUTURA DOS DATA WAREHOUSE

A infraestrutura dos Data Warehouse está restritamente relacionada com a sua

arquitetura e deve suportar um aumento dos dados, consultas complexas e não

previstas, várias integrações e tecnologias distintas. São componentes da

infraestrutura: Treinamento de pessoal, Hardware e Software.

Suas ferramentas, talvez, sejam as que merecem menos atenção. A grande

preocupação é com a integração com diversas plataformas, organização dos dados

e disponibilização de informações. Para isso devem-se considerar algumas

características, tais como:

• O sistema deve facilitar a migração dos dados de uma plataforma para outra,

pois com o passar do tempo, e por questões de custo, pode ser viável trocá-la;

• Deve ser uma combinação da integração de bancos de dados relacionais e

fornecedores diferentes;

• Sua estrutura deve ser capaz de armazenar, processar e analisar enormes

quantidades de dados, por causa do aumento exponencial com o tempo;

• Deve suportar consultas imprevistas e dar respostas rápidas. Para isso,

conta-se com as ferramentas OLAP – responsáveis em gerenciar dados – que

auxiliam no trabalho de associação e visualização das informações;

• Treinamento de equipe em tecnologia Data Warehouse e habilidade na

administração de banco de dados;

• Instalação, configuração e manutenção de uma infra-estrutura de rede e

comunicação.

Como se pode perceber uma boa escolha da infraestrutura para um Data

Warehouse é um passo importante para seu sucesso.

7.1 Ferramentas

Para realizar a analise dos dados e obter as informações desejadas, é necessária

a utilização de ferramentas que irão disponibilizar os relatórios de forma dinâmica e

fornece os tratamentos de analises.

16

Essas ferramentas podem ser: OLAP, Data Mining ou Metadados.

7.1.1 OLAP

A tecnologia OLAP, como já descrita anteriormente, consiste em uma ferramenta

de suporte a decisões. Classifica-se em ROLAP, DOLAP, MOLAP.

7.1.1.1 ROLAP - Relational On Line Analytical Processing

São um conjunto de interface para o usuário e aplicações que dão aos SGBDs

relacionais uma aparência de dimensional.

São um conjunto de ferramentas que enviam solicitações diretamente no servidor

de banco de dados, garantindo um melhor desempenho

7.1.1.2 MOLAP - Multidimensional On Line Analytical Processing

São um conjunto de ferramentas que enviam solicitações diretamente no servidor

de banco de dados, garantindo um melhor desempenho.

7.1.1.3 HOLAP - Hybrid On Line Analytical Processing

É uma mesclar do Rolap e do Molap. Utiliza-se o melhor de cada uma dessas

ferramentas, ou seja, a escalabilidade do Molap e o desempenho do Rolap.

17

7.1.2 Data Mining

Ferramenta criada para o explorar um banco de dados a fim de encontrar

padrões consistentes entre dados.

7.2 Modelagem Multidimensional

Através de uma modelagem multidimensional, consegue-se realizar pesquisas

em mais de uma dimensão e facilita para um melhor entendimento das informações

da base de dados.

7.3 Metadados

Os metadados são basicamente dados que facilitam o entendimento de outros

dados, ou seja, resumos de informativos de uma fonte ou conteúdo. É muito utilizado

na Web Semântica, podendo ser aproveitado como método de pesquisa. A

importância dos metadados nessa área é a facilidade na recuperação de dados de

documentos catalogados. Para isso, deve existir uma ficha que contenha

informações referentes ao assunto que se queria recuperar, chamada ficha de

catálogos. Por exemplo, nome, diretor e atores principais em relação a um filme.

18

8 SEGURANÇA

O DW é projetado para se ter uma maior segurança nos dados, não só nas

analises, mas também para que eles não se percam. Para que isso aconteça,

existem alguns passos propostos por Inmom, para que se tenha um bom nível de

segurança, e evitar problemas.

1) Análise de Dados: Elaborar o modelo de dados para o DW;

2) Dimensionamento: Estimar o volume de dados do DW;

3) Avaliação Técnica: Definição das configurações técnicas;

4)Preparação do Ambiente Técnico: Identificar, tecnicamente, como a

configuração definida será acomodada;

5) Análise das áreas de Interesse: Seleção da área de negócio para ser povoada;

6) Projeto do DW: Projeto físico do banco de dados;

7) Análise do Sistema Fonte: Identificar, nos sistemas existentes, a fonte de

dados para o DW, e efetuar um mapeamento entre eles;

8) Especificações: Definir em especificações de programas de rotinas para carga

dos dados;

9) Programação: Codificação das especificações para as rotinas de carga;

10) Povoamento: Execução das rotinas de carga do DW.

19

9 PROJETOS DE DATA WAREHOUSE

Os Data Warehouse de sucesso não possuem etapas de desenvolvimento, pois

devem ser projetados de acordo com as necessidades das empresas.

Muitas organizações utilizam-se dos métodos de criação de um sistema que

abrange um departamento com carência no fluxo de dados – Data Mart – para que

aos poucos, o sistema seja implantado por completo em todos seus setores.

Outras criam protótipos de pequenas amostras do sistema e disponibilizam

alguns funcionários para fazer testes, quando o projeto do Data Warehouse chega

em um nível de boa aceitação e realizando todas as atividades designadas, ele é

implementado.

Segundo Inmon, é um erro criar métodos de projeto e concepção de Data

Warehouse, pois só é possível saber todos os requisitos necessários a ele, quando o

mesmo estiver em uso.

Outra preocupação que se deve ter no projeto é a adequação ao sistema OLTP.

A modelagem deve ser feita de forma que não haja redundância de dados e que as

transições que causam mudanças no estado do banco de dados sejam feitas no

menor tempo possível. Com isso, as metodologias do projeto devem ser divididas

em várias tabelas, o que torna bem complexo a consulta do usuário final. Dada essa

complexidade não é viável a utilização desse processo.

No mercado, ainda não é encontrado um método funcional de criação de Data

Warehouse. De toda maneira, seu procedimento de criação ainda pende ao

ambiente escolhido.

20

10 CICLO DE VIDA DOS DATA WAREHOUSE

O ciclo de vida começa com um diálogo para determinar o plano de projetos e as

necessidades de negócios.

Quando o plano e as necessidades são alinhados, o projeto e a implementação

podem prosseguir.

Após a fase de implementação e manutenção para detectar mudanças nos

requisitos, caso seja necessário fazer ajustes, retornamos para a fase inicial.

21

11 EXEMPLOS DA UTILIZAÇÃO DOS DATA WAREHOUSE

Abaixo, encontra-se listados alguns exemplos da utilização de DW em empresas,

onde elas obtiveram grande êxito:

• Uma grande rede de varejo americana, encontrou em seu gigantesco armazém

de dados que a venda de fraudas estava relaciona a venda de cerveja. Em geral, os

compradores eram homens, que saíam à noite para comprar fraldas e aproveitavam

para levar algumas latinhas para casa. Os produtos foram postos lado a lado.

Resultado: a venda de fraldas e cervejas disparou.

• O banco Itaú, pioneiro no uso de data warehouse no Brasil, costumava enviar

mais de 1 milhão de malas diretas, para todos os correntistas. No máximo 2% deles

respondiam às promoções. Hoje, o banco tem armazenada toda a movimentação

financeira de seus 3 milhões de clientes nos últimos 18 meses. A análise desses

dados permite que cartas sejam enviadas apenas a quem tem maior chance de

responder. A taxa de retorno subiu para 30%. A conta do correio foi reduzida a um

quinto.

• A Sprint, um dos líderes no mercado americano de telefonia de longa distância,

desenvolveu, com base no seu armazém de dados, um método capaz de prever com

61% de segurança se um consumidor trocaria de companhia telefônica dentro de um

período de dois meses. Com um marketing agressivo, conseguiu evitar a deserção

de 120 000 clientes e uma perda de 35 milhões de dólares em faturamento.

• O governo de Massachusetts, nos Estados Unidos, compilava informações

financeiras imprimindo telas e mais telas de terminais dos computadores de grande

porte. Era preciso seis pessoas só para reunir os relatórios necessários ao

orçamento anual. Com o armazém de dados, informações atualizadas estão

disponíveis on-line para 1 300 usuários. Só em papel, economizam-se 250 000

dólares por ano. Em 1995, pela primeira vez em dez anos, o orçamento estadual foi

assinado antes do início do ano fiscal.

• O Brasil quer a mesma agilidade. O Serpro, órgão responsável pelo

processamento dos dados do governo federal, já investiu 2 milhões no seu projeto

de data warehouse, desenvolvido com a Oracle. Só consolidou 5% de suas

informações, mas já é possível fazer em cinco minutos cruzamentos de dados que

antes demandavam quinze dias de trabalho.

22

12 CONCLUSÃO

Neste trabalho foram abordados os temas Data Warehouse, Data Mart.

As organizações atuais estão sempre procurando vantagens competitivas. E a

solução para estar na frente no mundo dos negócios é informação.

Por isso, as organizações se vêem com a necessidade de organizar e utilizar

bem os dados coletados. Mas como fazer isso em meio a uma montanha de dados?

Como resposta surgiu os Data Warehouse. Uma ferramenta alternativa que auxilia a

busca de informações.

23

REFERÊNCIAS

INMON, William H. The Data Warehouse Budget.

Junior, Arnaldo dos Santos Colinski. Business Intelligence – Sistema de Apoio

Gerencial Data Warehouse. São Paulo: UNIP, 2009.

Teorey, Toby; Lightstone, Sam; Nadeau, Tom. Projeto e Modelagem de Bancos de

Dados. Tradução da Quarta Edição. 2ª Tiragem. Editora Campus/ Elsevier. 2007.

Mussi, Camilo. Data Warehouse – Da modelagem a Implantação.

Data Warehouse from Wikipedia. Disponível em:

<http://en.wikipedia.org/wiki/Data_warehouse>.

Acesso em: 21/06/2012.

Amaral, Glenda Carla Moura. Aquaware: Um Ambiente de Suporte á Qualidade de

Dados em Data Warehouse. Disponível em:

<http://teses2.ufrj.br/Teses/NCE_M/GlendaCarlaMouraAmaral.pdf>.

Acesso em: 25/06/2012.

KIMBALL, R., ROSS, M. Data warehouse toolkit: o guia completo para modelagem

multidimensional. Rio de Janeiro: Campus, 2002. 494 p.

Data Mining , origem Wikipedia. Disponível em:

<http://pt.wikipedia.org/wiki/Data_Mining>,

Acesso em: 25/06/2012.

Gurovitz, Helio. O que cerveja tem a ver com fraldas?

Fileto, Renato. Data Warehouses: Fundamentos, Ferramentas e Tendências Atuais.

Departamento de Informática e Estatística (INE). Universidade Federal de Santa

Catarina (UFSC). 2009.

24

NERI, F. Tecnologia e Projeto de Data Warehouse. Editora Érica, 2004.

INMON, W. H. Building the Data Warehouse, 2a ed., Wiley, 1996.

INMON, William H. Data Mart Does Not Equal Data Warehouse. DMReview.com,

07/2000.

Machado, F. N. R. (2000). Projeto de Data Warehouse: Uma Visão Multidimensional.

Érica, São Paulo.