actividad_5.1
TRANSCRIPT
-
5/27/2018 Actividad_5.1
1/15
Gestin de Negocios conBusiness IntelligenceActividad 5
-
5/27/2018 Actividad_5.1
2/15
Introduccin
En el siguiente informe se presenta el anlisis, planificacin e implementacin de un
proyecto de creacin de Data Warehouse (Almacn de Datos o DW), el cual tiene un
plazo mximo de desarrollo de 6 meses.
El contexto de la base de datos a trabajar hace referencia a un grupo de personas las
cuales han sido consultadas en relacin a inseguridad ciudadana en Chile. Las
preguntas estn divididas en distintos tpicos y todos ellos relacionados con la
siguiente interrogante: De qu delito cree usted que ser victima en los prximos
doce meses?.
Para poder analizar y trabajar los datos se ha realizado una planificacin de tareas la
cual es organizada mediante una carta Gantt, la cual contiene el nombre de las tareas a
ejecutar as como tambin los plazos definidos para el desarrollo de estas.
Tambin se presentara, mediante imgenes, algunas etapas del proceso como: modelo
de base de datos, esquema de DW (Esquema Estrella), scripts de carga de datos (ETL
FULL), etc..
La creacin del Data Warehouse tiene como objetivo realizar un esquema del tipo
estrella para maximizar el performance de las consultas. Lo cual nos permitir obtener
informacin confiable y con esto poder tomar buenas decisiones.
-
5/27/2018 Actividad_5.1
3/15
Modelo de Base de Datos OperacionalA partir de la tabla Paciente analizamos los datos y los dividimos en diferentes tablas,
para lo cual realizamos los siguientes modelos que presentamos a continuacin.
En primera instancia realizamos el modelo entidad relacin, en el cual tuvimos que
reconocer sus entidades con sus atributos correspondientes ms sus relaciones entre
s. Como se ve en la imagen a continuacin;
Modelo Entidad Relacin
-
5/27/2018 Actividad_5.1
4/15
Luego de tener nuestro primer modelo concluido y a partir de l mismo, se construy
el Modelo Relacional, estableciendo llaves forneas entre las distintas tablas relacionas
desde el Modelo Entidad Relacin.
Modelo Relacional
-
5/27/2018 Actividad_5.1
5/15
Modelo de Base de datos Esquema Estrella)El esquema utilizado para la base de datos de nuestro Data Warehouse es un esquema
del tipo Estrella, esto con el objetivo de maximizar el performance de las consultas.
Tabla de hechos:
DW_FACT: contiene las relaciones entre las 3 dimensiones (Paciente, instituciny estado). A partir de esta tabla se pueden hacer anlisis de los datos.
Tabla de dimensiones:
DW_PACIENTE: contiene datos personales de un paciente. DW_INSTITUCION: contiene el nombre de la institucin en la cual se ubica el
paciente.
DW_ESTADO: indica el estado actual de paciente tratado.
-
5/27/2018 Actividad_5.1
6/15
Carga inicial de Datos ETL FULL)La carga de datos fue realizada mediante un ETL FULL, que se logro realizando un
BULK de datos desde unos archivos plano de texto en formato .csv.
A continuacin se muestra el proceso de llenado de la tabla DW_PACIENTE.
Datos DW_PACIENTE
Esto corresponde al contenido del archivo DW_PACIENTE.csv con 23 registros.
-
5/27/2018 Actividad_5.1
7/15
Carga DW_PACIENTE
Mediante este script se realiza la limpieza de la tabla DW_PACIENTE_PASO que
corresponde a una tabla de transicin para luego hacer una validacin de los datos
nulos y finalmente insertarlos en la dimensin DW_PACIENTE.
-
5/27/2018 Actividad_5.1
8/15
Resultado DW_PACIENTE
Registros finalmente insertados en la dimensin DW_PACIENTE. Luego de la validacin
de datos Nulos.
-
5/27/2018 Actividad_5.1
9/15
Carga Incrementa de Datos ETL INCREMENTAL)La segunda carga de datos fue realizada mediante un ETL INCREMENTAL, que se logro
realizando un BULK de datos desde un archivos plano de texto en formato .csv.
A continuacin se muestra el proceso de llenado de la tabla DW_PACIENTE.
Datos DW_PACIENTE
Esto corresponde a el contenido del archivo DW_PACIENTE.csv con 31 registros.
-
5/27/2018 Actividad_5.1
10/15
Carga DW_PACIENTE
Mediante este script se realiza la carga de los nuevos registros en DW_PACIENTE_PASO
para luego hacer la validacin de datos o registros nulos y/o finalmente insertarlos en
la dimensin DW_PACIENTE.
-
5/27/2018 Actividad_5.1
11/15
Resultado DW_PACIENTE
Registros finalmente insertados en la dimensin DW_PACIENTE. Luego de la validacin
de datos Nulos y/o repetidos.
-
5/27/2018 Actividad_5.1
12/15
Log de Proceso de CargaLos ETL anteriormente ejecutados (FULL e INCREMENTAL), realizan un INSERT en la
tabla LOG_CARGA, la cual contiene los siguientes datos:
Tras haber realizado la ejecucin de los script anteriormente mencionados, se obtiene
a modo de registro la accin realizada, el tiempo, y la cantidad de registros Cargados
con xito en la tabla DW_PACIENTE, los registros que fueron descartados por tener
campos nulos o estar repetidos y finalmente el Total de registros que fueronmanipulados para proceder a hacer la validacin y posterior insercin.
-
5/27/2018 Actividad_5.1
13/15
CuboMediante Excel se realizo la lectura de la tabla DW_FACT y poder crear una tabla y
grafico dinmico el cual responde la pregunta: Cantidad de Pacientes por institucin.
La Tabla y grafico representan la distribucin de paciente dentro de las distintas
instituciones. A continuacin se listan los nombres de las instituciones junto con su
"id" correspondiente para interpretar la tabla.
-
5/27/2018 Actividad_5.1
14/15
ConclusinTras haber realizado este trabajo podemos concluir que la implementacin de un Data
Warehouse produce un valor agregado a nuestra informacin almacenada e histrica
que tengamos en nuestras bases de datos operacionales, otorgndonos un plus, y
guindonos hacia obtener ventajas competitivas considerables, las que hoy por hoy
son trascendentales en nuestra sociedad y en nuestros negocios, El Data Warehouse
gracias a su filtrado de datos nos permite enfocarnos en un rea en particular del
nuestro negocio y sacarle rendimiento, realizando exhaustivos anlisis de su
comportamiento, a travs de anlisis grficos. La construccin de un Data Warehouse
cumple ese objetivo y nos da la posibilidad de tomar decisiones que nos beneficien.
Por tanto Business intelligence, y particularmente Data Warehouse nos permite
responder interrogantes del tipo: Cuntos hombres fueron encuestados?, Cuntas
personas de la 4ta regin cree que ser asaltada en el prximo ao?, entre otras
interrogantes.
Como podemos aprecias los beneficios son enormes y nos permite poder tomar
buenas decisiones estando mejor informado, gracias a las consultas hechas sobre
nuestro Data Warehouse. Un ejemplo de esto en particular sera tomar la decisin de
aumentar la seguridad en ciertos territorios del pas, a partir de la Data analizada y
obtenida.
-
5/27/2018 Actividad_5.1
15/15
Bibliografa GBI (CUBOS).ppt Script ETL facilitados por el profesor. http://jmendozabi.blogspot.com/2012/12/ssas-crear-cubo-olap-paso-
paso.html
http://www.informatica-hoy.com.ar/telefonos-celulares/Cubo-OLAP-una-base-de-datos-multidimensional.php
http://jmendozabi.blogspot.com/2012/12/ssas-crear-cubo-olap-paso-paso.htmlhttp://jmendozabi.blogspot.com/2012/12/ssas-crear-cubo-olap-paso-paso.htmlhttp://jmendozabi.blogspot.com/2012/12/ssas-crear-cubo-olap-paso-paso.htmlhttp://jmendozabi.blogspot.com/2012/12/ssas-crear-cubo-olap-paso-paso.htmlhttp://jmendozabi.blogspot.com/2012/12/ssas-crear-cubo-olap-paso-paso.htmlhttp://www.informatica-hoy.com.ar/telefonos-celulares/Cubo-OLAP-una-base-de-datos-multidimensional.phphttp://www.informatica-hoy.com.ar/telefonos-celulares/Cubo-OLAP-una-base-de-datos-multidimensional.phphttp://www.informatica-hoy.com.ar/telefonos-celulares/Cubo-OLAP-una-base-de-datos-multidimensional.phphttp://www.informatica-hoy.com.ar/telefonos-celulares/Cubo-OLAP-una-base-de-datos-multidimensional.phphttp://www.informatica-hoy.com.ar/telefonos-celulares/Cubo-OLAP-una-base-de-datos-multidimensional.phphttp://www.informatica-hoy.com.ar/telefonos-celulares/Cubo-OLAP-una-base-de-datos-multidimensional.phphttp://www.informatica-hoy.com.ar/telefonos-celulares/Cubo-OLAP-una-base-de-datos-multidimensional.phphttp://jmendozabi.blogspot.com/2012/12/ssas-crear-cubo-olap-paso-paso.htmlhttp://jmendozabi.blogspot.com/2012/12/ssas-crear-cubo-olap-paso-paso.html