bi conceptos
TRANSCRIPT
INTELIGENCIA DE NEGOCIOS
Conocido como BI (Business Intelligence)
DEFINICION
Conjunto de estrategias, tecnologías, técnicas, y herramientas que permiten incrementar la
calidad de la organización, hacerla mas competitiva, y permitirle al grupo de analistas tomar
mejores decisiones. La toma de decisiones permitirá realizar predicciones, y analizar tendencias
frente al comportamiento de la información y el nuevo conocimiento adquirido.
TECNICAS DE BI
Orientada a obtener información
El procesamiento analítico en Línea OLAP, es el proceso que permite analizar las Bases de Datos
(DataWareHouse), y mostrar la información en forma multidimensional (CUBOS). OLAP esta
orientado a las Bases de Datos analíticas, no a las Bases de Datos transaccionales.
En las Bases de Datos Transaccionales se realizan las operaciones comunes de Inserción,
Modificación, eliminado, y consulta de Datos. Las Bases de Datos operacionales igualmente
sirven como fuente u origen de Datos para las Bases de Datos Analíticas (Bodegas de Datos).
Orientada a obtener conocimiento
La minería de Datos (Data Mining), es el conjunto de herramientas (técnicas algorítmicas), que
permiten ir mas allá de la obtención de Información. La suma de experiencias y factores, al igual
que la inteligencia artificial, hacen de la Minería de Datos la técnica perfecta para alcanzar el
conocimiento.
Las técnicas de Minería de Datos permiten relacionar variables, agrupar datos, clasificarlos y
mostrarlos en forma de modelos, los cuales son interpretados y visualizados para dar respuesta a
una colección de preguntas formuladas por el usuario cliente (gerencia de la organización).
ETAPAS DE BI
a. Extracción de los datos
Son las fuentes u orígenes de Datos, los cuales se encuentran en las Bases de Datos
transaccionales en diferentes formatos, como son Excel, archivos planos, o en sistemas
gestores de Bases de Datos como SQL Server, ORACLE, DB2, Informix, Paradox, MsAccess,
MySQL, entre otros.
b. Consolidación de la información
Consiste en agrupar, o integrar todos los datos de los diferentes orígenes en un solo
repositorio llamado Bodega de Datos, o Almacén de Datos (Data WareHouse).
NOTA 1 : Existe una etapa intermedia entre Extraer y consolidar los datos, esta se conoce
como Migración (ETL). Esto significa Extracción, Transformación, y Carga de Datos desde
el origen al destino.
En la extracción se seleccionan los datos desde las bases de datos transaccionales, luego
se garantiza que sean simétricos con los datos del destino (Bodega de Datos), esto se
garantiza verificando tipos de datos y longitudes. Igualmente la estructura origen y
destino debe ser simétrica en numero de campos o atributos.
c. Explotación de la información
Durante la explotación de la información se busca aplicar las técnicas OLAP y Minería con
el fin de obtener información y conocimiento. Este proceso se lleva a cabo en la Bodega
de Datos o Almacén de Datos, pues es allí donde se encuentra consolidado todo lo
proveniente de los diferentes orígenes.
d. Visualización
Luego de obtener los modelos a partir de las técnicas aplicadas, se deben interpretar; esta
tarea es propia del analista de información. Los modelos se dan en términos estadísticos
(gráficos y Datos). Cuando se aplican técnicas de Minería, los resultados son mas
estructurados (Datos relacionados, agrupados, clasificados).
ALMACEN DE DATOS
Es una base de datos robusta, con mucha capacidad de almacenamiento. Se caracteriza por ser
histórica, crece en el tiempo, sus datos permanecen. Por lo general una Bodega de Datos es
organizacional, es decir apunta a toda la empresa.
Existen Bodegas de Datos mas pequeñas las cuales apuntan a un sector especifico de la
organización (una dependencia por ejemplo).
Estas bodegas se conocen como DATAMART, y sigue la misma estructura de una Bodega de Datos
pero a un tamaño menor (capacitad de almacenamiento).
MODELO ESTRELLA
La estructura de una Bodega de Datos esta conformada por una tabla central llamada HECHOS, y
múltiples tablas que rodean los HECHOS denominadas Dimensiones. El número de Dimensiones
depende del problema, o del análisis que se quiere realizar.
Los atributos de las dimensiones, se conocen como atributos de dimensión. Es importante que el
modelo estrella tenga una Dimensión tiempo, ya que esta permite controlar el intervalo o rango
de tiempo desde el que se plantea el análisis. Igualmente permite realizar comparativos o trazar
un paralelo a partir de las variables.
La tabla de Hechos esta conformada por un identificador principal, y los atributos foráneos (en
este caso las claves primarias de las Dimensiones).
Igualmente lo componen los atributos de medida, denominados métricas, estos son de tipo
numérico, y determinan los totales que se quieren calcular y posteriormente analizar frente al
problema.
Dependiendo del alcance o complejidad del análisis, se establecen los atributos para la tabla
tiempo, es decir la tabla puede tener un solo atributo o múltiples atributos como son (ano, mes,
semana, día, hora, minutos).
Cada Dimensión tiene un atributo principal, identificador, que sirve como campo de relación con la
tabla de HECHOS (las claves foráneas que apuntan a la tabla de HECHOS).
NOTA 2: Las etapas más costosas durante el proceso de obtención de conocimiento son la
Extracción (incluyendo la migración de los datos), la explotación (al no tener claro que técnica
aplicar), y la interpretación de los modelos.