bi conceptos

3
INTELIGENCIA DE NEGOCIOS Conocido como BI (Business Intelligence) DEFINICION Conjunto de estrategias, tecnologías, técnicas, y herramientas que permiten incrementar la calidad de la organización, hacerla mas competitiva, y permitirle al grupo de analistas tomar mejores decisiones. La toma de decisiones permitirá realizar predicciones, y analizar tendencias frente al comportamiento de la información y el nuevo conocimiento adquirido. TECNICAS DE BI Orientada a obtener información El procesamiento analítico en Línea OLAP, es el proceso que permite analizar las Bases de Datos (DataWareHouse), y mostrar la información en forma multidimensional (CUBOS). OLAP esta orientado a las Bases de Datos analíticas, no a las Bases de Datos transaccionales. En las Bases de Datos Transaccionales se realizan las operaciones comunes de Inserción, Modificación, eliminado, y consulta de Datos. Las Bases de Datos operacionales igualmente sirven como fuente u origen de Datos para las Bases de Datos Analíticas (Bodegas de Datos). Orientada a obtener conocimiento La minería de Datos (Data Mining), es el conjunto de herramientas (técnicas algorítmicas), que permiten ir mas allá de la obtención de Información. La suma de experiencias y factores, al igual que la inteligencia artificial, hacen de la Minería de Datos la técnica perfecta para alcanzar el conocimiento. Las técnicas de Minería de Datos permiten relacionar variables, agrupar datos, clasificarlos y mostrarlos en forma de modelos, los cuales son interpretados y visualizados para dar respuesta a una colección de preguntas formuladas por el usuario cliente (gerencia de la organización). ETAPAS DE BI a. Extracción de los datos Son las fuentes u orígenes de Datos, los cuales se encuentran en las Bases de Datos transaccionales en diferentes formatos, como son Excel, archivos planos, o en sistemas gestores de Bases de Datos como SQL Server, ORACLE, DB2, Informix, Paradox, MsAccess, MySQL, entre otros. b. Consolidación de la información

Upload: juan-esteban-puerta-cano

Post on 10-Jul-2015

93 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Bi conceptos

INTELIGENCIA DE NEGOCIOS

Conocido como BI (Business Intelligence)

DEFINICION

Conjunto de estrategias, tecnologías, técnicas, y herramientas que permiten incrementar la

calidad de la organización, hacerla mas competitiva, y permitirle al grupo de analistas tomar

mejores decisiones. La toma de decisiones permitirá realizar predicciones, y analizar tendencias

frente al comportamiento de la información y el nuevo conocimiento adquirido.

TECNICAS DE BI

Orientada a obtener información

El procesamiento analítico en Línea OLAP, es el proceso que permite analizar las Bases de Datos

(DataWareHouse), y mostrar la información en forma multidimensional (CUBOS). OLAP esta

orientado a las Bases de Datos analíticas, no a las Bases de Datos transaccionales.

En las Bases de Datos Transaccionales se realizan las operaciones comunes de Inserción,

Modificación, eliminado, y consulta de Datos. Las Bases de Datos operacionales igualmente

sirven como fuente u origen de Datos para las Bases de Datos Analíticas (Bodegas de Datos).

Orientada a obtener conocimiento

La minería de Datos (Data Mining), es el conjunto de herramientas (técnicas algorítmicas), que

permiten ir mas allá de la obtención de Información. La suma de experiencias y factores, al igual

que la inteligencia artificial, hacen de la Minería de Datos la técnica perfecta para alcanzar el

conocimiento.

Las técnicas de Minería de Datos permiten relacionar variables, agrupar datos, clasificarlos y

mostrarlos en forma de modelos, los cuales son interpretados y visualizados para dar respuesta a

una colección de preguntas formuladas por el usuario cliente (gerencia de la organización).

ETAPAS DE BI

a. Extracción de los datos

Son las fuentes u orígenes de Datos, los cuales se encuentran en las Bases de Datos

transaccionales en diferentes formatos, como son Excel, archivos planos, o en sistemas

gestores de Bases de Datos como SQL Server, ORACLE, DB2, Informix, Paradox, MsAccess,

MySQL, entre otros.

b. Consolidación de la información

Page 2: Bi conceptos

Consiste en agrupar, o integrar todos los datos de los diferentes orígenes en un solo

repositorio llamado Bodega de Datos, o Almacén de Datos (Data WareHouse).

NOTA 1 : Existe una etapa intermedia entre Extraer y consolidar los datos, esta se conoce

como Migración (ETL). Esto significa Extracción, Transformación, y Carga de Datos desde

el origen al destino.

En la extracción se seleccionan los datos desde las bases de datos transaccionales, luego

se garantiza que sean simétricos con los datos del destino (Bodega de Datos), esto se

garantiza verificando tipos de datos y longitudes. Igualmente la estructura origen y

destino debe ser simétrica en numero de campos o atributos.

c. Explotación de la información

Durante la explotación de la información se busca aplicar las técnicas OLAP y Minería con

el fin de obtener información y conocimiento. Este proceso se lleva a cabo en la Bodega

de Datos o Almacén de Datos, pues es allí donde se encuentra consolidado todo lo

proveniente de los diferentes orígenes.

d. Visualización

Luego de obtener los modelos a partir de las técnicas aplicadas, se deben interpretar; esta

tarea es propia del analista de información. Los modelos se dan en términos estadísticos

(gráficos y Datos). Cuando se aplican técnicas de Minería, los resultados son mas

estructurados (Datos relacionados, agrupados, clasificados).

ALMACEN DE DATOS

Es una base de datos robusta, con mucha capacidad de almacenamiento. Se caracteriza por ser

histórica, crece en el tiempo, sus datos permanecen. Por lo general una Bodega de Datos es

organizacional, es decir apunta a toda la empresa.

Existen Bodegas de Datos mas pequeñas las cuales apuntan a un sector especifico de la

organización (una dependencia por ejemplo).

Estas bodegas se conocen como DATAMART, y sigue la misma estructura de una Bodega de Datos

pero a un tamaño menor (capacitad de almacenamiento).

MODELO ESTRELLA

La estructura de una Bodega de Datos esta conformada por una tabla central llamada HECHOS, y

múltiples tablas que rodean los HECHOS denominadas Dimensiones. El número de Dimensiones

depende del problema, o del análisis que se quiere realizar.

Page 3: Bi conceptos

Los atributos de las dimensiones, se conocen como atributos de dimensión. Es importante que el

modelo estrella tenga una Dimensión tiempo, ya que esta permite controlar el intervalo o rango

de tiempo desde el que se plantea el análisis. Igualmente permite realizar comparativos o trazar

un paralelo a partir de las variables.

La tabla de Hechos esta conformada por un identificador principal, y los atributos foráneos (en

este caso las claves primarias de las Dimensiones).

Igualmente lo componen los atributos de medida, denominados métricas, estos son de tipo

numérico, y determinan los totales que se quieren calcular y posteriormente analizar frente al

problema.

Dependiendo del alcance o complejidad del análisis, se establecen los atributos para la tabla

tiempo, es decir la tabla puede tener un solo atributo o múltiples atributos como son (ano, mes,

semana, día, hora, minutos).

Cada Dimensión tiene un atributo principal, identificador, que sirve como campo de relación con la

tabla de HECHOS (las claves foráneas que apuntan a la tabla de HECHOS).

NOTA 2: Las etapas más costosas durante el proceso de obtención de conocimiento son la

Extracción (incluyendo la migración de los datos), la explotación (al no tener claro que técnica

aplicar), y la interpretación de los modelos.