Capitulo 6Fundamentos de la inteligencia
de : Negocios: Administración de bases de datos e
información.
La jerarquía de datos
Organización de datos en un entorno tradicional de archivos
Archivo de CURSO
Archivo PERSONAL
Base de Datos
CURSOID_Estudiante Curso Fecha Grado
20051231 IS 101 F06 B+20046509 IS 101 F06 C
Archivo
ID_Estudiante Curso Fecha Grado20051231 IS 101 F06 B+Registro
IS 101 (Campo del Curso)Campo
0100 1001 (Letra I en ASCII)Byte
0Bit
Archivo FINANCIERO
Procesamiento tradicional de archivos
Problemas con el entorno tradicional de archivos
Programa de aplicaciones IUsu
arios
A B C
Archivos derivados
Contabilidad y Finanzas
Programa de aplicaciones 2Usu
arios
A B ERecursos Humanos
Programa de aplicaciones 3Usu
arios
A G IVentas y
Marketing
Archivo maestroElementos de datos
de la A a la Z.
Redundancia de datos Dependencia entre los programas y los
datos. Carencia de flexibilidad Seguridad escasa Carencia de compartición y disponibilidad
de datos.
Problemas
Sistemas de administración de bases de datos (DBMS): es el software que permite a una organización centralizar los datos, administrarlos eficientemente y proporcionar, mediante los programas de aplicación, el acceso a los datos almacenados.
Al separar las vistas lógica y física de los datos, el DBMS libera al programador o usuario final de la tarea de comprender donde y como se almacenan realmente los datos.
Enfoque de la base de datos para la administración de datos.
Reduce la redundancia y la inconsistencia de datos al minimizar la cantidad de archivos aislados donde se repiten los mismos datos.
Elimina la dependencia entre los programas y los datos, permitiendo a estos últimos ser autosuficientes.
Acceso y disponibilidad de información aumenta. Costos de del desarrollo y mantenimiento de los
programas se reducen. El DBMS da a la organización la posibilidad de
centralizar la administración de datos, su uso y seguridad.
Como resuelve un DBMS los problemas del entorno de archivos tradicional.
ID_EmpleadoNombre
NSSPuesto
Fecha_ContratacionSueldo_BrutoSueldo_NetoSeguro_Vida
Prestaciones_PensionCuidado_Salud
Sistema de administración de bases de
datos
NombreNSS
Cuidado_Salud
Vista de presentaciones
NombreNSS
Sueldo_BrutoSueldo_Neto
Vista de nomina
DBMS Relacional Tablas de una base de datos relacional
Numero_Proveedor
Nombre_Proveedor Calle_Proveedor Ciudad_Proveedor
Estado_Proveedor
CP_Proveedor
8259 CBM Inc. 74 5th Avenue Dayton OH 45220
8261 B. R. Moduls 1277 Gandolly Street
Cleveland OH 49345
8263 Jackson Composites
8233 Micklin Street
Lexiton KY 56723
8444 Bryant Corporation 4315 Mill Drive Rochester NY 113444
Columnas (atributos, Campos)
Filas (Registros, tuplas)
Numero_Parte
Nombre_Parte Precio_Unitario
Numero_Proveedor
137 Aldaba 22.00 8259
145 Espejo Lateral 12.00 8444
150 Moldura de Puerta 6.00 8263
152 Cerradura 31.00 8259
155 Compresora 54.00 8261
178 Picaporte 10.00 8259
Clave extern
a
Campo Clave(Clave
principal)
Las tablas de una BDR se pueden combinar fácilmente, para entregar los datos requeridos por los usuarios, siempre y cuando compartan un elemento de datos en común.
Se utilizan tres operaciones básicas: Seleccionar crea un subconjunto que consta de todos los
registros de la tabla que cumple los criterios establecidos.
Unir combina tablas relacionadas para dar al usuario más información de la que está disponible de las tablas individuales.
Proyectar Crea un subconjunto que consiste en las columnas de una tabla lo cual permite al usuario crear nuevas tablas que contengan solamente la información que se requiere.
Operaciones de una DBMS Relacional
Son adecuados para información multimedia o gráficos.
Un DBMS OO almacena los datos y los procedimientos que realizan operaciones sobre estos datos como objetos que se pueden recuperar y compartir de manera automática.
DBMS Orientado a Objetos
Definición de datos Para especificar la estructura del contenido de la BD.
Diccionario de datos archivo automatizado o manual que almacena definiciones de elementos de datos y sus características.
Lenguaje de manipulación de datos Sintaxis de las consultas que se realizan a las tablas. (SQL)
Capacidades de los sistemas de administración de bases de datos.
Diseño: Conceptual o Lógico
◦ Normalización◦ Diagramas de Entidad-Relación
Físico◦ Distribución de la base de datos.
Diseño de la base de datos.
INTELIGENCIA DE NEGOCIOS
Business Intelligence
Algo peor que no tener información disponible es tener mucha información
Y no saber qué hacer con ella.
Niveles en el uso de los Datos
Sistemas de Información
BD
operaciones repetitivas
captura datos básicos
tareas predefinidas
actividades y transacciones
elementales de BD
Análisis, seguimiento y control
Toma de decisionesConsulta datos históricos
Planificación a largo plazoPlanificación
administrativaPlanificación empresarial
Mira el futuro
Tra
nsa
ccion
al
An
alítico
Las estructuras de datos son complejas.
Los sistemas son diseñados para una alto rendimiento de funcionamiento y procesamiento.
La data está dispersa. Pueden no ajustarse a consultas
complejas.
Sistemas Operacionales
OLTP (OnLine Transaction Processing) es el Procesamiento de Transacciones En Línea es un tipo de software que administran aplicaciones transaccionales, usualmente para entrada de datos y recuperación y procesamiento de transacciones.
La tecnología OLTP se utiliza en aplicaciones, como banca electrónica, procesamiento de pedidos, comercio electrónico, supermercados, industria, etc.
OLAP (On-Line Analytical Processing) es Procesamiento Analítico en Línea.
Es rápido para entregar consultas complejas.
Utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de Sistemas OLTP.
Una BD relacional almacena entidades en tablas discretas han sido normalizadas.
Un BD dimensional almacena los datos en cubos olap donde se encuentran calculados y agregados para ser consultados
Sistemas Analíticos
OLPT OLAP
Objetivos OperacionalesInformación para la toma de decisiones
Orientación A la aplicación Al sujeto
Vigencia de los datos Actual Actual + histórico
Granularidad de los datos Detallada Detallada + resumida
Organización Organización normalizada
Organización estructurada en función del análisis a realizar
Cambios en los datos Continuos Estable
Sistemas Operacionales Vs Analíticos
Niveles en el uso de los Datos
Sistemas de Información
BD
operaciones repetitivas
captura datos básicos
tareas predefinidas
actividades y transacciones
elementales de BD
Análisis, seguimiento y control
Toma de decisionesConsulta datos históricos
Planificación a largo plazoPlanificación
administrativaPlanificación empresarial
Mira el futuro
Tra
nsa
ccion
al
An
alítico
La Inteligencia de Negocios o Business Intelligence (BI) se puede definir como el proceso de analizar los bienes o datos acumulados en la empresa y extraer una cierta inteligencia o conocimiento de ellos. Dentro de la categoría de bienes se incluyen:◦ Bases de datos de clientes◦ Información de la cadena de suministro◦ Ventas personales◦ Actividad de marketing◦ Información relevante para la empresa
Que es Inteligencia de Negocios?
• Convertir grandes volúmenes de datos en un valor para el negocio a través de los reportes analíticos.
• Generar información para el control de los procesos del negocio, independientemente de la fuente de datos.
• Soportar la toma de decisiones.
• Diferenciar la información útil para los usuarios finales.
• Uniformizar los conocimientos usados en la institución. Independientemente del origen de los datos o de la forma de extracción, transformación y agregación.
Finalidad
Inteligencia de Negocios
Escenarios, Pronósticos Reportes
Tomar decisionesLograr Ventaja competitiva
Inteligencia de Negocios
EJEMPLO… Una franquicia de hoteles a nivel
nacional que utiliza aplicaciones de BI para llevar un registro estadístico del porcentaje promedio de ocupación del hotel, así como los días promedio de estancia de cada huésped, considerando las diferencias entre temporadas.
¿De que sirve?
Inteligencia de NegociosPlazo Uso Técnica Tecnología Tecnología Conocimient
o
Corto Plazo
Gestión de datosObtención y control
Sistemas de procesamiento
OLTPOn-Line Transaction Processing
Datos
Operativo
Mediano Plazo
Decisiones tácticas
Data Warehouse
OLAPOn-Line Analytical Processing
Información
Toma de Decisiones
Largo Plazo
Estratégico, Pronóstico
Minería de Datos
AgrupamientoClasificaciónSecuenciaciónReglas de asociación
Patrones
Nuevos Conocimientos
Inteligencia de Negocios
Datos, Información y Conocimiento del Negocio.
Evolución
Etapa Pregunta del Negocio Tecnología disponible
Proveedores Características
Data Collection
(1960)
¿Cuál fue el total de ventas en Lima y en
Arequipa?
Computadoras, cintas, discos
IBM, NCR, etc Retrospectivo
Estático
Data Access (1980)
¿Cuáles fueron las ventas por sucursal en Lima y en Arequipa?
RDBMS SQL Oracle, Informix,
Sybase, etc Retrospectivo
binámico
Data Navigation
(1990)
¿Cuál fue el total de ventas en Lima?, Drill
DownOLAP DW
Pilot, Discoverer, Arbor,etc
Retrospectivo Dinámico Niveles
múltiples
Data Mining (2000)
¿Cómo evolucionarán las ventas en el próximo año?
Algoritmos avanzados,
Multiprocesadores
Intelligent Miner (IBM), SAS, etc
Prospectivo, Proactivo
Tecnología
Scenario4Thought
BusinessMiner
Mining toolsMining tools ETCL toolsETCL tools
DatabasesDatabases OLAP toolsOLAP tools
Inteligencia de Negocios
• Componentes de Business Intelligence
Todas las soluciones de BI tienen funciones parecidas, pero deben de reunir al menos los siguientes componentes:
Multidimensionalidad Data Mining Agentes Data Warehouse
Inteligencia de Negocios
Multidimensionalidad: la información multidimensional se puede encontrar en hojas de cálculo, bases de datos, etc.
Por ejemplo, un pronóstico de ventas de un nuevo producto en varias regiones no está completo si no se toma en cuenta también el comportamiento histórico de las ventas de cada región y la forma en que la introducción de nuevos productos se ha desarrollado en cada región en cuestión.
Inteligencia de Negocios• Data Mining.- Las empresas suelen generar grandes
cantidades de información sobre sus procesos productivos, desempeño operacional, mercados y clientes.
• Técnica para la extracción de patrones y reglas desde los datos, ayuda a crear nuevos modelos no percibidos por el analista hasta ese momento pero que realmente existen en los datos
• Las aplicaciones de data mining pueden identificar tendencias y comportamientos, no sólo para extraer información, sino también para descubrir las relaciones en bases de datos que pueden identificar comportamientos que no son muy evidentes.
Inteligencia de Negocios
• Agentes: Los agentes son programas que piensan. Ellos pueden realizar tareas a un nivel muy básico sin necesidad de intervención humana.
• Por ejemplo, un agente pueden realizar tares un poco complejas, como elaborar documentos, establecer diagramas de flujo, etc.
Inteligencia de Negocios
• Data Warehouse: Es la respuesta de la tecnología de información a la descentralización en la toma de decisiones.
• Estructuras multidimensionales que almacenan información calculada previamente de todas las combinaciones posibles
Coloca información de todas las áreas funcionales de la organización en manos de quien toma las decisiones. También proporciona herramientas para búsqueda y análisis.
Orientado a un Tema◦ Colección de información relacionada organizada
alrededor de un tema central Integrado
◦ Datos de múltiples orígenes; consistencia de datos Variable en el tiempo
◦ ‘Fotos’ en el tiempo◦ Basado en fechas/periodos
No-volátil◦ Sólo lectura para usuarios finales
Menos frecuencia de cambios/actualizaciones◦ Usado para el Soporte a Decisiones y Análisis de
Negocio
¿Qué es un Data Warehouse?
Los usuarios piensan en términos de ‘cosas’ y sus ‘relaciones’, no en términos de procesos, funciones o aplicaciones.
Orientado a Tema
Proveedor
Orden deCompra
Pedido Cliente
Producto Inventario
Proporciona
Compuesta por
Recuperado desde
Contiene
Realiza
Contiene◦ Convenciones de Nombres◦ Descripciones◦ Atributos físicos de los datos◦ Valores de los datos
Consistentes
Integrado
Datos
Ventas
MarketingAdmin.
Cuentas
Operaciones
Id de clientefecha desdefecha hastanombredirección teléfonoratio de crédito
Data Warehouse Datos en ‘fotos’ Horizonte de 5 – 10 años Refleja la perspectiva desde
un momento en el tiempo
Entorno Operacional◦ Datos con valores actuales◦ Horizonte de 30 - 90 días◦ Exactitud en los accesos
Variable en el tiempo
Id de clientenombredirecciónteléfonoratio de crédito
No-Volátil
cambioinserción
borrado
carga
lectura
Sistema OLTP (dinámico)
Sistema DSS
(más estático)
… un modelo de datos de soporte a decisiones que representa la información que una compañía necesita para tomar BUENAS decisiones estratégicas.
… basado en la estructura de un sistema de gestión de base de datos relacional el cual puede ser usado para INTER-RELACIONAR los datos contenidos en él.
… con el propósito de proporcionar a los usuarios finales un acceso SENCILLO a la información.
Un Data Warehouse es ...
… un CONCEPTO, no una COSA
Para tener un mayor conocimiento del negocio
Para tomar mejores decisiones y en un tiempo menor
Para mejorar y ser más efectivos Para no perder distancia con la competencia … en definitiva … $$$$
¿Para qué construir un Warehouse?
Solución integrada de: Consultas, informes y análisis. Capa semántica que da una representación de los datos
desde el punto de vista de negocio. Los usuarios utilizan términos de negocio, no términos
informáticos.
Visión del Usuario
Usuarios Finales
Base de Datos
Representación de Negocio
Panel de Consulta
Data Warehouse “Total”
Extract: CO BO L, SQ L, Etc.Life
Information System
HealthInformation System
AutoInformation System
Life
Health
Auto
LifeOLAP
MDD Tools
HealthR/OLAP
Star Schema
AutoSQL Query
Extract: CO BO L, SQ L, Etc.
Extract: CO BO L, SQ L, Etc.
EnterpriseData
W arehouse
Data Marts No Estructurados
Extract: CO BO L, SQ L, Etc.Life
Information System
HealthInformation System
AutoInformation System
Life
Health
Auto
LifeDataM art
HealthDataM art
AutoDataM art
LifeOLAP
MDD Tools
HealthR/OLAP
Star Schema
AutoSQL Query
Extract: CO BO L, SQ L, Etc.
Extract: CO BO L, SQ L, Etc.
Data Marts Estructurados
LifeO LT P
HealthO LT P
AutoO LT P
LifeOLAP
MDD Tools
HealthR/OLAP
Star Schema
AutoSQL Query
EnterpriseData
W arehouse
"Custom er"
EXT RACTSELECT
T RANSFO RMINT EG RAT E
LO AD
Cleanse Datafor:
Nam esForm atsValues
Dom ainsM etadata
L ifeDataM art
HealthDataM art
AutoDataM art
Ejemplo uso de una herramienta de consulta
El interfaz de usuario simpleTrabaja contra representación de negocio de los
datosTodos los componentes en una pantalla
Información solicitada
Condiciones
Información disponible
Los informes son la capa visible …
• Integración Datos no sólo en entornos analíticos• Importancia de la Calidad
Extracción
Limpieza de Datos
Servidores
Red
Herramientas de OLAP / Business Intelligence / Cuadro de Mando
Transformación
Carga de Datos
Bases de Datos
Middleware
• Twentieth Century Fox utiliza BI para predecir qué actores, argumentos y filmes serán populares en cada vecindario. Evitando ciertos argumentos en cines específicos, la compañía tiene ahorros de aproximadamente $100 Millones de dólares alrededor del mundo cada año. Esa misma tecnología utilizan para seleccionar los "traliers" alternativos para cada película en cada cine y así maximizar las ventas. Una película puede tener varios "trailers" diferentes, cada cual puede percibirse de diferente forma por cada tipo de audiencias.
Ejemplos del mundo real de aplicación de Business Intelligence
• El ambiente del mundo de los negocios de hoy exige una aplicación cada vez más eficiente de la información disponible. BI como su nombre en inglés lo indica, genera un conocimiento al negocio, que se deriva de la correcta utilización de la información generada dentro y fuera de la empresa.
• BI es una herramienta que pone a disposición de los usuarios la información correcta en el lugar correcto. Son múltiples los beneficios que ofrece a las empresas, entre ellos se encuentra la generación de una ventaja competitiva.
Conclusiones
• Hay una gran variedad de soluciones de BI que en suma, son muy similares, pero para que se considere completa debe reunir cuatro componentes: multidimensionalidad, data mining, agentes y data warehouse.
• Son ya muchas las empresas que han implementado soluciones de BI y se han visto enormemente beneficiadas, la próxima puede ser la suya.
• La mejor forma de resumir todo lo anterior es por medio de la frase de Bill Gates, "BI ayuda a rastrear lo que en realidad funciona y lo que no"