unidad 1 inteligencia de negocios

18
ÍNDICE GENERAL 1. UNIDAD1: INTRODUCCIÓN A LA INTELIGENCIA DE NEGOCIOS. 1.1 Tipos de sistemas de información. 1.1.1 Sistemas OLTP. 1.1.2 Sistemas OLAP. 1.2 Inteligencia de Negocios. 1.2.1 Definición. 1.2.2 Importancia. 1.2.3 Componentes de la inteligencia de negocios. 1.2.3.1 Aplicaciones Analíticas. 1.2.3.2 Sistemas de reportes. 1.2.3.3 Bases de Datos Multidimensionales y Data Warehouse. 1.2.3.4 Data Mining. 1.2.3.5 Administración del Conocimiento. 1.3 Principales herramientas de la Inteligencia de Negocios.

Upload: gloria-morales

Post on 19-Jul-2016

65 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Unidad 1 Inteligencia de Negocios

ÍNDICE GENERAL

1. UNIDAD1: INTRODUCCIÓN A LA INTELIGENCIA DE NEGOCIOS.

1.1 Tipos de sistemas de información.

1.1.1 Sistemas OLTP.

1.1.2 Sistemas OLAP.

1.2 Inteligencia de Negocios.

1.2.1 Definición.

1.2.2 Importancia.

1.2.3 Componentes de la inteligencia de negocios.

1.2.3.1 Aplicaciones Analíticas.

1.2.3.2 Sistemas de reportes.

1.2.3.3 Bases de Datos Multidimensionales y Data Warehouse.

1.2.3.4 Data Mining.

1.2.3.5 Administración del Conocimiento.

1.3 Principales herramientas de la Inteligencia de Negocios.

Page 2: Unidad 1 Inteligencia de Negocios

Capítulo 1.

Unidad1: Introducción a la Inteligencia de Negocios.

Competencia específica a desarrollar

Identificar los conceptos básicos, herramientas y componentes de la inteligencia de

negocios.

La Inteligencia de Negocios (Business Intelligence) se ha visto marcada por una clara

evolución que lo destaca como un mercado maduro en los últimos años.

La inteligencia de negocios es la habilidad para transformar los datos en información, y la

información en conocimiento, de forma que se pueda optimizar el proceso de toma de

decisiones en los negocios.

Se ha producido un fortalecimiento mediante la compra de empresas pequeñas por

parte de los principales agentes del mercado (SAP, IBM, Microsoft).

Se ha enriquecido con soluciones open source que cubren la gama de necesidades

de una organización para la explotación de la información.

Han aparecido nuevas empresas enfocadas en la innovación cubriendo nuevos

nichos en el mercado de la inteligencia de negocio como la visualización, y el análisis

predictivo.

1.1TIPOS DE SISTEMAS DE INFORMACIÓN.

La introducción de los sistemas de información (SI), en las empresas a contribuido al

proceso de toma de decisiones, facilitan el logro de ventajas competitivas y automatizan los

procesos operativos de las empresas.

Para poder entender que es un sistema de información, primeramente se definen algunos

conceptos relacionados al tema como son:

Sistema: Conjunto de elementos que interactúan para realizar un conjunto de

funciones específicas.

Datos: Representación formal de hechos, conceptos o instrucciones adecuada para

su comunicación, interpretación y procesamiento por seres humanos o medios

automáticos.

Información: El significado que un ser humano le asigna a los datos.

Existen varios tipos de Sistemas de Información, desde el punto de vista administrativo

éstos se pueden clasificar como se muestra en la siguiente imagen.

Page 3: Unidad 1 Inteligencia de Negocios

Nivel operativo

Apoyan a los gerentes operativos en el seguimiento de las actividades y transacciones

elementales de la organización como ventas, ingresos, depósitos en efectivo, nomina,

decisiones de crédito y flujo de materiales en una fábrica.

Ejemplo: Un sistema para registrar los depósitos realizados en un cajero automático o uno

que lleve el registro del número de horas trabajadas cada día por los empleados de una

fábrica.

Sistema de Procesamiento de Transacciones (TPS)

Recolectan, almacenan, modifican y recuperan la información generada por las

transacciones producidas en una organización. Si durante una transacción se produce un

error, el TPS debe ser capaz de deshacer las operaciones realizadas hasta ese momento.

Es muy útil para el procesamiento de transacciones on-line.

Nivel de conocimiento

Se utilizan para el mejoramiento de la calidad de los servicios de la organización y aporte

de nuevos conocimientos, además de incrementar la productividad de los usuarios del

sistema.

Sistemas de Conocimiento (KWS) (Knowledgeworksystem) (Sistemas del

trabajo del conocimiento)

Auxilian a los trabajadores en la creación e integración de nuevo conocimiento en la

organización. Están diseñados para aumentar la productividad de los trabajadores.

Ejemplo: aplicaciones como Photoshop con la que diseñadores pueden crear arte

publicitario.

Page 4: Unidad 1 Inteligencia de Negocios

Sistemas de Automatización de Oficina (OAS)

Aplicaciones destinadas a ayudar al trabajo diario del administrativo de una organización,

forman parte de este tipo de software los procesadores de textos, las hojas de cálculo, los

editores de presentaciones, los clientes de correo electrónico, etc.

Ejemplo: Microsoft Office.

Nivel administrativo

Son utilizados por los administradores de nivel medio en la toma de decisiones. Tratan y

comparan resultados notables para la compañía, y estudian sus trayectorias.

Sistemas de Información Gerencial (MIS)

Son el resultado de interacción participativa entre personas, tecnologías y procedimientos.

Apoyan a nivel administrativo entregando información útil para el planteamiento, control y

toma de decisiones.

Ejemplo: sistema que reúna información de sistemas de información de nivel productivo

sobre los productos (pedidos, costos y gastos) y genere reportes para la toma de

decisiones. La mayoría de los informes para control administrativo están basados en

resúmenes de las transacciones.

Sistemas de Apoyo a la Toma de Decisiones (DSS)

Herramienta para realizar el análisis de las diferentes variables de un negocio con la

finalidad de apoyar el proceso de toma de decisiones. Su principal característica es la

capacidad de análisis multidimensional (OLAP)(Procesamiento Analítico en Línea) que

permite profundizar en la información hasta llegar a un alto nivel de detalle, analizar datos

desde diferentes perspectivas, realizar proyecciones de información para pronosticar lo que

puede ocurrir en el futuro, análisis de tendencias, análisis prospectivo, etc.

Ejemplo: el sistema implantado por la New York State Office of General Services que

permite que los ejecutivos verifiquen el estado por programa, comparando presupuestos y

gastos y mostrando el gasto estimado hasta el final del año fiscal.

Nivel estratégico

Están basados en los resultados estratégicos a largo plazo de la compañía, son útiles para

poder hacer frente a los impactos producidos por cambios en los negocios.

Sistemas de Soporte Gerencial (SSG)

Trabajan con información interna y externa a la organización y están diseñados para

abordar la toma de decisiones que requieren juicio, evaluación y comprensión.

Page 5: Unidad 1 Inteligencia de Negocios

Ejemplo: un ejecutivo puede utilizar el sistema para conocer las ventas por país, línea de

producto y, además, obtener el crecimiento esperado del segmento para los próximos 5

años en bases de datos externos.

Sistemas Expertos (SE)

Es una aplicación informática capaz de solucionar un conjunto de problemas que exigen un

gran conocimiento sobre un determinado tema. Imitan el comportamiento de un experto en

un dominio concreto y en ocasiones son usados por éstos. Con los sistemas expertos se

busca una mejor calidad y rapidez en las respuestas dando así lugar a una mejora de la

productividad del experto.

Ejemplo: un sistema MRP (ManufacturingResourePlanning; Fabricación y Planificación de

Recursos) diseñado para reducir el desperdicio en el proceso productivo.

Los Sistemas de Planificación de Recursos Empresariales (ERP)

Los ERP son sistemas que integran y manejan todo lo asociado con las operaciones de

producción y aspectos de distribución y que son necesarios para el funcionamiento de los

procesos de negocio de una organización, es decir, permiten la disponibilidad de toda la

información para todo el mundo todo el tiempo. Son también llamados back office ya que

no se involucra directamente a clientes y público general.

1.1.1 Sistemas OLTP

OLTP es la sigla en inglés de Procesamiento de Transacciones En Línea

(OnLineTransactionProcessing) es un tipo de procesamiento que facilita y administra

aplicaciones transaccionales, usualmente para entrada de datos y recuperación y

procesamiento de transacciones (gestor transaccional).

Los Sistemas de tipo OLTP lo conforman todos los sistemas de información que ejecutan

datos operacionales del día a día y aumentar la capacidad de procesamiento de

transacciones.

Estos sistemas realizan principalmente 3 tipos de acciones sobre una Base de Datos, las

cuales son: INSERT, DELETE y UPDATE que se manejan a nivel de transacciones

Entre algunos ejemplos de sistemas OLTP de tienen los siguientes:

SAP Business One de la compañía SAP SAP R3 de la compañía SAP E-Business Suite de la compañía Oracle JD Edwards Enterprise One de la compañía Oracle PeopleSoft ERP de la compañía Oracle ERP O7/Solution

Estos tipos de sistema consisten principalmente de transacciones de tipo DML (Data ManipulationLanguage(Lenguaje de Manipulación de Datos), sentencias de tipo insert, update o delete para el manejo de datos) dentro de la Base de Datos.

Page 6: Unidad 1 Inteligencia de Negocios

En la imagen de abajo se puede observar el flujo principal dentro de un sistema OLTP

Algunas de las características más comunes de este tipo de transacciones podrían ser:

Altas/Bajas/Modificaciones

Consultas rápidas, escuetas y predecibles

Poco volumen de información e información disgregada

Transacciones rápidas

Gran nivel de concurrencia

Modo de actualización on-line

Baja redundancia de datos

Algunos ejemplos de este tipo de aplicaciones son:

Compras

Ventas

Inventario

Sueldos

La tecnología OLTP se utiliza en innumerables aplicaciones, como en banca electrónica,

procesamiento de pedidos, comercio electrónico, supermercados o industria.

Requisitos.

El proceso de transacciones en línea cada vez necesita más recursos para las

transacciones que se transmiten por una red y que pueden integrar a más de una empresa.

Por esta razón, el software actual para sistemas OLTP utiliza procesamiento cliente-

servidor y software de intermediación (middleware) que permite a las transacciones correr

en diferentes plataformas en una red.

Middleware: Es un software que asiste a una aplicación para interactuar o comunicarse con

otras aplicaciones, software, redes, hardware y/o sistemas operativos.

En grandes aplicaciones, la eficiencia del OLTP puede depender de lo perfeccionado que

sea el software de gestión de transacciones (como CICS en plataformas IBM) o de que

Page 7: Unidad 1 Inteligencia de Negocios

tácticas de optimización se utilizan para facilitar la gran cantidad de actualizaciones

concurrentes que se pueden producir en una base de datos orientada a OLTP.

En los sistemas de bases de datos descentralizados más exigentes, los programas de

intermediación OLTP distribuyen el procesamiento de transacciones entre varios

ordenadores en una red. A menudo OLTP se integra en una arquitectura orientada a

servicios o en un servicio Web.

El OLTP emplea una estrategia de consignación o recuperación para asegurar que cada

transacción sea procesada de manera correcta. Esta estrategia es esencial, porque las

transacciones requieren una secuencia de pasos, y cada paso debe de llevarse a cabo de

manera correcta para que se concluya la transacción.

Función de la Consignación o Recuperación

Se explica por medio del siguiente ejemplo:

Si una persona retira efectivo de un cajero automático, la computadora del banco verifica

que su cuenta contenga fondos suficientes antes de deducir el retiro de su cuenta y permitir

que el cajero entregue el efectivo. Sin embargo, si el cajero no tiene efectivo, la transacción

no procede, y el retiro no se deduce de su cuenta. Un TPS (sistema de procesamiento de

transacciones) manda (consigna) una transacción y actualiza de manera permanente los

registros de una base de datos solo si cada paso de la transacción se procesa de manera

satisfactoria. Si falla un paso, fracasa toda la transacción y una recuperación devuelve los

registros a su estado original.

En la siguiente imagen se muestran los procesos que ocurren en un TPS

Un sistema de procesamiento de transacciones (TPS) se caracteriza por su capacidad para:

Page 8: Unidad 1 Inteligencia de Negocios

Recopilar, exhibir y modificar transacciones.

Guardar transacciones.

Enlistar transacciones.

Limitaciones de un TPS

Su capacidad para generar informes es limitada.

Solo genera informes de detalles que ofrecen solo un registro básico de las

transacciones concluidas.

1.1.2 Sistemas OLAP

OLAP es la sigla en inglés de Procesamiento Analítico en Línea (On-Line

AnalyticalProcess).

Son aplicaciones que se encargan de analizar datos del negocio para generar información

táctica y estratégica que sirve de soporte para la toma de decisiones. Mientras que las

transacciones OLTP utilizan Bases de Datos Relacionales u otro tipo de archivos, OLAP

logra su máxima eficiencia y flexibilidad operando sobre Bases de datos

Multidimensionales.

Podemos nombrar las siguientes características como las más sobresalientes de estas

aplicaciones:

Estructura de datos transparente al usuario.

Solo Consulta, trabajan sobre la información operacional generada por los sistemas

OLTP.

Consultas sobre grandes volúmenes de datos no predecibles.

Información histórica.

Modo de actualización Batch.

Alta redundancia de datos para facilitar la generación de consultas y obtener buenos

tiempos de respuesta.

Poderoso Back-end analítico para múltiples aplicaciones de usuarios.

Trabaja con resúmenes de miles de registros condensados en una sola respuesta.

Su objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza

estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes

Bases de Datos (un data warehouse, por ejemplo).

Estos tipos de sistemas analíticos buscan facilitar la creatividad, centrándose en la

estrategia a largo plazo y la ventaja competitiva dentro del negocio de una empresa.

Diferencias entre sistemas OLTP y OLAP

Page 9: Unidad 1 Inteligencia de Negocios

Sistemas OLTP Sistemas OLAP

Datos Valores actuales Datos históricos y/o

calculados

Organización Por aplicación Por áreas de la empresa

Acceso Muy frecuente

(lectura/escritura)

Baja frecuencia

Actualizaciones Actualizaciones de campo No se actualiza se

manipula

Tiempo de respuesta Medido por el tiempo de la

transacción (del orden de

segundos)

Medido por el tiempo de la

consulta (del orden de

minutos)

Tamaño de la BD 100 MB – GB 100 GB – TB

Usuarios Miles Cientos

Unidad de Trabajo Transacciones Consultas complejas

Ventajas de OLAP

Es un poderoso paradigma de visualización.

Proporciona tiempos de respuesta rápidos.

Permite realizar consultas de manera interactiva.

Es bueno para analizar grupos de datos organizados por series de tiempo.

Permite identificar semejanzas y diferencias en la data.

Permite realizar Pivot.

Permite realizar Slice&Dice.

Permite realizar Drill&Down.

1.2 INTELIGENCIA DE NEGOCIOS

1.2.1 Definición

Se entiende por inteligencia de negocios (Business Intelligence) al conjunto de

metodologías, aplicaciones, prácticas y capacidades enfocadas a la creación y

administración de información que permite tomar mejores decisiones a los usuarios de una

organización.

Page 10: Unidad 1 Inteligencia de Negocios

Algunas de las tecnologías que forman parte de la inteligencia de negocios

son:

Data warehouse:Es una colección de datos que es extraída desde diferentes fuentes

de información a lo largo de la empresa

Reporting:Herramientas para la elaboración de informes y listados, tanto en detalle

como sobre información agregada

Análisis OLAP (On-Line AnalyticalProcessing):Herramientas que manejan

cuestiones complejas de bases de datos relacionales, proporcionando un acceso

multidimensional a los datos

Análisis visual: Permite comunicar complejos datos de negocios de forma

rápida e intuitiva.

Análisis predictivo:Es el proceso de seleccionar, explorar, y modelar grandes

volúmenes de datos que develen información previamente desconocida para

beneficio del negocio.

Cuadro de mando: Es un conjunto de indicadores que aportan información

sumarizada e inteligente al usuario.

Cuadro de mando integral: Es un instrumento o metodología de gestión que facilita

la implantación de la estrategia de la empresa de una forma eficiente

Minería de datos:Es una técnica orientada a extraer información desde grandes

volúmenes de datos.

Gestión del rendimiento: Describe la metodología, las métricas, los procesos y

sistemas empleados para supervisar y gestionar el rendimiento de una compañía

Page 11: Unidad 1 Inteligencia de Negocios

Reglas de negocio: Son un componente clave en cómo se toman las decisiones en

una empresa.

Dashboards: Son resúmenes visuales de información del negocio, que muestran de

una mirada la comprensión del global de las condiciones del negocio mediante

métricas eIndicadores Clave de Desempeño (KPIs).

Integración de datos (que incluye ETL,Extraccion, Transformacion y

Carga):Permiten operar con fuentes de datos de cualquier tipo (integrando los datos

en una base de datos única (Datamart, Datawarehouse, etc.).

1.2.2 Importancia

Un sistema de inteligencia de negocios es de gran importancia para las empresas en la

actualidad ya que con su implantación proporciona diversos beneficios entre los que

podemos destacar:

Crear un circulo integro de la información, esto se lograría con la transformación de

los datos en información y esta genera un conocimiento que le permite a la empresa

tomar mejores decisiones que se traducen en mejores resultados y que generan

nuevos datos.

Permitir una visión única, conformada, histórica, persistente y de calidad de toda la

información.

Crear, manejar y mantener métricas, indicadores claves de rendimiento (KPI, Key

Performance Indicador) e indicadores claves de metas (KGI, Key GoalIndicator)

fundamentales para la empresa.

Aportar información actualizada tanto a nivel agregado como en detalle.

Reducir las diferencias de enfoque de negocio entre el departamento de TI y la

organización.

Mejorar la comprensión y documentación de los sistemas de información en el

contexto de una organización.

Mejora de la competitividad de la organización como resultado de ser capaces de:

Diferenciar lo relevante sobre lo innecesario.

Acceder más rápido a la información.

Tener mayor agilidad en la toma de decisiones.

Los beneficios de la inteligencia de negocios pueden clasificarse en tres categorías

principales, las cuales son:

Reducción de costos.

Incremento de ingresos.

Mejoramiento de la satisfacción de los clientes.

Y esta lista no es exhaustiva ni detallada, pues los usuarios continúan encontrando formas

nuevas de implementar inteligencia de negocios

Page 12: Unidad 1 Inteligencia de Negocios

1.2.3 Componentes de la Inteligencia de Negocios. Todas las soluciones de BI tienen funciones parecidas, pero deben de reunir al menos los siguientes componentes:

Multidimensionalidad: La información multidimensional se puede encontrar en hojas de cálculo, bases de datos, etc. Una herramienta de BI debe de ser capaz de reunir información dispersa en toda la empresa e incluso en diferentes fuentes para así proporcionar a los departamentos la accesibilidad, poder y flexibilidad que necesitan para analizar la información. Por ejemplo, un pronóstico de ventas de un nuevo producto en varias regiones no está completo si no se toma en cuenta también el comportamiento histórico de las ventas de cada región y la forma en que la introducción de nuevos productos se ha desarrollado en cada región en cuestión.

Data Mining (minería de datos): Las empresas suelen generar grandes

cantidades de información sobre sus procesos productivos, desempeño operacional, mercados y clientes. Pero el éxito de los negocios depende por lo general de la habilidad para ver nuevas tendencias o cambios en las tendencias. Las aplicaciones de data mining pueden identificar tendencias y comportamientos, no sólo para extraer información, sino también para descubrir las relaciones en bases de datos que pueden identificar comportamientos que no muy evidentes.

Agentes: Los agentes son programas que piensan. Ellos pueden realizar tareas a

un nivel muy básico sin necesidad de intervención humana. Por ejemplo: un agente pueden realizar tares un poco complejas, como elaborar documentos, establecer diagramas de flujo, etc.

Data Warehouse (almacén de datos): Es la respuesta de la tecnología de

información a la descentralización en la toma de decisiones. Coloca información de todas las áreas funcionales de la organización en manos de quien toma las decisiones. También proporciona herramientas para búsqueda y análisis.

1.2.3.1 Aplicaciones Analíticas.

Data Mining, herramientas para minería de datos.

OLAP, herramientas de procesamiento analítico de datos.

Herramientas de consulta y reporte de datos.

Herramientas de producción de reportes personalizados.

ELT, herramientas de extracción, traducción y carga de datos.

Herramientas de administración de sistemas.

Portales de información empresarial.

Sistemas de base de datos.

Sistemas de administración del conocimiento.

Page 13: Unidad 1 Inteligencia de Negocios

Simulación y predicción. Son aplicaciones para simular escenarios y predecir

tendencias en el futuro. “Si el precio de la materia prima crece un 5% a lo largo del año y en tres meses el dólar sube 10%, ¿cómo afecta a nuestra venta al final del año?” “Si invertimos 10% más en esta línea de productos, ¿cómo cambia nuestra productividad y ROI?”

Activity-BasedCosting (actividad basada en costos). La determinación de los costes basados en actividades descubre los costes reales de los productos, servicios o clientes más allá de la contabilidad tradicional y desvela que por ejemplo dos clientes aparentemente igual de rentables según sus compras, en realidad causan costes muy diferentes, o que 25% de la actividad de la empresa causa80% de los costes.

Minería de Datos. Sistemas basados en algoritmos matemáticos para descubrir

tendencias escondidas entre grandes volúmenes de datos. Aplicada desde la detección de fraude hasta el análisis de cesta de compra.

BalancedScorecard/Cuadro de Mando Integral. Un concepto de gestión de la

estratégica empresarial desarrollado por Norton y Kaplan. Permite ver la empresa no sólo bajo la perspectiva financiera, sino también bajo otras como clientes, procesos o potenciales. Los objetivos estratégicos de las empresas se definen y su alcance se mide constantemente con datos reales.

Gestión de riesgo. Especialmente las entidades financieras y las aseguradoras,

pero también otras empresas, necesitan calcular riesgos y simular escenarios. Las aplicaciones BI proporcionan todo el proceso.

Alertas y vigilancia. Ya no es necesario leer cada mañana muchas páginas de

informes o mirar cada hora una pantalla para detectar si existe una situación crítica en algún lugar de la empresa. Se pueden vigilar automáticamente los indicadores de la actividad empresarial y generar avisos por email o SMS si un indicador está fuera de su rango normal, a cualquier ritmo y hora del día.

Fidelización de Clientes. Las aplicaciones ayudan a identificar que son los mejores

o más rentables clientes y porque clientes abandonan la empresa. Proporcionan los datos para campañas y evalúan las respuestas y el impacto.

Consolidación. Automatización de consolidaciones contables entre empresas de

un mismo grupo oentre sucursales. También se aplican en fusiones de empresas y adquisiciones.

Page 14: Unidad 1 Inteligencia de Negocios

1.2.3.2 Sistemas de Reportes.

Consultas y reportes

Se usa con propósito analítico Manipular los datos Realiza un pedido de datos Realiza la carga de los datos Darle formato a los datos Presentar los datos

QueryTool (herramienta de consultas): Un tipo específico de herramientas de acceso a

datos por usuarios finales que invita al usuario a formas sus propias consultas manipulando

directamente las tablas relacionales y sus uniones.

Se diseñan Reportes de todo tipo incluyendo gráficos y parámetros de ingreso dejándolos

en una librería para ser accedidos, mediante permisos, por los usuarios que correspondan.

1.2.3.3 Base de Datos Multidimensionales y Data Warehouse.

Base de datos multidimensionales Modelos Multidimensionales Técnica de diseño lógico para diseño de Data Warehouses. Proporcionan los mejores resultados. Diseños de acuerdo a un estándar que es intuitivo y fácil de entender. Permite accesos de alto rendimiento. Formado por una tabla cuya clave es compuesta, TableFact (tabla de hechos) y un

conjunto de tablas más pequeñas denominadas Tablas de Dimensión. Su apariencia hace que se les denomine diagramas STAR.

Data Warehouse

Page 15: Unidad 1 Inteligencia de Negocios

Un Data Warehouse (DW) o almacén de datos es una colección de datos que es extraída desde diferentes fuentes de información a lo largo de la empresa (bases de datos departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la realización de consultas y análisis, fundamentalmente, para ayudar a la toma de decisiones.

Un sistema de DW apunta a disponer de una visión única de los clientes y proveer la mayor cantidad posible de información a los usuarios de la empresa, facilitándose el monitoreo del negocio.

Los datos del DW poseen algunas cualidades fundamentales. La primera de ellas es que están orientados a temas, diferenciándose así de los sistemas transaccionales que estructuran los datos en procesos funcionales.

Por otro lado, se trata de datos integrados, es decir, están consolidados, lo cual supone un proceso previo de depuración y homogeneización, etapa que puede ser una de las más complejas al implementar un DW. Por último, los datos son historiados, ya que mantienen el registro histórico de sus valores, lo cual redunda en que, a diferencia de los sistemas transaccionales, no sean “volátiles”.

1.2.3.4 Data Mining (minería de datos). Las técnicas de Data Mining son el resultado de un largo proceso de investigación y desarrollo de productos. Esta evolución comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras, y continuó con mejoras en el acceso a los datos, y más recientemente con tecnologías generadas para permitir a los usuarios navegar a través de los datos en tiempo real. Data Mining toma este proceso de evolución más allá del acceso y navegación retrospectiva de los datos, hacia la entrega de información prospectiva y proactiva. Data Mining está lista para su aplicación en la comunidad de negocios porque está soportado por tres tecnologías que ya están suficientemente maduras:

Recolección masiva de datos. Potentes computadoras con multiprocesadores. Algoritmos de Data Mining.

Principales características y objetivos de la Minería de Datos

Explorar los datos que se encuentran en las profundidades de las bases de datos, como los almacenes de datos, que algunas veces contienen información almacenada durante varios años.

En algunos casos, los datos se consolidan en un almacén de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet.

El entorno de la minería de datos suele tener una arquitectura cliente servidor. Las herramientas de la minería de datos ayudan a extraer el mineral de la

información enterrado en archivos corporativos o en registros públicos, archivados.

El minero es, muchas veces un usuario final con poca o ninguna habilidad de programación, facultado por barrenadoras de datos y otras poderosas herramientas indagatorias para efectuar preguntas ad-hoc y obtener rápidamente respuestas.

Page 16: Unidad 1 Inteligencia de Negocios

Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e inesperados.

Las herramientas de la minería de datos se combinan fácilmente y pueden analizarse y procesarse rápidamente.

Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en paralelo para la minería de datos.

La minería de datos produce cinco tipos de información:

Asociaciones. Secuencias. Clasificaciones. Agrupamientos.

Pronósticos. Los mineros de datos usan varias herramientas y técnicas.

1.2.3.5 Administración del Conocimiento. De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación de la información y ese modelo representen un valor agregado, entonces nos referimos al conocimiento. El objetivo fundamental del KDD es encontrar conocimiento útil, válido, relevante y nuevo sobre un fenómeno o actividad mediante algoritmos eficientes, dadas las crecientes órdenes de magnitud en los datos. Al mismo tiempo hay un profundo interés por presentar los resultados de manera visual o al menos de manera que su interpretación sea muy clara. Otro aspecto es que la interacción humano-máquina deberá ser flexible, dinámica y colaboradora. El resultado de la exploración deberá ser interesante y su calidad no debe ser afectada por mayores volúmenes de datos o por ruido en los datos. En este sentido, los algoritmos de descubrimiento de información deben ser altamente robustos. En la siguiente figura se ilustra la jerarquía que existe en una base de datos entre datos, información y conocimiento. Se observa igualmente el volumen que presenta en cada nivel y el valor que los responsables de las decisiones le dan en esa jerarquía. El área interna dentro del triángulo representa los objetivos que se han propuesto. La separación del triángulo representa la estrecha unión entre dato e información, no así entre la información y el conocimiento.

Page 17: Unidad 1 Inteligencia de Negocios

Jerarquía del Conocimiento. 1.3 PRINCIPALES HERRAMIENTAS DE LA INTELIGENCIA DE NEGOCIOS.

Herramientas Esenciales

Una solución de BI incluye la implementación de una serie de herramientas y técnicas orientadas a gestionar, explotar, distribuir y estructurar información. Entre ellas, destacan las siguientes:

Query&Report

Las herramientas de Query (consulta) y Report (reporte) son quizá las más conocidas en este ámbito, ya que son fundamentales para el desarrollo y manejo de listados e informes basados en la información presente en los almacenes de datos y Data Marts.

Data Warehouse

Un Data Warehouse (DW) o almacén de datos es una colección de datos que es extraída desde diferentes fuentes de información a lo largo de la empresa (bases de datos departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la realización de consultas y análisis, fundamentalmente, para ayudar a la toma de decisiones.

Data Mart

Aunque para algunos se trata casi de un sinónimo de Data Warehouse, un Data Mart o cubo de datos puede entenderse como un subconjunto del repositorio de datos, que se orienta a un área específica del negocio, como recursos humanos, ventas o marketing, por ejemplo. En otras palabras, un Data Mart corresponde a un almacén de datos más restringido que un DW en cuanto al volumen de datos que contiene y al alcance dentro de la organización.

Page 18: Unidad 1 Inteligencia de Negocios

Herramientas OLAP

OLAP (On Line AnalyticalProcessing) son un conjunto de herramientas capaces de responder rápida y ágilmente a las solicitudes de información de los usuarios y que deben reflejar cualquier lógica de negocio por las que se consulte.

En contraste con los sistemas transaccionales, OLTP (On Line TransactionProcessing), las herramientas OLAP presentan información multidimensional, es decir, desde múltiples perspectivas. Del mismo modo, los sistemas analíticos, al igual que los datos del Data Warehouse, están orientados a temas, y no sólo operan con datos actuales, sino también con datos históricos.

Una de las principales cualidades de las herramientas de OLAP es identificar tendencias, es decir, permiten apoyar la toma decisiones considerando diversas variables, así como también permiten identificar cambios en las preferencias de los clientes. Sin embargo, aunque pueden responder consultas complejas y ratificar información, lo hacen siempre dependiendo del usuario, que es quien define las relaciones a considerar.

Data Mining

El Data Mining (DM) o minería de datos es una técnica orientada a extraer información desde grandes volúmenes de datos y corresponde a una de las claves de la inteligencia de negocios. El DM es un proceso conocido como KDD (KnowledgeDiscovery in Databases; Descubrimiento de Conocimiento en Bases de Datos) que consta de tres fases: preparación de los datos, extracción de información e interpretación de los resultados.

Normalmente, el DM se realiza con las llamadas “técnicas de verificación” -en donde se prueba una hipótesis del usuario- y los “métodos de descubrimiento” -búsqueda de patrones (incluyendo las técnicas de predicción)-. Lo anterior se traduce en análisis exploratorios, los cuales se apoyan en herramientas de visualización de datos y construcción de modelos, con el objetivo de realizar predicciones utilizando los patrones detectados en los datos conocidos con información del pasado.