licencia - rutanmedellin.orginforme mercado de tic, Área de oportunidad big data por corporación...
TRANSCRIPT
LICENCIA
Informe mercado de TIC, Área de oportunidad Big Data
por Corporación Ruta N se distribuye bajo una Licencia Creative
Commons Atribución-NoComercial-CompartirIgual 4.0
Internacional.
REFERENCIA BIBLIOGRÁFICA
Sugerimos se referencie el documento de la siguiente forma:
Corporación Ruta N (2014). Observatorio CT+i: Informe No. 1
Área de oportunidad en Big Data. Recuperado desde
www.brainbookn.com
1
Dic. 2014
Big Data
El estudio de vigilancia tecnológica e inteligencia competitiva del área de oportunidad de Big Data fue
desarrollado por la Universidad de Antioquia en el cual los participantes asumieron los siguientes roles:
Metodólogo: Asesora con la metodología de vigilancia tecnológica e inteligencia competitiva
diseñada para el proyecto Observatorio CT+i y definida por la Red de Vigilancia Tecnológica de la
ciudad. Adicionalmente coordina dentro de cada institución los ejercicios realizados.
Vigía: Encargado de recopilar de fuentes primarias y secundarias los datos e información relacionada
con el área de oportunidad estudiada. Adicionalmente, realiza con expertos temáticos y asesores el
análisis de la información recopilada y la consolidación de los informes del estudio de vigilancia
tecnológica e inteligencia competitiva.
Experto Temático: Participa en las etapas de análisis y validación de la información recopilada por el
vigía. Adicionalmente, orienta y da lineamientos del estudio de vigilancia tecnológica e inteligencia
competitiva realizado.
Metodóloga:
Ana Lucía Pérez Patiño
Expertos temáticos:
Ana Lucía Pérez Patiño
John Freddy Duitama
Vigías:
Mario Alberto Giraldo Londoño, Juan
Camilo Giraldo Chaverra, Laura Andrea
Vélez, Jaider Ochoa Gutiérrez , Andrés
Giraldo Méndez, Alexander Betancur
Director del proyecto:
Elkin Echeverri
Coordinadores del proyecto:
Samuel Urquijo
Jorge Suárez
Experto en TIC:
César Cortés
Directores del proyecto:
Andrés Felipe López
Oscar Eduardo Quintero
Coordinadora del proyecto:
Ana Catalina Duque
Big data
• Conceptos de Big Data.
• Crecimiento de los datos.
• Línea del tiempo del Big Data.
GENERALIDADES
• Tecnologías principales y emergentes
en el uso de Big Data.
• Identificación de tendencias en
publicaciones y patentes.
• Identificación de los principales
jugadores a nivel mundial.
MERCADO DE TECNOLOGÍA OPORTUNIDADES Y RETOS
• Capacidades requeridas.
• Tiempo al mercado.
• Jugadores actuales.
• Barreras potenciales.
• ¿Cómo está Medellín?
GENERALIDADES DEL ÁREA DE OPORTUNIDAD
• Distribución geográfica de la oportunidad
de mercado a nivel mundial.
• Distribución por categorías de la
oportunidad de mercado.
• Principales nichos de mercado.
• Principales jugadores del mercado.
MERCADO DE PRODUCTOS
Y SERVICIOS
A continuación se presenta el alcance y foco del análisis. Este diagrama representa los temas priorizados
en donde se hizo énfasis en el estudio de vigilancia tecnológica e inteligencia competitiva del área de
oportunidad definida por expertos y asesores.
Generalidades del área de oportunidad....................................
Mapa conceptual.........................................................
Línea de tiempo.........................................................
Crecimiento en el tiempo..............................................
Mercado de productos y servicios............................................
Aspectos clave / Crecimiento del mercado..........................
Principales mercados...................................................
Mercado del Big Data en las empresas..............................
Análisis de servicios y tecnologías....................................
Tendencias de mercado.................................................
Tendencias de productos y servicios..................................
Principales jugadores del mercado...................................
Otros jugadores..........................................................
Casos de éxito............................................................
Conclusiones..............................................................
Nº de diapositiva
12
13
14
15
16
17
18
19
20
21
22
23
24
29
31
Mercado de tecnología.........................................................
Tendencias tecnológicas emergentes..................................
Publicaciones y patentes................................................
Nivel de madurez Big Data..............................................
Tendencias de investigación en el mercado..........................
Tendencias en desarrollo tecnológico.................................
Líderes en publicaciones científicas ..................................
Líderes en desarrollo tecnológico.....................................
La empresa y las patentes..............................................
Conclusiones..............................................................
Oportunidades y retos del área de oportunidad...........................
Mercado retail............................................................
Publicidad y marketing..................................................
Banca y finanzas.........................................................
Salud.......................................................................
Matriz de oportunidad..................................................
Recomendaciones........................................................
Expertos consultados....................................................
Referencias......................................................................
Nº de diapositiva
32
33
34
35
36
37
39
41
43
44
45
47
49
51
53
55
56
58
59
A continuación se presenta una descripción
del área de oportunidad con los aspectos
más importantes de la temática y su
evolución, especialmente en los últimos
diez años y los puntos clave que vendrán a
futuro, evidenciando los momentos o hitos
más relevantes.
MAPA CONCEPTUAL BIG DATA
Fuentes: (Manyika et al., 2011)
Google File System
1980 1990 2000 2010
• Surgen las bases de
datos relacionales.
• Inicio de las
bodegas de datos.
Futuro
• Inteligencia de
negocios 1.0.
• Concepto de Big
Data.
• Uso de la telefonía
móvil.
• Berkeley DB.
• Análisis predictivos.
• Auge de las redes
sociales.
• Google File System.
• MapReduce.
• Apache Hadoop.
• Facebook crea Hive.
• Búsqueda semántica.
• Internet de las
cosas (redes de
sensores).
• Surgen nuevas
arquitecturas de
sistemas
distribuidos como:
Flume (Cloudera),
Kafka (LinkedIn),
Storm (Nathan
Marz).
• Cloud computing.
V
• Análisis de
sentimientos.
• Análisis
perceptivos.
• Análisis de
recomenda-
ciones.
• Computación
híbrida.
• Crece la
demanda de
talentos para
el análisis de
datos.
Fuente: Casado, 2013; Winshuttle, 2014 y Outliers Collective, 2011.
CRECIMIENTO EN EL TIEMPO
Mayor inversión en software, hardware, servicios y personal
para la gestión del universo digital, lo que redunda en un
costo cada vez más bajo por la gestión de cada byte
procesado (Kelly, Floyer y Vallantene, 2013).
Total inversión vs Costo por GB
Fuente: (Gantz y Reinsel, 2012).
El 68% del universo de los datos son creados por los
consumidores. Solo una tercera parte de estos datos son
explorados y analizados (Kelly, Floyer y Vallantene, 2013).
Crecimiento del universo digital
Fuente: (Gantz y Reinsel, 2012).
La masificación del internet, el uso de dispositivos móviles, las redes sociales y el Internet de las cosas han
provocado el rápido aumento en volumen y en variedad de los datos y han dado origen al concepto de Big Data.
Aproximadamente 2.500 millones de gigabytes de datos son generados cada día, el 80% de estos datos son no
estructurados (Audio, video, sensores, redes sociales) (Kelly, 2012).
En este capítulo se evidencian aspectos claves
del mercado global y nacional, haciendo
énfasis en el comportamiento comercial a
nivel de productos, servicios y tecnologías
disponibles en el mercado y las tendencias de
los mismos a nivel de oferta y demanda.
Adicionalmente, los principales jugadores del
mercado mundial, evidenciando sus
productos, aplicaciones y casos reales que
comprueban los resultados de este tipo de
desarrollos.
Las ventas solo por concepto de Big Data en el 2013 fueron de
USD$16 Mil millones (Kelly, 2012; Kelly, 2013 y Kelly, 2014).Ventas en el 2013 de estás compañías USD$2 Mil millones
(Kelly, 2012; Kelly, 2013 y Kelly, 2014).
• Utilización de Big Data para entender el comportamiento de
compra y de las interacciones entre los usuarios y los productos
(Kart, Heudecker y Buytendijk, 2013).
• Entre 2012 y 2020 la cuota del universo digital de los mercados
emergentes crecerá del 36% al 62% (Gantz y Reinsel, 2012).
• Utilización de datos semiestructurados y no estructurados.
• Uso de herramientas de visualización que facilitan la
representación de la información analizada.
• Aumento en el número de sensores y dispositivos conectados a
internet (Internet de las cosas).
• El mercado de Big Data en servicios, hardware y software presentó
un crecimiento en el 2013 del 58% (18,6 Mil millones de dólares)
respecto al 2012. Se estima que para el 2017 supere los 47 Mil
millones de dólares, pronosticando una tasa anual de crecimiento,
entre el 2012 y 2017, del 31%.
(Kelly, 2012).
CRECIMIENTO DEL MERCADO
ASPECTOS CLAVE
EMPRESAS MIXTAS EMPRESAS SOLO BIG DATA
US$0,000
US$1,000
US$2,000
US$3,000
US$4,000
US$5,000
US$6,000
US$7,000
US$8,000
US$9,000
2011 2012 2013
Millo
nes
Servicios Hardware Software
US$0,0
US$0,2
US$0,4
US$0,6
US$0,8
US$1,0
US$1,2
US$1,4
2011 2012 2013
Millo
nes
Servicios Software Hardware
PRINCIPALES MERCADOS
35% Ventaja
competitiva
91% Toma de
decisiones
24% Ventaja
competitiva
86 % Toma de
decisiones16% Ventaja
competitiva
72% Toma de
Decisiones
26,6% Ventaja
competitiva
74% Toma de
decisiones
País% Crecimiento PIB
% Inflación
% Desempleo
JPN
2,0
0,0
4,5
IND
4,5
9,3
9,8
UK
-0,2
2,8
8,1GER
0,9
2,0
10,1
33% Ventaja
competitiva
92% Toma de
decisiones
MEX
3,8
4,1
4,8
FR
0,2
2,0
5,2ESP
-1,4
2,4
24,9
47% Ventaja
competitiva
92% Toma de
decisiones
COL
4,0
3,2
11,0
20% Ventaja
competitiva
93% Toma de
decisiones
BRZ
1,0
3.4
6.0
Fuentes (EMC, FORUM , 2013; Abad, 2014 y Manyika et al., 2011).
USA
2,3
2,1
8,2
Encuesta realizada en el 2013 por EMC en cincuenta países a 10.700
ejecutivos, gerentes de TI y gerentes de negocios.En Colombia fueron 183
encuestados.
MERCADO DEL BIG DATA EN LAS EMPRESAS
Mercado global
Mercado retail
Según IBM (2012) el 49% de las empresas del mercado global, y el 53% de las
empresas dedicadas al mercado retail, utilizarían Big Data para mejorar los
resultados de la experiencia de sus clientes.
Conjunto completo de soluciones
para el análisis y almacenamiento de
datos en la nube.
Consultoría y entrenamiento en Big
Data.
• Almacenamiento en la nube.
• Procesamiento y análisis en
la nube.
• Visualización de datos.
• Asesorías profesionales.
• Capacitaciones.
SERVICIOS
Plataformas diseñadas para hacer la
gestión y el análisis de grandes
volúmenes de datos estructurados y
no estructurados en tiempo real.
• Framework como MapReduce
para procesamiento y análisis
de datos.
• Aplicaciones analíticas
avanzadas (algoritmos de
aprendizaje de máquinas).
• Herramientas de
visualización.
SOFTWARE
Arquitecturas paralelas y escalables.
Redes de sensores.
• Arquitectura de servidores
en la nube para
almacenamiento en la nube.
• Sistemas de redes de
sensores (Internet de las
cosas).
HARDWARE
ANÁLISIS DE SERVICIOS Y TECNOLOGÍAS
1. PrescriptivoAnalizar los datos para desarrollar productos o
servicios, prevenir fraudes, determinar riesgos
financieros y diagnosticar enfermedades.
2.Campañas de marketing y rotación de
clientesMonitorear y determinar la eficacia de las campañas
de marketing, así mismo analizar patrones de
comportamiento de los clientes.
3. Innovación en productos y serviciosCrear nuevas empresas, crear nuevas ofertas de
mercados, personalizar servicios, apoyo en la
investigación.
Ventas y marketing
Focalización de los clientes.
Entender la relación de los
clientes con los artículos, la
ubicación y los dispositivos.
Hacer recomendaciones
dependiendo del contexto.
Financieros y seguros
Cobertura e historial de
comportamiento.
Encontrar hechos faltantes,
inconsistencias y datos ocultos.
Mejorar la tasa de éxito en las
reclamaciones fraudulentas.
Salud
Investigación contra el cáncer.
Mejorar el tratamiento de los
pacientes optimizando el
control médico.
Proceso de señales neuronales.
Estudio de reingresos de
pacientes.
Smart Cities
En el campo de la energía, la
sanidad, el agua y la movilidad.
Extraer datos día a día de sus
habitantes y la interacción con
otras personas, maquinarias o
servicios en el hogar, en la
calle o en el trabajo.
TENDENCIAS Y NICHOS DE MERCADO
Financiero y seguros
Ventas y marketing
Salud
Smart Cities
Nichos de mercado
Ofrecer productos, servicios y
relaciones con otros usuarios
basados en el análisis del perfil de
usuario y datos de
comportamiento.
RECOMENDADOR
COMPORTAMIENTOS
Y SENTIMIENTOS
RIESGOS Y
DETECCIÓN DE
FRAUDES
TENDENCIAS DE PRODUCTOS Y SERVICIOS
MARKETING
Determinar el sentimiento del
usuario relacionado con
determinadas empresas, marcas o
productos.
Determinar el riesgo y la
exposición de los activos
financieros, ubicando escenarios
basados en mercado simulado y
detectando a los clientes
potencialmente riesgosos.
Monitorear la eficacia de las
campañas de marketing,
incorporar datos más granulares,
análisis de registro detallados de
llamadas.
Proveer una forma efectiva de
marketing dirigido mediante la
creación de una experiencia de
compra personalizada para cada
cliente (Linden, Smith y York, 2003 y
Felfernig y Friedrich, 2007).
Determinar la actitud de una
persona con respecto a algún tema,
generalizar opiniones y comentarios
no solo con base en el análisis de
palabras sino también del contexto
(Pang y Lee, 2008).
• Detección a tiempo del intento de
fraude identificando conexiones
ocultas.
• Calcular el riesgo en grandes carteras.
• Minimizar la exposición al riesgo.
• Conocer al cliente y ser proactivo.
(Takahashi, 2014).
• Filtrado colaborativo (Amazon's
Item to item collaborative
filtering).
• Filtrado basado en contenido.
• Modelos de agrupamiento.
• Modelos basados en búsquedas.
• Procesamiento de lenguaje
natural.
• Polaridad de sentimientos.
• Minería de opinión.
• Minería de texto.
• Information retrieval.
• Uso de tecnología de motores
de búsqueda.
• Uso de bases de datos NoSql.
• Integrar diferentes fuentes de
información (socios bancarios).
• Recopilación de información
estadística (Takahashi, 2014).
• Publicidad dirigida.
• Publicidad georeferenciada.
• Modelamiento predictivo.
• Information retrieval.
• Association rule learning.
• Segmentación de clientes.
• Entender los comportamientos
de compra de los clientes
(Center for Media Justice, Color
of Change y Sum of Us, 2013).
Cuenta con una plataforma basada en tres
productos principales que permiten la
integración, el almacenamiento y la gestión
de grandes volúmenes de datos:
IBM InfoSphere Warehouse
IBM InfoSphere Streams™
IBM InfoSphere BigInsight.™
Soluciones como Hadoop,
analítica de datos,
análisis operacional y
sistemas transaccionales
Servidor de bases de datos relacionales con capacidad de análisis en tiempo real, transacciones rápidas y capacidad para NoSQL.
Proporciona la detección excepcional de riesgos y amenazas, aplicando una profunda experiencia en análisis de datos.
Ofrece alto rendimiento en soluciones robustas y manejo de cargas de trabajo de alto volumen.
PRODUCTOS Y SERVICIOS // CLIENTES //
Suite para análisis de datos, bodegas de datos, integración y manejo de la información.
PRINCIPALES JUGADORES DEL MERCADO
IBM Security Intelligence
Software predictivo
102.40599%
1.2521%
Ingresos Big Data IBM 2012 (Millones USD)
Ingresos totales Ingresos Big data
Servicios
50%
Software
31%
Hardware
19%
hp
HEAVEn y Autonomy para el análisis
de datos.
Clientes: Twitter, Comcast, Verizon,
Ubisoft, Sprint, Shopify, entre otros.
Fuente: www.hp.com
OTROS JUGADORES MIXTOS
Dell
BI, integración de datos y
aplicaciones de analítica.
Industrias como la educación, el
comercio y el sector bancario han
utilizado sus soluciones.
Fuente: www.dell.com
Sap
Soluciones analíticas, predictivas y
servicios para gestionar
información. Los clientes están en
sectores de las comunicaciones, el
comercio y el bancario.
Fuente: www.sap.com
Teradata
Analítica de datos, aplicaciones y
servicios relacionados para
consolidar los datos de diferentes
fuentes para su análisis.
Los clientes están en sectores de la
salud, financieros y de las
comunicaciones.
Fuente: www.teradata.com
Oracle
Bases de datos relacionales y no
relacionales, analítica de negocio,
analítica de datos.
Los clientes están en sectores de la
tecnología, las comunicaciones, las
ciencias de la salud y financieros.
Fuente: www.oracle.com
SAS
Analítica de negocios, Hadoop y
visualización de datos.
Los clientes están en el sector
bancario, las comunicaciones, el
gobierno, deporte y
entretenimiento.
Fuente: www.sas.com
Ofrece un conjunto de aplicaciones de integración,
visualización y análisis real con enfoque en seguridad,
escalabilidad, facilidad de uso y trabajo colaborativo. Sus
clientes se encuentran en el gobierno, la salud y los
servicios financieros.
En 2013 se estima que tuvieron ganancias de $418 Millones
de dólares (Kelly, 2014).
PRODUCTOS Y SERVICIOS // CLIENTES
PRINCIPALES JUGADORES DEL MERCADO
1.Palantir Gotham and Palantir Metropolis: soluciones analíticas.
Análisis de datos interactivos e infraestructura para inteligencia
empresarial.
2.Palantir Home Lending: solución enfocada en el análisis y la toma
de decisiones especializada en los servicios financieros.
3.Palantir Pharma R&D: herramienta de integración de datos,
visualización y análisis multidimensional.
4.Palantir Cyber: plataforma para seguridad en línea, permite a las
organizaciones diagnosticar ataques y tomar medidas preventivas
frente a futuras amenazas cibernéticas.
Soluciones basadas en Hadoop, bases de datos orientadas por columnas,
procesamiento de datos en paralelo y procesamiento de datos en
memoria. Sus principales clientes se encuentran en sectores como
educación, servicios financieros, servicios de internet y sector público.
Sus ganancias en 2013 fueron de aproximadamente $300 millones de
dólares (Kelly, 2014).
PRODUCTOS Y SERVICIOS // CLIENTES
PRINCIPALES JUGADORES DEL MERCADO
1.Pivotal HD, Pivotal HD with Gemfire XD, Pivotal Data dispatch:
soluciones analíticas basadas en Hadoop, diseñadas para ser
integradas con ambientes SQL existentes.
2.Pivotal Greenplum Database, Pivotal DCA: arquitecturas de
procesamiento de datos en paralelo y bases de datos flexibles
orientadas por columna.
3.Pivotal SQLFire: base de datos en memoria distribuida que ofrece
escalabilidad dinámica y alto rendimiento.
4.MADLIB Pivotal GPTEXT: herramientas de análisis, consulta y
visualización.
Splunk ofrece plataformas enfocadas en mejorar los niveles de servicio,
reducir costos operacionales y riesgos de seguridad. Se especializa en el
análisis con productos como Splunk y Hunk. Sus clientes ascienden a
siete mil en más de noventa países.
Se estima que en 2013 sus ganancias ascendieron a cerca de $283
millones de dólares (Kelly, 2014).
PRODUCTOS Y SERVICIOS // CLIENTES
PRINCIPALES JUGADORES DEL MERCADO
1. Splunk Enterprise: proporciona una manera fácil, rápida y segura
para analizar diversas fuentes de datos generados por sus sistemas
de TI e infraestructura tecnológica, ya sea física, virtual o en la
nube.
2. Splunk Hadoop Connect: plataforma de integración de datos
bidireccional entre Splunk Enterprise y Hadoop.
3. Splunk DB Connect : plataforma de integración en tiempo real,
confiable y escalable para Splunk Enterprise en sistemas de gestión
de bases de datos relacionales.
4.Hunk™ for Hadoop and NoSQL Data Stores: análisis e integración
de datos en bases de datos NoSQL.
OTROS JUGADORES SOLO BIG DATA
Es un proveedor de servicios
analítico. Entre sus clientes se
destacan la industria del
software, empresas del comercio
y la industria financiera.
Software analítico.
Sus soluciones son aplicadas en:
salud, gobierno, comercio,
software y finanzas.
Análisis predictivo,
almacenamiento en la nube y
captura de datos en streaming.
Sus clientes están en sectores de
mercadeo, aseguramiento,
seguridad y salud.
CLIENTES
1. Fundada en 2005 por Michael Stonebraker, profesor e investigador del MIT
(«Michael Stonebraker», s.f.).
2. En 2006 lanza al mercado la primera versión de su base de datos analítica
(Burnett, 2010).
3. Para el 2010 la empresa había duplicado su número de clientes, sus ingresos y su
personal (Morgan, s.f.).
4. En marzo de 2011 HP adquiere Vertica. Para 2013 se convierte en el segundo
competidor de este mercado («HP Completes Acquisition of Vertica Systems, Inc.»,
s.f.).
• En 2011 lideró el mercado en las
compañías que solo se dedican al negocio
de Big Data con un estimado de $84
Millones de dólares (Kelly, 2012).
• HP la compró en el mes de febrero de
2011 y se concretó en marzo del mismo
año, no se conoció cifra oficial (HP to
Acquire Vertica, 2011 y «HP Completes
Acquisition of Vertica Systems, Inc.»,
2011).
• Entre sus clientes se destacan: Twitter,
Verizon Wireless, Guess Inc, Mozilla,
Comcast, entre otros («Vertica
Customers», 2014).
CASOS DE ÉXITO
Base de datos orientada por columnas con
un almacén de datos híbrido, diseñada y
construida para manejar consultas sobre
intensas cargas de trabajo (Burnett,
2010).
HISTORIA //
1. Walmart desarrolló Retail Link, una herramienta de análisis de autoabastecimiento
y venta de productos (Basker, 2007).
2. Sistema de recolección y análisis de información de sus clientes por medio de su
sitio web y sus aplicaciones móviles.
3. Mediante el análisis usa esta información para segmentar sus clientes y ofrecerles
a su vez diferentes anuncios y promociones (Walmart, 2012).
4. Implementa en 2012 un nuevo motor de búsqueda semántica con resultados
mediante predicciones (Walmart, 2012).
• Se estima que Walmart durante 2012
recaudó cerca de $444 Millones de dólares
(«Five–Year Financial Summary», 2012).
• Walmart procesa mas de un millón de
transacciones de clientes cada hora
(Manyika et al., 2011 y Hagen et al.,
2013).
• Se estima que ha recolectado información
de cerca de 145 millones de
estadounidenses (Walmart, 2012).
• Walmart comparte información de los
usuarios en línea con más de cincuenta
socios (Walmart, 2012).
CASOS DE ÉXITO
Walmart hace uso de la inteligencia
predictiva para modelar y predecir el
comportamiento de sus clientes. Fue
un pionero en la adopción de
intercambio electrónico de datos para
conectar y optimizar su cadena de
suministros.
HISTORIA //
• Madurez del Big Data: para llegar a su plena madurez al Big Data le tomará alrededor de diez años.
• La importancia de los datos: los datos se convierten en los activos más importantes y valiosos en las
empresas.
• Mejorar la capacidad de análisis: la ampliación de las capacidades de análisis predictivos y prescriptivos
por medio de modelos estadísticos y las correlaciones.
• Nuevas fuentes de datos: la necesidad de integración de nuevas fuentes de datos con el fin de ampliar las
capacidades de análisis.
• Oportunidades de negocio: el uso del Big Data permite la creación de nuevas oportunidades de negocios.
• Personal para Big Data: existe una escasez en personal capacitado para el análisis de Big Data.
En este capítulo se evidencia el
comportamiento científico y tecnológico a
nivel mundial, las tendencias, tecnologías
emergentes y el nivel de madurez de los
hallazgos; además, las principales
instituciones líderes que pueden apoyar cada
área de oportunidad desde el ámbito
científico y tecnológico.
TENDENCIAS TECNOLÓGICAS EMERGENTES
• MapReduce: modelo de programación y una aplicación
asociada al procesamiento y la generación de grandes
conjuntos de datos.
• Cloud computing: aplicaciones entregadas como servicios a
través de Internet.
• Hadoop: framework que permite el procesamiento distribuido
de grandes conjuntos de datos a través de grupos de
ordenadores (Apache Software Fundation).
Métodos y sistemas para la utilización de BD NoSql
(Witten, 2013). Métodos para buscar datos
duplicados en una BD (Mcneill, 2013). Esquemas de
BD orientados por columnas (Motorola INC, 2013).
Sistemas de
gestión de
base de datos
Determinar la causalidad con el uso de Big
Data (2014). Algoritmos de aprendizaje de
máquinas más escalables (Wang, 2014).
Construcción de modelos relacionales jerárquicos
de grandes datos (Gopalakrishnan, 2013).
Algoritmos de
aprendizaje
de máquinas
Métodos para procesar y analizar los mensajes de
un servicio de mensajería (Nguyen, 2014).
Integración de BD no relacionales con BD
relacionales (Xue, 2014). Método para consultas en
BD no relacionales (Basak, 2014).
Integración
de bases de
datos
101227
465
778
1435
2248
525
4 10 23 22 47 74 64
0
500
1000
1500
2000
2500
2008 2009 2010 2011 2012 2013 2014
Canti
dad
Año
P. científica
Patentes
Frameworks basados en MapReduce para el
manejo de altas cargas de trabajo (Chen, 2013), la
implementación de algoritmos tradicionales bajo
el modelo de MapReduce (Srirama, 2013) y la
optimización de cada una de las fases del Map-
Reduce (Ahmad, 2013).
MapReduce
Procesamiento de datos en ambientes
computacionales en la nube (Ji, 2013),
benchmarking de sistemas de computación en la
nube para procesamiento de datos (Luo, 2013) y
MapReduce en ambientes virtualizados (Lei, 2013).
Cloud
Computing
Hadoop: sistemas distribuidos para tareas de
procesamiento de datos (Zhang, 2013) y
virtualización de ambientes distribuidos (Lei,
2013).
Hadoop
IBM MICROSOFT C GOOGLE INC SOFTWARE AG ACCENTURE G
35
12 11
76
35
31 3028 27
0
5
10
15
20
25
30
35
40
Madden S R Chaudhuri, S HellersteinJ.M.
Jagadish, HV.
Katz, R H
Índic
e H
Autores0 5 10 15 20
Database management systems
Clustering and grouping
Data base query procesing
preparing data for informationretrieval
Parallel procesing system
Cantidad de patentes
CLASIFICACIÓN DE PATENTES // ÍNDICE H //
020406080
100120140160
Can
tidad
• Cloud computing
• Análisis de
sentimientos.
• Análisis predictivos.
• Crece a demanda de
talentos para el análisis
de datos.
NIVEL DE MADUREZ DE BIG DATA
Lanzamiento BD Relacionales
Madurez BD Relacionales
Primer software de reportes de BD
Nace la WebBI – 1.0
BD Distribuidas
BI 2.0Herramientas de Data Warehouse
Saturación BD Relacionales
Análisis Predictivo
Bases de datos orientadas por
columnasCrecimiento datos no estructurados
Concepto Big data
Web 2.0Google File System
MapReduce
HadoopMongoDB
HiveCloudera
HBase
Internet de las cosas
Análisis Prescriptivo
Surge el término Big Data. según Roger (2005) se
refiere a los grandes conjuntos de datos que no
pueden ser procesados mediante sistemas de bases
de datos tradicionales.
La preocupación por analizar el creciente volumen y
variedad de los datos da origen a tecnologías como
Google file system y MapReduce.
Según Gartner (2013) al Big Data le tomará diez
años alcanzar el grado de madurez, debido al
nacimiento de nuevas tecnologías como el análisis
prescriptivo y el déficit de personal capacitado para
analizar e interpretar los datos.
A diferencia de las BD relacionales, en Big data no se identifica cuándo podría alcanzarse su etapa de saturación.
SATURACIÓN
Fuente: IDC Paper (2009), Gartner (2013), CASADO (2013), WINSHUTTLE (2014), Outliers
Collective (2011)
Mejora de las capacidades de venta de productos financieros, o no
financieros, a partir de patrones de compra o de interés mostrado en
determinados productos disponibles online; el control de fraude,
minimizando los riesgos de uso indebido de medios de pago y
la fidelización y retención de clientes, ofreciéndoles promociones y
ofertas comerciales adaptadas a sus necesidades y contexto.
BANCA Y
FINANZAS
PUBLICIDAD Y
MARKETING
MERCADO
RETAIL
TENDENCIAS DE INVESTIGACIÓN EN EL MERCADO
Optimización de la cadena de suministros, fidelización de clientes,
reducción de costos, monetización de la información y optimización
operacional.
Fortalecer canales existentes e implementar nuevos canales para el
relacionamiento con el cliente.
Realización de campañas de marketing con segmentación de clientes
y publicidad personalizada que permiten un crecimiento en ventas
con la recomendación de productos.
Evaluación e identificación de la eficiencia de las campañas de
marketing.
Salud
Análisis de las características de los pacientes, análisis de resultados
de los tratamientos con sus costos y análisis de patrones de
enfermedades.
Según la revista Forbes: «Big Data representa la posibilidad de
obtener mejores resultados y menores tasas de mortalidad para los
pacientes».
Técnicas que se basan en disciplinas como la estadística y la
algoritmia para analizar conjuntos de datos aplicables en una amplia
gama de industrias (Manyika et al., 2011). Estas técnicas permiten
predecir probabilidades futuras como riesgos financieros, ventas y
mortalidad, entre otros.
Algunas tecnologías:
Textanalytics API, Impala, RangeSpan –Google.
ANÁLISIS DE
DATOS
PROCESAMIENTO
DE DATOS
VISUALIZACIÓN
Técnicas para mejorar el rendimiento de computo, dividiendo un
problema grande en unos más pequeños. Técnicas como la
agrupación de datos son utilizadas en la segmentación de clientes,
identificación de trastornos en pacientes y comportamiento de las
personas y clasificación de música.
Algunas tecnologías:
Hadoop, Strom, Lambdoop, MapReduce, Cascading.
Herramientas para la representación clara, interactiva y en
tiempo real de datos provenientes de múltiples fuentes que
facilitan la comprensión de información.
Algunas tecnologías:
D3js, Processing, ggplot2, Tableau.
TENDENCIAS EN DESARROLLO TECNOLÓGICO
Conjunto de métodos que pueden detectar automáticamente
patrones en los datos y usarlos para predecir el futuro o tomar
decisiones en condiciones de incertidumbre (Murphy, 2012).
Algunas tecnologías:
Mahout, Weka, Google prediction API.
Insertar imagen
correspondiente a
la tendencia
La evolución de la microelectrónica, y actualmente de la
nanotecnología, ha permitido diseñar todo tipo de sensores para
medidas físicas, químicas y biológicas, capaces de digitalizar y
transmitir información a la red con buena resolución y fiabilidad y a
un costo cada vez menor (Ruiz, 2013).
Algunas tecnologías:
RFID, NFC, códigos de barras, códigos QR, framework APDuino.
Bases de datos no relacionales, escalables y de alto rendimiento que
facilitan el almacenamiento, la lectura y la escritura de una gran
cantidad y variedad de tipos de datos.
Algunas tecnologías:
Casandra, Hbase, MongoDB, Neo4j, NoSql, 1010data, big table, Hive.
APRENDIZAJE
DE
MÁQUINAS
INTERNET DE
LAS COSAS
ALMACENAMIENTO
TENDENCIAS EN DESARROLLO TECNOLÓGICO
MIT
Instituto de tecnología de Massachusetts
CSAIL: Laboratorio de ciencia computacional e inteligencia
artificial
Fuente: http://bigdata.csail.mit.edu/
AREAS DE INVESTIGACIÓN Y PUBLICACIÓN //
1.Plataformas de procesamiento de datos en paralelo: se
destacan SciDB, BlinkDB, y desarrollos de plataformas en la nube
incluyendo FOS (Factored Operating System) y Relational Cloud.
2.Algoritmos escalables: diseño de algoritmos para grandes
volúmenes de datos y el procesamiento de datos en paralelo.
3.Aprendizaje de máquinas: herramientas para el etiquetado y
clasificación de imágenes, procesamiento del lenguaje natural y
análisis de sentimientos.
4.Privacidad y seguridad: Crypt DB, un sistema de base de datos
que almacena información encriptada en la nube de manera que
no pueda ser desencriptada por terceros.
LÍDERES EN PUBLICACIONES CIENTÍFICAS
ALIADOS //
Universidad de California, Berkeley
Proyecto AMPLab: Algoritmos, máquinas y personas.
PRINCIPALES INSTITUCIONES DE APOYO - DESARROLLO CIENTÍFICO
• Aprendizaje de máquinas.
• Warehouse scale computer.
• Algoritmos escalables.
• Crowdsourcing.
Universidad Nacional (Bogotá): Grupo de Investigación en Minería de Datos.
• Sistemas de recomendación.
• Recuperación de información.
• Agrupación, clasificación,
predicción y asociación.
• Minería web.
Intel: Centro de Ciencia y Tecnología para Big Data.
• Bases de datos: Array-oriented
DBMSes, graph-based DBMSes.
• Algoritmos escalables.
• Herramientas de visualización.
• Optimización de arquitecturas
computacionales.
• Brown university
• MIT
• Portland State University
• University of Tennessee
• UC Santa Barbara
• University of Washington
• Amazon
• SAP
• Apple inc
• HP
• Pivotal
• Cisco
• Ericsson
• Yahoo
Grupo de investigación con clasificación A de Colciencias.
AREAS DE INVESTIGACIÓN Y
PUBLICACIÓN // DESCRIPCIÓN // ALIADOS //
Universidad de Antioquia:Grupo de investigación en TIC para la gestión y procesamiento de grandes volúmenes de datos.
• Data warehouse.
• Algoritmos de búsqueda de
similitud.
• Herramientas de visualización.
• Modelamiento matemático.
• Aprendizaje de máquinas.
Grupo de investigación con clasificación B de Colciencias.
IBM
El valor de la plataforma integrada de Big Data de IBM es su capacidad para el almacenamiento y análisis de datos estructurados y no estructurados al ritmo que el negocio lo requiere.
Fuente: www.ibm.com
AREAS DE INVESTIGACIÓN Y PUBLICACIÓN //
LÍDERES EN DESARROLLO TECNOLÓGICO
ALIADOS//
1. Procesamiento de datos en paralelo - mapreduce adaptativo:
mejora el rendimiento utilizando de forma dinámica múltiples
particiones de datos (splits). En él los mappers pueden adaptarse
a su entorno y tomar decisiones eficientes (Balmin y Jose, 2012;
Bavishi y Sanket, 2013 y Pednault y Helghts, 2013).
2. Evolución de los datos y generación de esquemas no
relacionales: la evolución de base de datos a menudo se desea
cuando se producen cambios en los datos o una carga de trabajo
de consulta (Wang y Zou, 2014; Jose et al., 2012 y Davis, Gruhl y
Jose, 2011).
3. Algorítmica paralela mediante el uso de un gran número de
computadoras (Wang, Manor y Couso, 2009; Spandikow, 2008 y
Kwok y Perrone, 2008).
La plataforma Big Data de analítica y servicios de SAP ayuda a extraer valor del negocio real en tiempo real de grandes conjuntos de información.
PRINCIPALES INSTITUCIONES DE APOYO - DESARROLLO TECNOLÓGICO
• Plataformas de análisis de
datos no estructurados para la
gestión de procesos,
transacciones y predicciones
sobre los movimientos de una
empresa.
Google Prediction API ayuda a analizar datos agregando características a las aplicaciones como: análisis de los sentimientos del cliente, detección de spam, identificación de actividades sospechosas y muchas más.
• Aprendizaje de máquina.
• Mapreduce.
• Tratamiento de ambientes de
datos no estructurados.
• Análisis de terabytes de datos
en segundos (Google
BigQuery).
El enfoque de Microsoft para BigData ha asegurado la relevancia de su plataforma de Windows para las organizaciones de la era web, y hace de sus servicios en la nube una opción competitiva para los negocios de datos.
• Distribución Hadoop (Microsoft
Azure HDInsight).
• Soluciones de almacenamiento.
• SQL Server.
TÓPICOS EN LOS QUE
ESTÁ TRABAJANDO //DESCRIPCIÓN // ALIADOS //
1. Técnicas para determinar la edad y género de un consumidor
(US20140156415).
2. Generación de publicidad dirigida para viajeros (US20140156394).
3. Calendarios recordatorios basados en datos del consumidor
(US20140149236).
4. Método para notificar a un cliente la reducción de precios para sus
productos de interés (US20140149214).
• Método de sugerencia de recetas basado
en patrones y preferencias alimenticias
de los clientes (US20140149239).
• Sistema de determinación de fraude en
tiempo real para las tarjetas de pago
electrónico (US8738529).
• Transferencia de facturas digitales a
dispositivos móviles (US8738454).
• Sistema y método para realizar
recomendaciones basados en datos de
redes sociales (US20140089131).
Walmart cuenta con un departamento de
investigación y desarrollo: Walmartlabs.
Cuenta con más de 320 patentes, de las cuales
cerca de 160 se relacionan con el análisis y
procesamiento de datos, donde su principal
enfoque son los clientes.
Patentes destacadasOtras patentes
LAS EMPRESAS Y LAS PATENTES
• Big data en la universidad: entre los principales autores, con mejor índice h, se destacan Madden,
Chaudhuri, Hellerstein, Jagadish y Katz; todos pertenecientes a universidades estadounidenses.
Entre los primeros diez autores con mejor índice h se destacan tres investigadores del Instituto de
Tecnología de Massachusetts (MIT): Madden, Brynjolfsson y Stonebreaker, consolidando esta institución
como líder de investigación en el tema.
• Producción científica: el 70% de la producción científica en el tema se concentra en los últimos tres años
(2012, 2013 y 2014), siendo el 2013, hasta el momento, el de mayor crecimiento con un promedio de 41%
en las bases de datos Scopus y Web of Science.
• Patentes: al igual que en la producción científica se evidencia un crecimiento continuo de registro de
patentes en los últimos tres años. En estos se han registrado el 49,5% del total de patentes en Big Data.
En los primeros seis meses del 2014 se ha patentado el 86,4% del total que se registró en todo el 2013.
El 42% de las patentes se concedieron a diez titulares.
El 27% del mercado de patentes se concentra en tres grandes empresas tecnológicas como lo son IBM,
Google y Microsoft, siendo IBM la empresa con mayor número de patentes, con el 15% del total general.
En este capítulo se identifican retos y
oportunidades para esta área de interés,
considerando aspectos como capacidad requerida,
tiempo (corto, mediano y largo plazo), mercado
potencial, entre otros. Se realiza la identificación
de la situación actual de Medellín desde sus
empresas y grupos de investigación, con el fin de
revisar qué hacer para afrontar estas dinámicas.
4.OPORTUNIDADES Y
RETOS GENRALES PARA
EL ÁREA DE OPORTUNIDAD
OPORTUNIDADES
1.
2.
3.
4.Salud: estudiar las características de los pacientes, resultados de los tratamientos
con sus costos y análisis de patrones de enfermedades. Según la revista Forbes: «Big
Data es una oportunidad para los innovadores y todos los que se preocupan por la
salud; representa la posibilidad de obtener mejores resultados y menores tasas de
mortalidad para los pacientes».
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE OPORTUNIDAD
Mercado retail: optimización de la cadena de suministros, fidelización de clientes,
reducción de costos, monetización de la información y optimización operacional.
Publicidad y marketing: segmentación de clientes, publicidad personalizada,
crecimiento en ventas y recomendación de productos.
Banca y finanzas: creación de una empresa centrada en el cliente, optimización de
la gestión de riesgos empresariales, detección de fraudes, optimización operacional y
oferta de productos personalizados (IBM, 2013).
1.MERCADO RETAIL
• Extraer valor de la información y
fuentes de datos ya existentes (datos
transaccionales y cadenas de
suministros).
• Identificar el valor potencial a obtener
mediante el acceso y el análisis de
nuevas fuentes de datos.
• Capacidades analíticas sobre la
información. Herramientas de análisis,
habilidades para sacar mayor provecho
a estos datos.
• Fortalecer canales existentes e
implementar nuevos canales para el
relacionamiento con el cliente
(tiendas, tiendas en línea, e-mail,
apps, etc.).
CAPACIDADES REQUERIDAS TIEMPO AL MERCADO JUGADORES ACTUALES
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE OPORTUNIDAD
Se estima que el 53% de los esfuerzos realizados en el mercado retail mediante el uso de Big Data están enfocados en lograr
resultados centrados en el cliente. El 47% restante busca la optimización operacional, nuevos modelos de negocio y la gestión
de riesgos y costos (IBM, 2012). Estos esfuerzos están dirigidos a analizar datos internos que han sido recolectados por años
pero nunca han sido estudiados.
Corto plazo: identificación del valor
de los datos del mercado domestico,
integración de fuentes de datos en los
canales existentes, implementación de
herramientas para análisis de similitud
y recomendaciones.
Mediano plazo: fortalecimiento de los
canales existentes e integración de
nuevas fuentes de datos, integración
con plataformas de inteligencia de
negocios.
Largo plazo: desarrollo de nuevos
algoritmos de recomendación y
similitud, implementación de análisis
predictivos y prescriptivos.
• IBM
• NGDATA
• RetailNext
• Splunk
• Horton works
• Askuity
Referentes
Locales
• Senseta
• Datalytics
• Grupo de
investigación
ingeniería y
software UdeA
• Pronóstica
• iData
• Grupo de
investigación
MIDAS UNAL
• Las empresas cuenta con experiencia en
Inteligencia de Negocios (BI).
• Se tienen numerosas y diversas fuentes
de datos (redes sociales, cadenas de
suministros, foros, reviews).
• Aumento en la cobertura de internet.
• Crecimiento en la adopción de
dispositivos móviles inteligentes.
• Crecimiento en un 40% en comercio
electrónico con respecto al 2012.
¿ CÓMO ESTÁ MEDELLÍN? BARRERAS POTENCIALES
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE OPORTUNIDAD
MERCADO RETAIL
• Recopilación de la información,
tratamiento y administración de datos.
• Disposición al cambio.
• Capital humano, falta de personal
capacitado y capacitación al personal
existente.
• Conocimiento sobre la tecnología.
• Identificación del retorno de la
inversión.
Busca ofrecer una experiencia de compra inteligente a través de recomendaciones basadas en compras previas y en
potenciales compras de acuerdo a las preferencias y búsquedas de los clientes a través de cada uno de los canales de
mercadeo, sitios web, aplicaciones móviles, puntos de venta, redes sociales, etc. Además de la fidelización mediante ofertas,
cupones y promociones.
1.
PUBLICIDAD Y MARKETING
CAPACIDADES REQUERIDAS TIEMPO AL MERCADO JUGADORES ACTUALES
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE OPORTUNIDAD
• Análisis de nuevas fuentes de datos.
(redes sociales, foros, reviews,
etc.).
• Capacidad de ofrecer publicidad
personalizada y publicidad geo-
referenciada.
• Adquisición y fidelización de nuevos
clientes.
• Evaluación e identificación de las
campañas de marketing más
eficientes a través del uso de
modelos.
• Capacidad para modelar patrones de
comportamiento de los clientes.
Su objetivo se basa en adquirir nuevos clientes mediante el mejoramiento de las campañas de marketing, reducir los costos y
aumentar la efectividad mediante la personalización de anuncios e individualización de estrategias de marketing, fidelización
y prevención de pérdida de clientes.
• IBM
• Intel
• Flurry
• Metamarkets
• Rocket fuel
• Bloom reach
Referentes
Locales
• iData
• Datalytics
• Pronóstica
Corto plazo: integración de nuevas
fuentes de datos, implementación de
algoritmos de minería de opinión,
implementación de herramientas para
análisis de sentimientos,
comportamiento y similitud.
Mediano plazo: integración con
plataformas de inteligencia de
negocios, implementación de
herramientas de procesamiento de
lenguaje natural, implementación de
análisis predictivos y prescriptivos.
Largo plazo: desarrollo de nuevos
algoritmos de análisis de sentimientos
y recomendación, implementación y
desarrollo de algoritmos para
publicidad dirigida.
2.
¿ CÓMO ESTÁ MEDELLÍN? BARRERAS POTENCIALES
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE OPORTUNIDAD
PUBLICIDAD Y MARKETING
• Uso de nuevas fuentes de datos.
• Se ha identificado el potencial valor
en el uso de estas nuevas
herramientas y capacidades.
• Las empresas cuentan con
experiencia en análisis de
sentimientos.
• Aumento en la cobertura de internet.
• Políticas de uso de la información y
privacidad de los datos.
• Conocimiento sobre la tecnología.
• Capital humano, falta de personal
capacitado, capacitación al personal
existente.
• Identificación del retorno de la
inversión.
Busca brindarle a los clientes una experiencia consistente a través de cada uno de los canales de comunicación y estrategias
de marketing personalizadas, basadas en sus patrones de comportamiento.
2.
BANCA Y FINANZAS
• Personas con amplia experiencia en
estadística, BI, ciencias de la
computación, además gerentes y
analistas que sepan cómo operar los
proyectos de las empresas desde el
punto de vista del big data.
• Distribución de los datos dentro de
la organización.
• Dimensionar una Infraestructura,
unas arquitecturas y tecnologías de
big data.
CAPACIDADES REQUERIDAS TIEMPO AL MERCADO JUGADORES ACTUALES
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE OPORTUNIDAD
Sector que está en condiciones de beneficiarse con mucha fuerza a partir del big data en forma de transacciones, registros de
servicio al cliente, correspondencia, etc., para obtener una visión más clara acerca de su negocio y generar ventaja
competitiva.
Capgemini 2014 the financial brand (Foro IT BEEVA, 2014) (Foro IT BEEVA, 2014)
• IBM
• Palantir
• Actian
• Amazon
• Teradata
• Pivotal
Referentes
Locales
• iData
• Flagsoluciones
• Perceptio
• Senseta
Corto plazo: La mayoría de los bancos
aún se están centrando en los pilotos y
experimentos.
• Exploración 38%
• Experimentación 25%
Mediano plazo: Sólo el 37% de los
bancos tienen una experiencia práctica
de Big data.
• Expansión 25%
• Despliegue 12%
3.
Si bien todos los sectores tendrán que superar barreras para capturar valor, dichas barreras son más altas para unos que para
otros. Por ejemplo, la captura de valor en el cuidado de la salud se enfrenta a desafíos dada la inversión relativamente baja
de IT que se realiza hasta ahora. Otros sectores como seguros y finanzas pueden tener más bajos grados de barreras que
superar, precisamente por las razones opuestas y por la disponibilidad de los datos.
¿ CÓMO ESTÁ MEDELLÍN? BARRERAS POTENCIALES
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE OPORTUNIDAD
• Reglamentos y aspectos legales:
capturar valor dentro de un marco
regulatorio y legal que está en
constantes cambios.
• Captura de valor potencial.
• La escasez de talento de análisis, silos
organizacionales y arquitectura.
• Presupuesto disponible limitado e
identificación del retorno en la
inversión.
(McKinsey Global Institute analysis)
Foro IT BEEVA the financial brand
• Uso de herramientas de inteligencia de
negocios y análisis de datos dando
soluciones de valor en sectores de banca
y retail.
• Herramientas propias para la
inteligencia de negocios.
• Diseño, arquitectura, modelo y
configuración de la bodega de datos.
• Conocimiento de la cadena de valor.
• Auditoría en implementación.
• Acompañamiento en la gestión del
cambio.
• Mejora de procesos, detección de
riesgos y toma de decisiones.
BANCA Y FINANZAS 3.
SALUD
Según el reporte de 2011 de McKinsey Global Institute, en US, usando el Big Data de forma creativa y eficaz,
impulsando la eficiencia y la calidad se logró una reducción de costos aproximada del 8% anual (US$300.000
millones) en atención médica.
• Herramientas para la digitalización
de imágenes y análisis de texto.
• Integración con otras plataformas
como teléfonos inteligentes y
sensores.
• Herramientas de procesamiento del
lenguaje natural (NLP) y aprendizaje
de máquinas.
• Infraestructura de datos escalable.
• Personal capacitado para
implementar algoritmos y
herramientas para el análisis de
grandes cantidades de datos.
CAPACIDADES REQUERIDAS TIEMPO AL MERCADO JUGADORES ACTUALES
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE OPORTUNIDAD
• Apixio
• mHealt
• eHealthMe
• QualcommLife
• One Health
• Healt fidelity
• Explorys
• Predixion
software
• Fatual
Referentes
Locales
• Grupo de investigación:
ingeniería y software.
Universidad de Antioquia
Corto plazo: integración de fuentes
de datos existentes, herramientas para
análisis de imágenes y texto.
Mediano plazo: integración con
plataformas de inteligencia de
negocios, implementación de
herramientas de procesamiento de
lenguaje natural, implementación de
análisis predictivos e implementación
de algoritmos de análisis de similitud.
Largo plazo: desarrollo de nuevos
algoritmos de similitud e
implementación de herramientas de
análisis prescriptivos.
4.
¿ CÓMO ESTÁ MEDELLÍN? BARRERAS POTENCIALES
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE OPORTUNIDAD
La empresa Bain Capital Ventures y un grupo de inversionistas de Silicon Valley consiguieron US$13 millones
para invertir en el estudio de soluciones de Big Data para estimar con precisión los riesgos del paciente y
predecir los costos de su atención (Mark Sullivan, 2014).
• Información parcialmente
digitalizada.
• Aumento del uso de las historias
clínicas electrónicas.
• No hay integración con otras fuentes de
información.
• Historias clínicas digitalizadas
insufientes.
• Imagenes no digitalizadas.
• No hay facilidad de acceso al contenido
clínico de los registros electrónicos de
salud.
SALUD 4.
OPORTUNIDADES Y RETOS GENRALES PARA EL ÁREA DE OPORTUNIDAD
NU
EV
OA
DYA
CEN
TE
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE OPORTUNIDAD
Crear alianzas entre
quien conoce el negocio,
los propietarios de los datos y
los científicos de datos.
Capacitar al personal en técnicas de Big Data.
Potencializar el mercado doméstico como
estrategia para fortalecer las capacidades
del uso de Big Data en sectores de
publicidad,
marketing, salud,
finanzas y mercado
retail.
NUEVOINCREMENTALEXISTENTE
EXIS
TEN
TE
Incursionar en el mercado internacional con la oferta de servicios
en los que se ha especializado.
Incursionar en el mercado latinoamericano,
principalmente en empresas con un corte de negocio
similar al mercado doméstico, aprovechando la
experiencia adquirida y las capacidades acumuladas.
Contar con grupos
especializado de
científicos de datos
para el análisis y
visualización de
datos.
Creación de nuevos
algoritmos para el
procesamiento y el
análisis de los datos.
Desarrollo de nuevos
servicios y software.
Integración con
herramientas de
inteligencia de
negocios con
herramientas de Big
Data.
Continuar con la
capacitación de
científicos de datos
en las universidades
para las empresas.
MATRIZ DE OPORTUNIDAD(M
ERCAD
O)
(PRODUCTOS / SERVICIOS)
1.
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE
OPORTUNIDAD
RECOMENDACIONES
1. Uso de sistemas y algoritmos de recomendación y similitud para mejora de ítems sugeridos.
2. Cultura de aprovisionamiento del dato: recolectar información de nuevas fuentes de datos
para su posterior clasificación, análisis y extracción de valor.
3. Gestión de la infraestructura: manipulación de los silos de datos para que las
organizaciones sean capaces de analizar la información y extraer datos concluyentes.
4. Capacitación de ingenieros: nacimiento de un profesional que conozca y genere un uso al
Big Data. Profesionales con habilidades en campos como la informática, las matemáticas, la
estadística y los negocios.
5. Entendimiento y acompañamiento a las empresas para incursionar servicios de Big Data en la
oferta local.
Corto plazo
Identificación de valor: qué valor agregado se le entrega a las empresas que implementan soluciones
basadas en Big Data. El objetivo de estas soluciones a corto, mediano y largo plazo. Cómo traducir
todo esto en una mejor toma de decisiones.
Recopilación de la información: integración de nuevas fuentes de datos. Organización y análisis de
datos en menor tiempo para generar mayor valor dentro de cada una de las estructuras de negocio.
Además de la integración de esta nueva información de valor con los sistemas de gestión de
información de las empresas.
1 .
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE
OPORTUNIDAD
RECOMENDACIONES
Mediano plazo
6. Capacitación de personal en evaluación y recomendación de modelos de negocio y
generación de valor.
7. Formar científicos de datos a nivel de MSc.
8. Mejoramiento de recomendación para el establecimiento de los modelos de negocio.
9. Capacitación en Business Intelligence.
10. Formación de científicos de datos con PhD.
11.Desarrollar e implementar nuevos algoritmos de predicción.
12.Desarrollar nuevos servicios enfocados en el cliente mediante el uso de información extraída
de los datos analizados.
Largo plazo
1.
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE
OPORTUNIDAD
EXPERTOS CONSULTADOS
• John Freddy Duitama Muñoz, PhD - Universidad de Antioquia. / [email protected]
• Rocio Palmeh P. – Choucair / [email protected], [email protected]
• Diana M Tangarife – Flag Soluciones / [email protected]
• Ricardo Rivera – Metacog.com / [email protected]
• Hermann Rodriguez T. – PersonalSoft / [email protected]
• Cesar M. Pachon - Linden Colombia / [email protected]
• Victor Garcia – Perceptron / [email protected]
• Rafael Álvarez - Fluid / [email protected], [email protected]
REFERENCIAS
• Abad, S. (2014). BIG DATA EN NÚMEROS.
• Armbrust, M.; A. D. Joseph; R. H. Katz y D. A. Patterson (2009). Above the Clouds : A Berkeley View of Cloud Computing.
• Association. Feinleib, D. (2012). The Big Data Landscape. Forbes.com. Retrieved from
http://www.forbes.com/sites/davefeinleib/2012/06/19/the-big-data-landscape/
• Bansi Nagji and Geoff Tuff (2012). Managing Your Innovation Portfolio. Harvard Business Review.
• Barranco Fragoso, R. (2012, June 18). ¿Qué es Big Data? Recuperado Abril 07, 2014, de
http://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/#ibm-pcon
• Basker, E. (2007). The Causes and Consequences of Wal-Mart’s Growth. Journal of Economic Perspectives, 21(3), 177–198.
• BBVA Innovation Center. (2013). Big Data Es hora de generar valor de negocio con los datos. Retrieved from
https://www.centrodeinnovacionbbva.com/documentos/pdfs/bigdata_spanish.pdf
• Big Data O’Reilly media (s.f.). Retrieved from http://strata.oreilly.com/2010/01/roger-magoulas-on-big-data.html
• Burnett, S. (2010). Vertica Analytic Database (pp. 1–8).
• CASADO, R. (2013). The three generations of Big Data processing. Retrieved from
http://www.bigdataspain.org/2013/conference/the-three-generations-of-big-data-processing
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE
OPORTUNIDAD
REFERENCIAS
• Center for Media Justice, ColorofChange, & Sum of Us. (2013). Consumers, Big Data, and Online Tracking in the
Retail Industry. A case study of Walmart. Oakland.
• Christian Terwiesch and Karl Ulrich (2008). Managing the opportunity portfolio. R&D/BUSINESS STRATEGY.
septiembre-octubre.
• Corporation (Vol. 2007, pp. 1–16). Retrieved from http://idcdocserv.com/1414
• Dan Riskin, M. D. (s.f.). The Next Revolution in Healthcare. Recuperado de
http://www.forbes.com/sites/singularity/2012/10/01/the-next-revolution-in-healthcare/
• Dean, J. y S. Ghemawat (2004). MapReduce: Simplified Data Processing on Large Clusters. In OSDI (pp. 137–150).
USENIX Association.
• Felfernig, A., & Friedrich, G. (2007). Recommender Systems.
• Five–Year Financial Summary. (n.d.). Retrieved from http://www.walmartstores.com/sites/annual-
report/2012/financials.aspx
• Gantz, J. y D. Reinsel (2012). THE DIGITAL UNIVERSE IN 2020: Big Data, Bigger Digital Shadows, and Biggest Grow
the in the Far East. Sponsored by EMC Corporation (Vol. 2007, pp. 1–16).
• Ghemawat, S.; H. Gobioff y S.-T. Leung (2003). The Google File System. In Proceedings of the Nineteenth ACM
Symposium on Operating Systems Principles (pp. 29–43). New York, NY, USA: ACM. doi:10.1145/945445.945450
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE
OPORTUNIDAD
• Hagen, C., Khan, K., Ciobo, M., Miller, J., Wall, D., Evans, H., & Yadav, A. (2013). Big Data and the Creative
Destruction of Today’s Business Models. ATKearney. Retrieved from http://www.atkearney.com/strategic-it/ideas-
insights/article/-/asset_publisher/LCcgOeS4t85g/content/big-data-and-the-creative-destruction-of-today-s-
business-models/10192
• Hewlett-Packard (2011). HP Completes Acquisition of Vertica Systems, Inc. Recuperado el 07 de mayo de 2014,
de http://www8.hp.com/us/en/hp-news/press-release.html?id=907883&pageTitle=HP Completes Acquisition of
Vertica Systems, Inc.#.U2zUgPl5NSF
• HP to Acquire Vertica: Customers Can Analyze Massive Amounts of Big Data at Speed and Scale Combination
enhances HP capabilities for information optimization. (2011). Retrieved May 11, 2014, from
http://h30261.www3.hp.com/phoenix.zhtml?c=71087&p=irol-newsarticle&ID=1528593
• IBM (2012). IBM Anual Report (p. 144). New York.
• IBM. (2012). Analytics : The real-world use of big data in retail.
• IBM. (2013). Big data Industry banking
• Joan Cornet Prat (s.f.). Empresas tecnológicas y salud, la gran oportunidad.
http://www.mobilehealthglobal.com/in-the-news/articulos/23/empresas-tecnologicas-y-salud-la-gran-
oportunidad
• Kart, L., Heudecker, N., & Buytendijk, F. (2013). Survey Analysis: Big Data Adoption in 2013 Shows Substance
Behind the Hype. Gartner. Stamford.
• Kelly, J. (2012). Big Data Market Size and Vendor Revenues. Retrieved from Wikibon Report.
http://wikibon.org/wiki/v/Big_Data_Market_Size_and_Vendor_Revenues
REFERENCIAS
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE
OPORTUNIDAD
• Kelly, J. (2013). Big Data Vendor Revenue and Market Forecast 2012-2017. Retrieved from Wikibon Report
http://wikibon.org/wiki/v/Big_Data_Vendor_Revenue_and_Market_Forecast_2012-2017
• Kelly, J. (2014). Big Data Vendor Revenue and Market Forecast 2013-2017. Retrieved from Wikibon Report
http://wikibon.org/wiki/v/Big_Data_Vendor_Revenue_and_Market_Forecast_2013-2017
• Koetsier, J. (2013). Cash in the clouds: Google says CFOs believe in cloud computing.
• Lamb, A.; M. Fuller; R. Varadarajan; N. Tran; B. Vandiver; L. Doshi y C. Bear (2012). The Vertica Analytic
Database : C-Store 7 Years Later. Proceedings of the VLDB Endowment, 5(12), 1790–1801.
• Laney, D. (2013). Big Data and Analytics Strategy Essentials. Stamford: Gartner.
• Linden, G., Smith, B., & York, J. (2003). Amazon Item-to-item collaboration filtering, (February).
• Magoulas, R. (2005). Big Data O’Reilly media. Retrieved from http://strata.oreilly.com/2010/01/roger-magoulas-
on-big-data.html
• Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R., Roxburgh, C., & Hung Byers, A. (2011). Big data: The
next frontier for innovation, competition, and productivity (p. 19). Retrieved from
http://www.citeulike.org/group/18242/article/9341321
• McKinsey and Company, McKinsey Global Institute (2011). «Big Data: The next frontier for innovation,
competition and productivity».
• Michael Stonebraker (s.f.). Recuperado el 08 de mayo de https://www.csail.mit.edu/user/1547
• MIT. (2008). Michael Stonebraker. Retrieved May 10, 2014, from https://www.csail.mit.edu/user/1547
REFERENCIAS
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE
OPORTUNIDAD
REFERENCIAS
• Nagji. B. & Tuff, G. (2012). Managing Your Innovation Portfolio. Harvard Business Review. Retrieved May 02,
2014, from http://hbr.org/2012/05/managing-your-innovation-portfolio/ar/1
• Oracle (2014). Big Data & Analytics, 39(6), NP. doi:10.1093/chemse/bjt099.
• Outliers Collective. (2011). BigData A Brief History. Retrieved from http://www.visualizing.org/full-screen/52776
• Palantir (2013). Palantir cyber. Palo Alto: Palantir Technologies.
• Pang, B., & Lee, L. (2008). Opinion Mining and Sentiment Analysis. Foundations and Trends® in Information
Retrieval, 2(1–2), 1–135. doi:10.1561/1500000011
• Prickett Morgan, T. (2011). HP buys Vertica for data analytics. The Register. Londres. Recuperado el 7 de mayo de
2014, de http://www.theregister.co.uk/2011/02/14/hp_buys_vertica/
• Ruiz, J. A. C. (2013). BIG DATA EN LOS ENTORNOS DE DEFENSA Y SEGURIDAD, 124.
• Russom, P. (2013). Integrating Hadoop into business intelligence and data warehousing.
• Sagiroglu, S.y D. Sinanc (2013). Big data: A review. In International Conference on Collaboration Technologies and
Systems (CTS) (pp. 42–47). San Diego: IEEE, ACM. doi:10.1109/CTS.2013.6567202
• Takahashi, D. (2014). Western Union uses big data to stop wire transfer fraud. Retrieved July 20, 2014, from
http://venturebeat.com/2014/05/21/western-union-uses-big-data-to-stop-wire-transfer-fraud/
• TechAmerica Foundation. (2012). Demystifying Big Data. A practical Guide To Transforming The Business of
Government. Washignton DC.
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE
OPORTUNIDAD
REFERENCIAS
• Terwiesch, C. & Ulrich, K. (2008). Managing the opportunity portfolio. Research Technology Management, 51 (5),
27-38.
• Vertica (2010). The Vertica Analytic Database Technical Overview White Paper. Cambridge (MA).
• Vertica. (2014). Customers. Retrieved May 11, 2014, from http://www.vertica.com/customers/
• Walmart (2012). Walmart Announces New Search Engine to Power Walmart.com. Retrieved from
http://www.walmartlabs.com/press-releases/walmart-announces-new-search-engine-to-power-walmart-com/
• Walmart (2013). Retrieved from http://www.walmartstores.com/sites/annual-report/2012/financials.aspx
• Walmart (2013). Semantic Search Technology Increases Shopper Conversion Rate. Retrieved from
http://noticias.walmart.com/news-archive/2012/08/30/walmart-announces-new-search-engine-to-power-
walmartcom
• WINSHUTTLE (2014). Big Data and the History of Information Storage. Retrieved from
http://www.winshuttle.com/big-data-timeline/
OPORTUNIDADES Y RETOS GENERALES PARA EL ÁREA DE
OPORTUNIDAD