desmitificando el big data por logtrust

49
desmitificando BIG DATA Qué es Big Data Por qué surge Para qué sirve El Factor Visualización Conclusiones

Upload: logtrust

Post on 15-Aug-2015

67 views

Category:

Data & Analytics


0 download

TRANSCRIPT

Page 1: Desmitificando el Big Data por Logtrust

desmitificando

BIG DATA•Qué es Big Data•Por qué surge•Para qué sirve•El Factor Visualización•Conclusiones

Page 2: Desmitificando el Big Data por Logtrust

Data

Ware

hou

se

BIG DATAData Mining

Business Intelligence

QM

F

ETL

Page 3: Desmitificando el Big Data por Logtrust

BIG DATA

Web 2.0

Efecto:2000.COM

Data

Ware

hou

se

Data MiningBusiness Intelligence

Page 4: Desmitificando el Big Data por Logtrust

Herramientas CASE

Ori

en

tació

n a

Ob

jeto

s

Downsizing

RA

D

Web 2.0

Efecto:2000.COM

Data

Ware

hou

se

Data MiningBusiness Intelligence

Cliente/ServidorCentro de Información

Linux vs Windows

Windows vs OS/2BIG DATA Rightsizing

OS/2 vs MS/DOS

Unix vs Mainframe

Relacional vs Jerárquica

Arq

uit

ectu

ra S

AA

Mc v

s e

very

thin

g

Programación Estructurada

Teleproceso

On

Lin

e

XML

En

tid

ad

/Rela

ció

n

Data Mart

Metodología

B.Datos Relacional

Method/1

B.D

ato

s J

erá

rqu

ica

MainframeC

od

igo s

pag

hett

i

Page 5: Desmitificando el Big Data por Logtrust

Herramientas CASE

Ori

en

tació

n a

Ob

jeto

s

Downsizing

RA

D

Web 2.0

Efecto:2000.COM

Data

Ware

hou

se

Data MiningBusiness Intelligence

Cliente/ServidorCentro de Información

Linux vs Windows

Windows vs OS/2BIG DATA Rightsizing

OS/2 vs MS/DOS

Unix vs Mainframe

Relacional vs Jerárquica

Arq

uit

ectu

ra S

AA

Mc v

s e

very

thin

g

Programación Estructurada

Teleproceso

On

Lin

e

XML

En

tid

ad

/Rela

ció

n

Data Mart

Metodología

B.Datos Relacional

Method/1

B.D

ato

s J

erá

rqu

ica

MainframeC

od

igo s

pag

hett

i“Internet of Things”

Próximamente en sus pantallas:

Page 6: Desmitificando el Big Data por Logtrust

“El futuro descansa en diseñar y vender computadoras que la gente no se de cuenta que son computadoras”

Adam Osborne, 1983

“La mejor manera de predecir el futuro es inventarlo”

Peter F. Drucker

“640 K deberían ser suficientes para cualquiera”

Bill Gates, 1981

Page 7: Desmitificando el Big Data por Logtrust

Doug Laney:

Big data son activos de información de gran volumen, alta velocidad de crecimiento y gran variedad de formatos, que exigen formas innovadoras de proceso de información, para una mejor comprensión y toma de decisiones.

Page 8: Desmitificando el Big Data por Logtrust

[Otras definiciones/reflexiones menos formales]

“Big Data es como el sexo adolescente: todos hablan de él, nadie sabe realmente cómo hacerlo y todos piensan que los demás lo hacen...”Frase atribuída a Dan Ariely

“Palabra Técnica de moda que todo el mundo usa y nadie entiende muy bien”http://www.languagemonitor.com

“Big Data: hemos pasado de no saber qué es, a que todo el mundo proclame que tiene uno, sin que en el intermedio haya ocurrido nada relevante…”Javier Valdés - Logtrust

Page 9: Desmitificando el Big Data por Logtrust

Siempre hay quien lo confunde con sus herramientas…

Page 10: Desmitificando el Big Data por Logtrust

También hay quien lo identifica con:Big Data te vigila…

Page 11: Desmitificando el Big Data por Logtrust

También se dice: Big Data is dead…

Según Gartner, el término ha llegado al “Máximo de inflacción de expectativas”

Page 12: Desmitificando el Big Data por Logtrust

Tendemos a sobrevalorar el impacto de la tecnología en el corto plazo….y a infravalorarlo en el largo.

Page 13: Desmitificando el Big Data por Logtrust
Page 14: Desmitificando el Big Data por Logtrust

“Se abusa del término Big Data y sus famosas 3 V. Ya hay quien lo detesta y considera que su simple aparición en una conversación o texto es síntoma de falta de rigor…”“Big Data es una de los escasos ejemplos de tecnologías que se definen por ‘el problema’ y no por ‘la solución’. Esa es una de las razones del abuso de tópicos y conceptos sin verdadero significado real.”

y sin embargo…

Page 15: Desmitificando el Big Data por Logtrust

Los hechos…

Page 16: Desmitificando el Big Data por Logtrust

Nuevo término: Datification

Page 17: Desmitificando el Big Data por Logtrust

Nuevo término: Datification

Page 18: Desmitificando el Big Data por Logtrust

El crecimiento de Internet

27.483 PB/mesSi se almacenaran en DVD estándar y se pusieran juntos, medirían la distancia de la Luna a la Tierra… ida y vuelta.

http://www.evolutionoftheweb.com/

Page 19: Desmitificando el Big Data por Logtrust

Repasando…Kilobyte (KB)

103

megabyte (MB)

106

gigabyte (GB)

109

terabyte (TB)

1012

petabyte (PB)

1015

exabyte (EB)

1018

zettabyte (ZB)

1021

yottabyte (YB)

1024• Google procesa sobre 20 petabytes de datos cada día

• Filmar 100 años de vida de una persona en alta definición (10 megapíxels, 50 fotogramas por segundo) ocuparía 0,5 petabytes.

• Facebook tiene 60 mil millones de imágenes, lo que supone 1,5 petabytes de almacenamiento y crece a un ritmo de 220 millones de imágenes por semana.

Page 20: Desmitificando el Big Data por Logtrust

Espectacular caída de costes de almacenamiento…

…entramos en la Era Petabyte

Page 21: Desmitificando el Big Data por Logtrust
Page 22: Desmitificando el Big Data por Logtrust

Datos no estructurados, no catalogados y sin explorar que se encuentran en los repositorios de datos y que aún no han sido analizados ni procesados.

Nuevo término:Dark Data

Datos conocidos

Datos desconocidos,se sabe que existen

Datos desconocidos,No se sabe que existen

Big Data

Page 23: Desmitificando el Big Data por Logtrust
Page 24: Desmitificando el Big Data por Logtrust
Page 25: Desmitificando el Big Data por Logtrust

Factores relevantes:

La información no operativa (Dark Data) podría ayudar a tomar decisiones.Poder tomar decisiones antes que los demás es una verdadera ventaja competitiva .

•Integrar no solo información operativa•Guardar terabytes de información por día•Hacer consultas sobre ellos•Correlaciones•Hacerlo todo en tiempo real•Y disponer de esta información de forma permanente y longeva

¿ Cómo lo absorbemos?

Por lo tanto necesitaríamos:

Page 26: Desmitificando el Big Data por Logtrust

Asimilación de la información

El número de conceptos simultáneos que podemos asimilar, oscila entre 5 y 9.( 7+- 2 )

George A. Miller

¿ Cuanto hace que se rebasó el límite ?

Page 27: Desmitificando el Big Data por Logtrust

Pero no toda la información se procesa de la misma manera…Hay modalidades que se asimilan de forma directa, prácticamente sin necesidad de reflexión

Page 28: Desmitificando el Big Data por Logtrust

Visualización

Page 29: Desmitificando el Big Data por Logtrust

Ejemplo de Visualización:• Aparecerá una lista de 7 palabras (dentro

de los límites de Miller)• El objetivo es intentar recordarlas

después de verlas unos segundosDespertadorCamisaPianoCasaSofaToroBesugo¿ Resultados ?

…variables, pero en el mejor de los casos, se nos olvidarán en pocos minutos. Probemos de forma visual:

Page 30: Desmitificando el Big Data por Logtrust
Page 31: Desmitificando el Big Data por Logtrust

Ejemplo de Visualización:Localizar los “7” de esta figura

Page 32: Desmitificando el Big Data por Logtrust

Ejemplo de Visualización:Representar patrones de correlación

Page 33: Desmitificando el Big Data por Logtrust

En realidad el poder de “lo visual” es algo que conocemos desde hace mucho tiempo…

Page 34: Desmitificando el Big Data por Logtrust

Primer gráfico estadístico conocido:

1644 Michael Florent van Langren, cartógrafo Holandés que proponía un sistemade cálculo de la Longitud.

Representación gráfica de la disparidad de valores propuestos para la Longitud entre Toledo y Roma

Page 35: Desmitificando el Big Data por Logtrust

…mejorando el gráfico con medios modernos:

Page 36: Desmitificando el Big Data por Logtrust

William Playfair 1759-1923 – Ingeniero y economista político Escocés, fundador del Método Gráfico Estadístico

Page 37: Desmitificando el Big Data por Logtrust

La Visualización no sólo representa de forma rápida y concisa la información… También permite DESCUBRIRLA

Mapa del DR. Snow, 1814Epidemia de cólera, localización de fuente de agua contaminada

Page 38: Desmitificando el Big Data por Logtrust
Page 39: Desmitificando el Big Data por Logtrust

Doug Laney:

Big data son activos de información de gran volumen, alta velocidad de crecimiento y gran variedad de formatos, que exigen

formas innovadoras de proceso de información

para una mejor comprensión

y toma de decisiones

Page 40: Desmitificando el Big Data por Logtrust

IT Convencional

¿ Big Data ó Collateral Data?

Page 41: Desmitificando el Big Data por Logtrust
Page 42: Desmitificando el Big Data por Logtrust
Page 43: Desmitificando el Big Data por Logtrust

IT Convencional

Page 44: Desmitificando el Big Data por Logtrust

?

1- ¿ Pregunta ?

2- Actividad

3- Obtener Datosy Almacenarlos

4- Ordenación y Estructuración

5- Exploración

5’-Automatismos de Análisis

6- Visualización y Comunicación

Page 45: Desmitificando el Big Data por Logtrust
Page 46: Desmitificando el Big Data por Logtrust
Page 47: Desmitificando el Big Data por Logtrust

Ejemplos varios de Visualización Logtrust:

Page 48: Desmitificando el Big Data por Logtrust

En Resumen:

• Big Data es una Moda

• Big Data no sólo es un acierto de Marketing

• Big Data es una Necesidad

• Big Data es un Hecho

• Big Data es Accesible

Page 49: Desmitificando el Big Data por Logtrust

Muchas gracias

Javier Valdés Quiró[email protected]