juan pablo martínez beltrán - unilibre

16
Conociendo los beneficios de la relación de Big Data y Cloud Computing Juan Pablo Martínez Beltrán Universidad Libre Facultad de Ingeniería Ingeniería de Sistemas Bogota D.C. Septiembre 2017

Upload: others

Post on 04-Oct-2021

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Juan Pablo Martínez Beltrán - Unilibre

Conociendo los beneficios de la relación de Big Data y Cloud

Computing

Juan Pablo Martínez Beltrán

Universidad Libre

Facultad de Ingeniería

Ingeniería de Sistemas

Bogota D.C.

Septiembre 2017

Page 2: Juan Pablo Martínez Beltrán - Unilibre

Conociendo los beneficios de la relación de Big Data y Cloud

Computing

Resumen

La presente monografía pretende expresar las ventajas de la relación entre las

herramientas Big Data y Cloud Computing como facilitadores en el proceso de

administración de datos.

El avance de las tecnologías de la información pretende generar mejoras en los

procesos de una organización y para ello es esencial que la gestión y análisis de

datos masivos, evite el uso de herramientas convencionales.

Big Data ha permitido que los datos sean fáciles de entender sin importar su origen

estructurado o no estructurado, haciendo uso de la minería de datos y estadística.

Page 3: Juan Pablo Martínez Beltrán - Unilibre

Introducción

La administración de información masiva y su disponibilidad son aspectos

fundamentales que debe tener en cuenta una organización, por lo tanto, es

necesario definir conceptos como Big data y Cloud Computing. Además, de

establecer la planeación para lograr implementar de manera adecuada estas

tecnologías.

El propósito fundamental del presente documento es identificar la relación y los

beneficios que existen en la utilización de Cloud Computing y Big Data en una

organización, resaltando los atributos de cada una de ellas.

A continuación, se destacan importantes conceptos a tener en cuenta para

determinar la relación que los asocia.

Page 4: Juan Pablo Martínez Beltrán - Unilibre

Que es Big data

Es la tendencia en el avance de la tecnología que ha abierto las puertas hacia un

nuevo enfoque de entendimiento y toma de decisiones, es utilizada para describir

cantidades de datos (estructurados, no estructurados y semi estructurados) y

cargarlos a una base de datos relacional para su análisis. La finalidad del Big data

es obtener resultados en tiempo real

La importancia de tener un conjunto de datos Big Data es el análisis de datos para

obtener un resultado predictivo a través de estadística inferencial y minería de datos.

En la actualidad existen diversas herramientas como Hados, avro, Cassandra,

chukwa, Flume, Hbase y Hive, que permiten el manejo y la implementación de Big

Data.

Ventajas de Big data

Diariamente, se generan grandes volúmenes de información no estructurada pero

que debe estar disponible en cualquier momento. Para ello el Big Data proporciona

distintos métodos como filtrados de datos, análisis semántico y clasificación de

datos, para realizar la gestión de estos datos y convertirlos en datos estructurados.

Además, se puede hablar de que cada vez existen más medios de información.

Actualmente la información la obtenemos de periódicos digitales, Twitter, Facebook

u otros medios sociales a nuestro alcance, generando más fuentes de datos.

Big data ha llegado precisamente para cubrir las deficiencias que dejan las

herramientas analíticas convencionales y permite cantidad de nuevas

oportunidades.

Page 5: Juan Pablo Martínez Beltrán - Unilibre

Herramientas

Hoy en día para hablar de Big data es necesario mencionar algunas plataformas de

las Hadoop, Cassandra, chukwa, Flume, Hbase y Hive para gestionar proyectos

de Big data, permiten el procesamiento en paralelo de grandes cantidades de

datos (estructurados y desestructurados) a través de clústeres de servidores.

Hadoop, además, ofrece la posibilidad de crecer de manera escalable y llegar a

trabajar con miles de nodos y un volumen de datos del orden de peta bytes.

A continuación, describiré una serie de requerimientos recomendables en cualquier

proyecto de Big data:

• Capacidad de almacenamiento y procesamiento: Big data necesita una

gran cantidad de almacenamiento y capacidad de computación

(CPU). Hadoop funciona, separando los datos capturados en pequeños

bloques y distribuyéndolos entre varios servidores, lo que permite el

procesamiento de grandes volúmenes de datos con un mejor rendimiento y

latencias mínimas, con la posibilidad de análisis en tiempo real.

• Escalabilidad: Un proyecto de Big data se caracteriza por tener una serie de

picos de demanda con grandes necesidades en cuanto a almacenamiento y

procesamiento de datos, seguidos de periodos de poca actividad en los

servidores. Sería deseable, por tanto, poder incrementar o disminuir la

infraestructura tecnológica según las necesidades de cada momento.

• Control de costo: Abordar cualquier proyecto de este tipo mediante la

adquisición de un modelo en propiedad de toda la infraestructura necesaria

implica una inversión inicial, lo que provocaría que muchas compañías

desistieran de utilizar Big Data.

Page 6: Juan Pablo Martínez Beltrán - Unilibre

Tendencias

Las smart cities, Smart grids, la industria 4.0, las redes sociales, las tecnologías

cognitivas, el wifi óptico, los sistemas ciber-físicos, la tecnología móvil, las redes 5G

y las nuevas formas de pago (como las tarjetas contactless y las aplicaciones

móviles que permiten realizar pagos) son herramientas que hacen uso del Big Data.

Big Data, el Cloud Computing y el Internet de las Cosas marcan las principales

tendencias en el sector de las TIC. Así se desprende del informe “Tendencias en el

Mercado de la Ciberseguridad” publicado por el Instituto Nacional de

Ciberseguridad.

En cuanto al internet de las cosas, es un paradigma en el que los objetos cotidianos

estarán conectados a Internet.

A medida que se produzca el despegue del “Internet de las cosas” y los dispositivos

portátiles, se producirán cada vez más datos generados por máquinas de los que

podrán aprovecharse las organizaciones.

Page 7: Juan Pablo Martínez Beltrán - Unilibre

¿Qué es Cloud Computing?

En la actualidad el Cloud Computing es un servicio reconocido en todo el mundo,

por lo que brinda la oportunidad de tener un gran almacenamiento, sin necesidad

de tener una infraestructura amplia, ajustándose a los requerimientos de cada

cliente.

Cloud Computing es la mejor alternativa de almacenamiento para Big Data, porque

ofrece alta disponibilidad de la información en tiempo real y soporta el cargue

masivo de datos.

Esta información es guardada en data centers que actualmente existen y cuyas

empresas grandes como IBM, Microsoft, Apple, Amazon, entre otros; almacenan

una gran cantidad datos diarios que son generados por los usuarios.

“Inicialmente beneficia financieramente a la empresa, le permite controlarse a través

de presupuestos flexibles, utilizar modelos de economía de escala y destinar

recursos financieros a diferentes inversiones, sin tener que recurrir a procesos de

descapitalización o financiamientos con un costo del dinero que en ocasiones es

bastante alto. Por otro lado, impacta en el modelo de compensación salarial, hoy

por hoy, podemos pensar de manera más tangible, en esquemas de pago basados

cien por ciento en resultados (para ciertos niveles de la organización), y no por

cumplir horarios frente a una computadora, invariablemente esto obligará a los

funcionarios de la empresa a ser más productivos e impactar en la efectividad de la

empresa.”

(“Cloud Computing: definición y como impacta a una organización”,2015)

Ventajas de Cloud

Una ventaja del uso del Cloud Computing es que no debe ser una preocupación la

disposición, desarrollo, operación y mantenimiento de una infraestructura de

almacenamiento propia, compuesta por software y hardware, esta tarea la realiza el

proveedor del servicio. Además del almacenamiento de datos, con el Cloud

Page 8: Juan Pablo Martínez Beltrán - Unilibre

Computing se pueden disponer de otras herramientas como aplicaciones y redes

internas para la empresa.

La necesidad de las empresas de sacar valor a los datos ha hecho aumentar las

necesidades de tecnologías Cloud o de computación en la nube. Entre estas

tecnologías nos encontramos con la computación elástica, un sistema de

computación similar al uso eficiente de electricidad. El servicio se da o no,

dependiendo de la demanda de uso de un determinado recurso. El sistema de

computación elástico permite adaptar el uso de los recursos computacionales

dependiendo del aluvión de datos, su tamaño, tipo, velocidad de estos, para dar una

respuesta más efectiva.

Seguridad en Cloud

En cuanto a ubicación y nivel de seguridad, las empresas de servicios en la nube

cuentan con varios servicios: Público, Privado dedicado o compartido e Híbrido.

En el servicio nube pública se tiene acceso general a servicios y recursos de

computación Cloud mediante una conexión pública a través de Internet.

La nube privada, es donde los servicios y recursos de computación en la nube están

en una red privada, con acceso restringido a usuarios de la organización. Los

sistemas de seguridad son más altos, debido al tipo de sensibilidad de los datos que

se almacenan, siendo necesario mantener la confidencialidad, la privacidad y la

integridad de los datos.

La nube híbrida, es el nivel que combina las características de los servicios Cloud

públicos y privados. Estos servicios se utilizan cuando existen datos Cloud privados

que se ofertan en Cloud públicos o cuando existe una colaboración de distintos

proveedores de servicios en la nube. Estos servicios ofrecen ahorro, seguridad,

flexibilidad y escalabilidad.

Page 9: Juan Pablo Martínez Beltrán - Unilibre

Ventajas de la relación

“La alianza entre Big Data y el Cloud facilita métodos de análisis nuevos e

integrados, cuyos resultados están incluidos directamente en decisiones

empresariales y aún pueden generar nuevos procesos de negocio”.

(“El big data requiere aportación tecnológica”, 2013)

Big data y Cloud Computing son herramientas que han permitido innovar y han

cambiado los modelos de negocio y funcionamiento de las tecnologías, además de

mejorar el manejo de la información.

En el siguiente grafico se pueden observar las características que diferentes

sectores con la implementación del Big Data y Cloud Computing.

Tabares Hernandez. 2014. Resumen de aplicaciones de Big Data. Imagen 1. Tomado de Big Data Analytics

Page 10: Juan Pablo Martínez Beltrán - Unilibre

De acuerdo con lo que se establece en el cuadro, la implementación del Big data

optimiza los diferentes procesos en un sector determinado, además se puede

identificar que se puede aplicar a cualquier situación sin alguna restricción, también

muestra el impacto que puede generar en la realización de alguna actividad

científica, en temas de mercadeo y el sector salud.

En la imagen 2 se observan las ventajas y beneficios de cada herramienta y los

resultados que se obtienen al implementar estás dos tecnologías, mostrando como

se pueden relacionar, adicionalmente el uso de Cloud con Big Data proporciona un

complemento adecuado para que los resultados sean precisos ante la necesidad de

cada organización.

Page 11: Juan Pablo Martínez Beltrán - Unilibre

SAS Colombia on SAS Latín América. 2014. "Big Data y la nube: Un matrimonio bien avenido". Imagen 2

Page 12: Juan Pablo Martínez Beltrán - Unilibre

El camino que marca la imagen se puede entender que son las características que

genera en la relación de estas dos tecnologías y como, paso a paso se realiza la

implementación. También se exponen aspectos para tener en cuenta durante la

planeación estratégica de ambas herramientas en una organización.

El Big Data brinda Veracidad, Velocidad, Valor y Volumen, conceptos conocidos

como las 4 V. Con esto las organizaciones obtienen como ventaja eficiencias

operativas, reducción de costos en infraestructura y mayor transformación de las

tecnologías.

En el Cloud Computing ofrecen implementación a sistemas CRM y ERP, además

de ofrecer infraestructura como servidores, bases de datos y seguridad, permitiendo

agilidad y escalabilidad en sus procesos.

Modalidades de Cloud para Big Data

La modalidad infraestructura facilita el uso de servidores a bajo nivel controlando el

sistema operativo, el uso de memoria, tecnología de almacenamiento en disco.

Con la modalidad de entorno pre configurado, el proveedor ofrece el servicio Cloud

con los lenguajes de programación necesarios (Java, Python, Ruby, entre otros) y

con esto alguna de la herramientas que se utilicen se encargara de recoger y

analizar los datos.

La última modalidad es la de software como servicio Cloud, que te proporciona un

entorno para trabajar directamente con Big Data. Se realiza el procesamiento y

análisis de los datos de manera transparente, almacenando la información

generada.

Page 13: Juan Pablo Martínez Beltrán - Unilibre

Seguridad y privacidad Big data

Algo que preocupa a los usuarios del Big Data es su privacidad, por lo que

desconocen la ubicación de los dispositivos que almacenan su información.

Mientras la mayor preocupación por parte de las organizaciones es que sus datos

estén mal gestionados, generando complejidad en el análisis de su información.

Las compañías deben garantizar una administración adecuada a los datos, para ello

se debe contar con la autorización de los usuarios para su uso.

t-Systems, 2013. “Big data y el Cloud para recursos”. Imagen 3. Tomado de T – Systems

En la imagen 3 se puede identificar los pasos que se deben desarrollar para un

proyecto con Big Data y Cloud Computing. Además, se basa en seguridad y

privacidad para brindar una satisfacción al cliente final. También se es necesario

establecer estrategias para su implementación.

Page 14: Juan Pablo Martínez Beltrán - Unilibre

Conclusiones

Durante más de 10 años el uso de estas tecnologías ha permitido conocer la

relación que existe entre Big Data y el Cloud Computing, además, de lograr

establecer las características y los beneficios que se obtienen realizando la

implementación de las dos herramientas.

Identificar el impacto que puede generar para una organización el uso de Cloud

Computing para el almacenamiento de la información, relacionado con la

administración de los datos que permite Big Data, brindara un objetivo para el

manejo correcto para lograr la optimización de los recursos y de los procesos

establecido para una entidad.

Estas tecnologías han permitido que la información pueda ser de utilidad y genere

ventajas económicas y competitivas en una organización.

Page 15: Juan Pablo Martínez Beltrán - Unilibre

Bibliografía

• Maté Jiménez, C. (2014). Big data. Un nuevo paradigma de análisis de datos.

• Torres, J. (2012). Del cloud computing al big data. Visión introductoria para

jóvenes emprendedores.

• i Viñals, J. T. (2012). Del cloud computing al big data. universitat oberta de

catalunya, Barcelona.

• Purcell, B. M. (2014). Big data using cloud computing. Journal of Technology

Research, 5, 1.

• Purohit, P., Apoorva, D. R., & Lathashree, P. V. (2017). Big Data in Cloud

Computing. International Journal of Advance Research, Ideas and

Innovations in Technology, 3(3), 1312-1318.

• Tanque, M., & Foxwell, H. J. (2017). Big Data and Cloud

Computing. Exploring the Convergence of Big Data and the Internet of

Things, 1.

Webgrafía

• Incibe. 2016. Tendencias en el Mercado de la Ciberseguridad. Audea.

http://www.audea.com/es/big-data-cloud-computing-internet-las-cosas-

principales-tendencias-sector-las-tic/.

• Lidia Montes. 2016. 'Cloud Computing' y 'Big data' para el turismo. El Mundo.

http://www.elmundo.es/economia/2016/04/20/57174807e5fdea8d5c8c0696.

html

• BBVA. 2015. BBVA Api Market. https://bbvaopen4u.com/es/actualidad/la-

union-hace-la-fuerza-big-data-mas-cloud-computing

• Ahmed Banafa. 2015. Cloud Computing, Big Data y movilidad en 2015.

OpenMind. https://www.bbvaopenmind.com/cloud-computing-big-data-y-

movilidad-tendencias-tecnologicas-en-2015/

Page 16: Juan Pablo Martínez Beltrán - Unilibre

• Carlos Santana. 2013. Cloud Computing para empresas, las ventajas de la

nube. http://blog.acsendo.com/cloud-computing-para-empresas-las-

ventajas-de-la-nube/

• T Systems. 2013. BIG DATA Y CLOUD – UNA ALIANZA PERFECTA. T

Systems. https://www.t-systems.com/es/es/soluciones/cloud/topics/big-

data/big-data-109832.

• Julian Garcia Barbosa. 2013. Cloud computing, el mejor camino para acceder

al big data. Telefonica. https://aunclicdelastic.blogthinkbig.com/cloud-

computing-mejor-camino-para-acceder-al-big-data/

• IIC. 2016. Big Data y la nube: los servicios Cloud. Instituto de Ingeniería del

Conocimiento. España. http://www.iic.uam.es/innovacion/big-data-la-nube-

servicios-cloud/