cómo resolver las necesidades de almacenamiento con las

33
Open Storage Cómo resolver las necesidades de almacenamiento con las ventajas económicas del mundo open (LOW COST TECHNOLOGY) Ivan Ricondo [email protected] http://www.flickr.com/photos/simon_and_you/1062318106

Upload: others

Post on 08-Jul-2022

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Cómo resolver las necesidades de almacenamiento con las

Open StorageCómo resolver las necesidades de

almacenamiento con las ventajas económicas

del mundo open (LOW COST TECHNOLOGY)

Ivan Ricondo

[email protected]

http://www.flickr.com/photos/simon_and_you/1062318106

Page 2: Cómo resolver las necesidades de almacenamiento con las

2

Objetivos

Introducción a tecnologías de almacenamiento y conceptos relacionados.

Revisar las diferentes soluciones disponibles en Open Storage

Demo de solución “elegida”.

Page 3: Cómo resolver las necesidades de almacenamiento con las

3

Evolución Almacenamiento

Direct AttachedStorage (DAS)

• Almacenamiento directamente conectado al servidor

• Almacenamiento disperso

• Tecnologías SCSI, FC, IDE, SATA, SAS…

Network Attached

Storage (NAS)

• Almacenamiento conectado a la LAN

• Centraliza almacenamiento

• Protocolos NFS, CIFS, FTP…

• Servidor NAS utiliza almacenamiento DAS o SAN

Storage AreaNetwork (SAN)

• Almacenamiento conectado a red de alta velocidad dedicada

• Protocolos FC, iSCSI…

• Muchas mas funcionalidades

• Reduce TCO

Page 4: Cómo resolver las necesidades de almacenamiento con las

4

NAS vs SANN

AS Tradicionalmente

más económicas que SAN

Suelen ser más pequeñas

Rendimiento menor que SAN

No vale para ciertos servicios

SA

N Tradicionalmente más caras que NAS

Tradicionalmente suelen ser para instalaciones grandes (por los costes)

Valen para todos los servicios (hasta grandes servidores de BBDD)

Page 5: Cómo resolver las necesidades de almacenamiento con las

5

Por qué centralizar almacenamiento

• Mayor velocidad de acceso a datos

• Repartir operaciones de IO por muchos discos

• CachingRendimiento

• Redundancia en discos (RAID-1, RAID-5…)

• Posibilidad de tener caminos redundantes para acceso a discos

• Tiempos de recuperación ante desastres menoresDisponibilidad

• Gestión centralizada e independiente de la plataforma

• Dar a cada máquina lo que necesita con total flexibilidad (ej. Disco de 20GB)

• Adaptación a requerimientos del cliente (ej. crecimiento disco)

Gestión

• Réplicas

• Snapshots

• Acceso de varias máquinas a mismo disco (Clusters)

• …

Funcionalidades

Page 6: Cómo resolver las necesidades de almacenamiento con las

6

Funcionamiento discos RAID

Objetivo: para entender por qué aumenta rendimiento, entender los diferentes tipos de

RAID y saber cuando se usan

RAID 0 o Striping

• No tiene redundancia de datos

• Se usa para aumentar rendimiento

RAID 1 o Mirroring:

• Tiene redundancia

• Cada disco tiene una copia

• Pierde mucho espacio

• Buen rendimiento

RAID 5

• Tiene redundancia

• Mínimo 3 discos

• Soporta el fallo de 1 disco

• Pierde capacidad de 1 disco por RAID

• Rendimiento peor que RAID-1

Otros RAID

• RAID 6: igual que RAID5 pero con 2 discos de redundancia (mínimo 5 discos)

• RAID combinados (RAID-10, RAID-50…)

Page 7: Cómo resolver las necesidades de almacenamiento con las

7

Ejemplo RAID-0 o Striping

Page 8: Cómo resolver las necesidades de almacenamiento con las

8

RAID-1 o Mirroring

Tiene redundancia, se “pierde” 50% almacenamiento

Page 9: Cómo resolver las necesidades de almacenamiento con las

9

Ejemplo RAID-5 (con 3 discos)

Tiene redundancia, se “pierde” 33% almacenamiento

Page 10: Cómo resolver las necesidades de almacenamiento con las

10

RAID-10 / RAID-50

Page 11: Cómo resolver las necesidades de almacenamiento con las

11

Cabina Almacenamiento SAN

No DAS, sino compartido

Cada máquina recibe el almacenamiento que necesita.

Flexibilidad de cambios

Rendimiento mejorado

Más funcionalidades

Discos spare

Page 12: Cómo resolver las necesidades de almacenamiento con las

12

Almacenamiento Lógico

De forma lógica se ve un “volumen” sobre el que se crean discos

Cada máquina recibe el disco que necesita

Flexibilidad para crecer o decrecer

Rendimiento discos “repartido”

Page 13: Cómo resolver las necesidades de almacenamiento con las

13

Funcionalidades (I)

• Copia de un disco en un momento dado

• Se hace de forma inmediata

• No ocupa todo el espacio, sólo las diferencias

• Se puede montar un snapshot (normalmente sólo lectura)

• Se puede devolver un disco al estado de su snapshot

• Algunas utilidades típicas: backup, puestas producción

Snapshot

• Copia de un disco completa

• El clon ocupa tanto como ocupaba el disco original

• Normalmente tarda en hacerse (por la copia de los sectores)

• Se puede montar en lectura y escritura

• Es disco independiente que se puede montar en lectura y escritura

• Utilidad típica: entornos de preproducción

Clone

Page 14: Cómo resolver las necesidades de almacenamiento con las

14

Funcionalidades (II)

• Información que sea igual en lugar de almacenarse varias veces, se almacena sólo una.

• Juntándolo con clones puede hacer que se hagan de forma inmediata y no ocupen casi espacio.

• Para no disminuir rendimiento en acceso a disco requiere mucha memoria o determinados tipos de discos.

Deduplicación

• Casi cualquier cabina SAN permite hacer todo tipo de RAID (0,1, 5, 6, 10, 50…) y utilizar spares

• Cabinas gamas alta permite acelerar acceso a disco poniendo discos Flash con configuración especial:

• Discos de log para acelerar escritura

• Discos de cache para acelerar lectura

Discos

Page 15: Cómo resolver las necesidades de almacenamiento con las

15

Funcionalidades (III)

•Capacidad de asignar espacio a máquinas y aprovisionarlo cuando se necesite

Thinprovisioning

•Posibilidad de tener la información redundada en varias cabinas

•Replicaciones síncronas/asíncronasReplicación

•Para dar alta disponibilidad posibilidad de crear dos cabinas que funcionen como una

Cluster

Page 16: Cómo resolver las necesidades de almacenamiento con las

16

Funcionalidades (IV)

•Necesidad de acceso de dos máquinas a mismos ficheros

•Ejemplo: Microsoft Cluster, o VMWare

Clusters

•Tener varios caminos para llegar al disco

•Para dar redundancia en el acceso a los discos

Multipathing

Page 17: Cómo resolver las necesidades de almacenamiento con las

17

Conexión a cabina SAN

• Velocidad 8Gpbs

• Más cara que iSCSI

• Más rendimiento que iSCSI

• Capacidad de asignar espacio a máquinas y aprovisionarlo cuando se necesite

FibreChannel

(FC)

• Velocidad conexión máxima 10Gbps

• Utiliza Ethernet para la conexión (encapsula protocolo SCSI sobre IP)

• Más barato que FC

• Menor rendimiento que FC

iSCSI

Page 18: Cómo resolver las necesidades de almacenamiento con las

18

Open Storage

Open Storage rompe mucho de los paradigmas clásicos

Pueden crearse cabinas a precio reducido y sin tener que pagar un “canon” por cada funcionalidad que se necesite

Es Software que se instala sobre en hardware estándar (más económico que hardware propietario de almacenamiento).

Al instalar una cabina basada Open no te casas con proveedor para siempre (como con cabinas propietarias)

Compra de discos se hacen a precio de mercado

Page 19: Cómo resolver las necesidades de almacenamiento con las

19

Soluciones Open Storage

Desde el Laboratorio de Strelia se han analizado las siguientes soluciones:

Linux con LVM2/DRBDLinux OpenFiler 2.3Linux Open-E FreeNAS 0.7.1OpenSolaris 9.6Otras soluciones (Gluster,

webdav, …)NexentaStor 3.0.4

Page 20: Cómo resolver las necesidades de almacenamiento con las

20

Qué se buscaba

Crear SAN en entorno empresarial

Acceso a SAN mediante iSCSI

Ver posibilidades de crear dos cabinas replicadas

Una vez decidida solución se ha medido el rendimiento

Page 21: Cómo resolver las necesidades de almacenamiento con las

21

Linux con LVM2/DRBD

Se ha instalado una máquina Debian, configurando LVM2, DRBD, MDADM, iSCSI

Acceso desde máquina con Windows 7 por iSCSI.

Configuración de funcionalidades básicas y replicación síncrona de complejidad media.

Administración compleja (todo es demasiado manual)

Instalar máquinas en cluster es complicado (instalar Hearbeat y hacer muchas pruebas)

Todo el software necesario es gratuito, salvo si se quisiera hacer replica asíncrona.

Page 22: Cómo resolver las necesidades de almacenamiento con las

22

OpenFiler

OpenFiler es directamente una distribución con instalación sencilla (CD y sencillo Wizard).

La configuración se realiza desde entorno Web.Parece ser la distribución más utilizada en

entornos no empresariales.Se puede configurar dos máquinas para tener

replicación de datos, o incluso alta disponibilidad, pero de forma complicada desde el entorno de líneas de comando (documentada en un libro de documentación que es necesario comprar).

Se puede instalar de forma gratuita y después si se quiere contratar el soporte y los manuales con la documentación.

Page 23: Cómo resolver las necesidades de almacenamiento con las

23

Linux Open-E

Igual que el anterior es una distribución directamente.

No se ha llegado a probar por que no tiene alta disponibilidad y por que parece tener muchos menos clientes que OpenFiler.

La nombramos por tener la referencia completa.

Page 24: Cómo resolver las necesidades de almacenamiento con las

24

OpenSolaris

Se ha instalado sobre una máquina con 36discos de 2T y se han creado varios discos ZFS, compartidos por iSCSI.

A esta máquina se ha accedido desde un ordenador con Windows 7.

A nivel de complejidad es parecida que la solución con Linux LVM2/DRBD

Lo bueno, el File System ZFS.Lo malo, es que esta solución NO va a

tener continuidad.

Page 25: Cómo resolver las necesidades de almacenamiento con las

25

FreeNAS

Esta distribución está basada en BSD.Tiene soporte nativo para ZFS y va a tener

continuidad….No tiene el número de usuarios que

OpenFilerNo tiene posibilidad de configurar alta

disponibilidad.Precio es gratuito.La nombramos por tener la referencia

completa.

Page 26: Cómo resolver las necesidades de almacenamiento con las

26

Otras soluciones

• Es una solución de almacenamiento DISTRIBUIDA

• Información se divide entre varios equipos que tienen su almacenamiento DAS

• Es un FileSystem no un NAS/SAN

• Sobre él se puede montar NAS/SAN

Gluster

• Dentro de proyectos de Cloud sobre linux, se han creado otros FS, por ejemplo:

• Dentro de Eucalyptus el EBS (Elasticblock store)

• Dentro de OpenStack el OpenStackObject Storage

• …

Almacenamiento Cloud

Page 27: Cómo resolver las necesidades de almacenamiento con las

27

Nexenta

Tiene posibilidad de TODAS las funcionalidades descritas

Dispone de dos versiones: Community y Enterprise

Cabina es NAS y SANCommunity no tiene soporte, tiene límite de

18TB y no se pueden poner plugins de pagoEnterprise es de pago (se paga por TB)Funcionalidades de Replicación, Cluster y

conexión FC son de pago.Basado en sistema de ficheros abierto

(ZFS).

Page 28: Cómo resolver las necesidades de almacenamiento con las

28

Sobre ZFS

Creado por Sun Microsystems a finales del 2005.

Posibilidad de almacenar gran cantidad de datos (ZetaByte).

Velocidad de acceso muy rápida.Posibilidad de hacer deduplicación.Chequeo de todo los sectores

leídos/escritos y reparación automática de errores.

Posibilidad de hacer snapshotsilimitados sin pérdida de rendimiento.

Page 29: Cómo resolver las necesidades de almacenamiento con las

29

Instalación y configuración

Instalación mediante CD que instala “appliance” (sistema operativo y Nexenta).

Gestión mediante sencillo entorno web

Page 30: Cómo resolver las necesidades de almacenamiento con las

30

Experiencia

En Strelia hay cabina Nexenta en producción desde hace 9 meses

Montado sobre máquina de 36 discos (Supermicro) con 72TB de información

Rendimiento muy buenoPrecio por GB muy barato

Page 31: Cómo resolver las necesidades de almacenamiento con las

DEMO

Page 32: Cómo resolver las necesidades de almacenamiento con las

32

Conclusiones

Desde Strelia se cree que la solución más empresarial y seria es la de Nexenta.

Nexenta es Open Storage (que no Free)Por defecto trae la mayoría de las

funcionalidades habituales (resto de funcionalidades de pago)

Hardware para montar cabinas muy grandes es complicado de conseguir

Pero en cabinas medianas es una alternativaPuede poner al alcance de Pymes (o

delegaciones de grandes empresas) funcionalidades que normalmente sólo contratan grandes empresas por su precio

Page 33: Cómo resolver las necesidades de almacenamiento con las

33