almacenamiento 21-01-2013
TRANSCRIPT
-
7/29/2019 Almacenamiento 21-01-2013
1/32
Administracin de Base de Datos
AlmacenamientoIng. Ronald [email protected]@shopepk.com
-
7/29/2019 Almacenamiento 21-01-2013
2/32
Agenda
Cach y Memoria Principal
Memoria flashDiscos magnticos
Jerarqua de Almacenamiento
RAID (Redudant Arrays of Independent Disk)Niveles de RAIDEleccin del nivel del RAID
Comparacin de conjuntos RAID
Ajustes de E/S para los tipos RAIDRendimiento en reconstruccin
RecomendacionesOrganizacin de registros
Almacenamiento con Diccionario de Datos
-
7/29/2019 Almacenamiento 21-01-2013
3/32
Cach y Memoria Principal
Cach: la forma de almacenamiento ms rpida y
costosa; voltil; gestionada por el hardware delsistema.Memoria principal:
Acceso rpido (10s a 100s de nanosegundos)Generalmente demasiado pequea (o demasiado costosa)
para almacenar la base de datos completaNormalmente se utilizan capacidades de unos pocosGigabytes.Las capacidades han crecido y los costes por byte handisminuido de manera constante y rpida
Voltil : el contenido de la memoria principal normalmentese pierde si se produce un fallo de alimentacin o una cadadel sistema.
-
7/29/2019 Almacenamiento 21-01-2013
4/32
Memoria flash
Los datos se mantienen ante un fallo de alimentacin
Los datos se pueden escribir una sola vez en una posicin,pero una posicin se puede borrar y escribir de nuevo Pueden soportar slo un nmero limitado de ciclos deescritura/borrado. El borrado se tiene que hacer sobre bancos enteros dememoria
La lectura es aproximadamente tan rpida como la dememoria principal Pero la escritura es lenta (pocos microsegundos), el borradoes an ms lento El coste por unidad es similar al de la memoria principal
Ampliamente utilizado en dispositivos embebidos tales comocmaras digitales tambin conocida como EEPROM (ElectricallyErasable Programmable Read-Only Memory)
-
7/29/2019 Almacenamiento 21-01-2013
5/32
Discos magnticos
Los datos se almacenan en discos giratorios, y que se leen/escribenmagnticamente
Es el principal medio de almacenamiento de datos a largo plazo;tpicamente almacenan bases de datos enteras. Los datos se deben mover de disco a memoria principal paraacceder a ellos, y escritos de nuevo hacia el disco si se modifican Los accesos son mucho ms lentos que a memoria principal Acceso directo es posible leer datos de disco en cualquier
orden, al contrario que en las cintas magnticas Las capacidades actuales llegan hasta a cientos de GB
Mucha mayor capacidad y menor coste/byte que la memoriaprincipal/flash Crece de manera constante y rpida con las mejoras
tecnolgicas(factor de 2 a 3 cada 2 aos)
Sobrevive a fallos de corriente y cadas del sistema Los fallos de disco pueden destruir datos, pero son muyinfrecuentes
-
7/29/2019 Almacenamiento 21-01-2013
6/32
Jerarqua de Almacenamiento
Almacenamiento
primario
Almacenamiento
secundario o en lnea
Almacenamiento
terciario o fuera de
lnea
-
7/29/2019 Almacenamiento 21-01-2013
7/32
RAID (Redudant Arrays of Independent Disk)
Tcnicas de organizacin de disco que gestionan una grancantidad de discos, proporcionando la imagen de un solo discode:
Gran capacidad y alta velocidad utilizando varios discos en paralelo, y Alta disponibilidad almacenando datos de forma redundante, de talmanera que los datos se pueden recuperar an cuando un disco falle
El paralelismo en un sistema de disco tiene dos objetivos
principales: Equilibrar la carga de varios accesos de pequeo tamao paraincrementar las prestaciones Paralelizar accesos de gran tamao para reducir el tiempo derespuesta. Generalmente, se realiza a nivel de bloque, con n discos, el bloque i de unfichero va al disco (i mod n) + 1
Las peticiones de diferentes bloques se pueden ejecutar en paralelosi los bloques estn en discos distintos Una peticin de una secuencia grande de bloques puede utilizartodos los discos en paralelo
Niveles de RAID: 0 a 6
-
7/29/2019 Almacenamiento 21-01-2013
8/32
Niveles de RAID
Nivel 0:
No redundanciaAplicaciones de alta disponibilidad dondeno sea crtico la perdida de informacin
Nivel 1:
Buen comportamiento en escrituraDisco espejo
Nivel 5:
Paridad distribuida conbrazos entrelazados
-
7/29/2019 Almacenamiento 21-01-2013
9/32
RAID 0+1
No redundante y en espejo. este nivel combina las tcnicas de
divisin en franjas y de duplicacin en espejo.
-
7/29/2019 Almacenamiento 21-01-2013
10/32
RAID 2
Cdigos de correccin de errores tipo memoria, con estenivel la franja est compuesta por un nico bit y se utilizacdigos hamming como esquema de redundancia.
-
7/29/2019 Almacenamiento 21-01-2013
11/32
RAID 3
Paridad con entrelazado de bit. este nivel proporciona redundancia
almacenando informacin de paridad en uno de los discos matriz.esta informacin de paridad puede utilizarse para recuperar losdatos de otros discos en caso de que estos fallen. este nivel utilizamenos espacio de almacenamiento que RAID 1, pero el disco deparidad puede convertirse en un cuello de botella.
-
7/29/2019 Almacenamiento 21-01-2013
12/32
RAID 4
Paridad con entrelazo de bloque. en este nivel la franja es el bloque
del disco, mantenindose un bloque de paridad en un discoindependiente para una serie de bloques correspondientesalmacenados en otros discos. Si uno de los discos falla, puede usarusarse el bloque de paridad junto con los bloques correspondientesde los otros discos para restaurar los bloques del disco fallido.
-
7/29/2019 Almacenamiento 21-01-2013
13/32
RAID 5
Paridad distribuida con entrelazado de bloques. Este nivel de datos
de paridad como mecanismo de introduccin de redundancia, deforma similar a RAID 3, pero distribuye en franjas los datos deparidad entre todos los discos, en forma similar a como sedistribuyen en franjas los datos de origen. esto reduce la posibilidadde que el disco de paridad se convierta en un cuello de botella.
-
7/29/2019 Almacenamiento 21-01-2013
14/32
RAID 6
Redundancia P+Q, este nivel es similar a RAID 5, pero se
introducen datos redundantes adicionales como proteccinfrente a fallos mltiples de disco. en lugar de emplearesquemas de paridad, se utiliza correccin de errores.
-
7/29/2019 Almacenamiento 21-01-2013
15/32
Eleccin del nivel del RAID
Factores a tener en cuenta al elegir un nivel de RAID:
Costo econmico extras de los requisitos dealmacenamiento en disco.Requisitos de rendimiento en trminos del nmero deoperaciones de entrada/salida.Rendimiento cuando falla un disco.Rendimiento durante la reconstruccin.
-
7/29/2019 Almacenamiento 21-01-2013
16/32
Comparacin de conjuntos RAID
Tipo de RAID Tolerancia deerrores
Rendimiento
RAID 0 (conjuntodividido sin paridad)
Ninguna Mejor lectura yescritura
RAID 1 (volumen
reflejado)
Puede fallar un disco Buena lectura,
escritura aceptableRAID 5 (conjuntodividido con paridaddistribuida)
Puede fallar un disco Excelente lectura,escritura bastantepobre.
RAID 10 (conjunto enespejo)
Puede fallar la mitadde los discos (perono los discos de unpar reflejado)
Excelente lectura yescritura
-
7/29/2019 Almacenamiento 21-01-2013
17/32
Ajustes de E/S para los tipos RAID
Tipo de RAID Clculo de E/S por disco
RAID 0 (conjunto dividido sinparidad)
(lectura + escritura)/nmero de discos
RAID 1 (volumen reflejado) [lecturas +(2 x escrituras)]/2RAID 5 (conjunto divididocon paridad distribuida)
[lecturas +(4 x escrituras)]/nmero dediscos
RAID 10 (conjunto enespejo)
E/S por disco =[lecturas + (2 xescrituras)]/nmero de discos
-
7/29/2019 Almacenamiento 21-01-2013
18/32
Rendimiento en reconstruccin
El rendimiento en la reconstruccin de un sistema RAID puedeser un factor importante si se necesita un aporte continuo dedatos, como ocurre en los sistemas de bases de datos de altorendimiento.
RAID de Nivel 0 se usa en aplicaciones de alto rendimientodonde la seguridad de los datos no es crtica.
RAID de Nivel 1 presenta la reconstruccin ms sencillo perocon el sistema ms caro
RAID de Nivel 3 (2) raramente se usa dado que la
distribucin de bloques da mejores resultados para grandestransferencias
-
7/29/2019 Almacenamiento 21-01-2013
19/32
Rendimiento en reconstruccin
RAID de Nivel 5 (4) es una gran opcin para aplicaciones
donde los datos se leen frecuentemente y se escribenraramente.
RAID de Nivel 6 no se soporta actualmente en casi ningunaimplementacin RAID, pero es recomendable en aplicaciones enlas cuales la seguridad de datos es muy importante
Requisitos
Almacenamiento Entrada/Salida
RAID de nivel 1 Moderado Alto
RAID de nivel 5 Alto Moderado
-
7/29/2019 Almacenamiento 21-01-2013
20/32
Recomendaciones
La configuracin optima del disco para un servidor de base de
datos depende del uso esperado de ese servidor. Cuando msse utilice un servidor de base de datos, ms conjuntos deunidades debera dedicar a los componentes individuales delservidor.
Un diseo bsico de un servidor de base de datos con un usomedio incluye tres conjuntos de unidades fsicas.Correspondindose cada uno con unidades lgicas.
Un volumen se reserva para el S.O.Un segundo para los registros de transacciones.Un tercero para las bases de datos.
-
7/29/2019 Almacenamiento 21-01-2013
21/32
Recomendaciones
Oracle recomienda utilizar RAID 1 para los archivos del
registro rehacer. Para los archivos de bases de datos, Oraclerecomienda 5 (si el coste adicional en escritura es aceptable) oen caso contrario, RAID 1 o RAID 0+1.
Para SQL Server se recomienda normalmente RAID 1. para la
unidad que contiene el registro de transacciones se recomiendaRAID 1 0 RAID 10.Para la unidad de base de datos, la eleccin se reducenormalmente a RAID 10 o RAID 5.
-
7/29/2019 Almacenamiento 21-01-2013
22/32
Organizacin de registros
Generalmente se usa un archivo separado para almacenar los
registros de cada relacin de la base de datos.
Existen organizaciones de archivos en agrupaciones en lascuales se guardan en el mismo archivo registros de relacionesdiferentes
-
7/29/2019 Almacenamiento 21-01-2013
23/32
Archivos en montculo
En la organizacin de archivos en montculo se puede colocar
cualquier registro en cualquier parte del archivo en que hayaespacio suficiente.
No hay ninguna ordenacin de los registros.Generalmente slo hay un archivo por relacin
-
7/29/2019 Almacenamiento 21-01-2013
24/32
Archivos en montculo
En la organizacin de archivos secuenciales los registros se
guardan en orden secuencial, basado en el valor de la clave debsqueda (no tiene por qu ser una clave principal o unasuperclave) de cada registro
-
7/29/2019 Almacenamiento 21-01-2013
25/32
Hash
En la organizacin asociativa (hash) de archivos se calculauna funcin de asociacin de algn atributo de cada registro.
El resultado de la funcin de asociacin especifica el bloque delarchivo en el que se colocar el registro.
Est muy relacionado con la creacin de ndices
-
7/29/2019 Almacenamiento 21-01-2013
26/32
Almacenamiento con Diccionario deDatos
-
7/29/2019 Almacenamiento 21-01-2013
27/32
Catlogo del sistema
Un sistema de bases de datos relacional necesita tener datos
sobre las relaciones, como por ejemplo el esquema:
Los nombres de las relaciones. Los nombres de los atributos de cada relacin. Los dominios y las longitudes de los atributos. Los nombres de las vistas definidas en la base de datos y lasdefiniciones de esas vistas. Las restricciones de integridad.
-
7/29/2019 Almacenamiento 21-01-2013
28/32
Datos adicionales
Datos de los usuarios del sistema
Los nombres de los usuarios autorizados La informacin de las cuentas de los usuarios Contraseas u otra informacin usada para autentificar alos usuarios
Datos de informacin estadstica y descriptiva
Nmero de tuplas de cada relacin Mtodo de almacenamiento utilizado para cada relacin
La organizacin del almacenamiento (secuencial, asociativa o
con montculos)
-
7/29/2019 Almacenamiento 21-01-2013
29/32
Datos adicionales
Datos sobre los ndices de cada una de las relaciones:
El nombre del ndice
El nombre de la relacin para la cual se crea el ndice
Los atributos sobre los cuales se define el ndice
El tipo de ndice formado
-
7/29/2019 Almacenamiento 21-01-2013
30/32
Ficheros de Base de Datos
-
7/29/2019 Almacenamiento 21-01-2013
31/32
Ficheros de control
Almacenan la informacin (fichero binario) para mantener y
verificar la integridad de la Base de Datos: estructura, nombrey fecha de creacin de la base de datos, nombre de los ficherosde datos y de los ficheros de redo log
Guarda tambin informacin de sincronizacin: estado de los
ficheros cuando se cerr la base de datos, tiempo de cierre
Tambin es necesario para su recuperacin.
-
7/29/2019 Almacenamiento 21-01-2013
32/32
Ficheros de parmetros
Define las caractersticas de la instancia y se lee cuando esta
arranca, configurndola segn el valor de los parmetros.