drp-bcp msg cissp
DESCRIPTION
DRPTRANSCRIPT
© ALAPSI 2007Lámina 1
Asociación Latinoamericana de Profesionales en Seguridad Informática (ALAPSI)
Material de Preparación para el Examen CISSP
Módulo: DRP-BCP
José Miguel Sandoval G. CISSP, CISA
Marzo del 2007, México D.F.
© ALAPSI 2007Lámina 2
Plan de Contingencia ?DRP ??
(Disaster Recovery Plan)
BRP ?(Business Recovery Plan)
BCP ?(Business Continuity Plan
Evolución del concepto de “Disaster Recovery”
© ALAPSI 2007Lámina 3
Primer Concepto:
“ Planeación de Contingencias
para
Eventos Catastróficos
en un
Ambiente de Cómputo “
Evolución del concepto de “Disaster Recovery”
© ALAPSI 2007Lámina 4
Contingency Planning for
Catastrophic Eventsin a
Computer Environment
Data CenterDisaster Recovery
Planning (DC/DRP)
Evolución del concepto de “Disaster Recovery”
© ALAPSI 2007Lámina 5
Contingency Planning for
Catastrophic Eventsin a
Computer Environment
Data CenterDisaster Recovery Planning
(DC/DRP)
Business Recovery Planning (BRP)
Business Continuity Planning (BCP)
Disaster Recovery Planning (DRP)
Evolución del concepto de “Disaster Recovery”
© ALAPSI 2007Lámina 6
Evolución del concepto de “Disaster Recovery”
� CP Contingency Planning for Catastrophic Events in a Computer Environment
� DCDRP Data Center Disaster Recovery Planning
� DRP Disaster Recovery Planning
� BRP Business Recovery Planning
� BRP Business Resumption Planning
� BCP Business Continuity Planning
� BRS Business Recovery Services
� BFRP Business Funtion Resumption Planning
� BPRP Business Process Resumption Planning
� COB Continuity Of Business
© ALAPSI 2007Lámina 7
¿ Qué significa la palabra “Desastre” ?
Desastre(Del Provensal antiguo: “Dis” y “Astrum”):
Desgracia grande, suceso infeliz y lamentable
(Diccionario de la Lengua Española. Real Academia Española, 1992)
© ALAPSI 2007Lámina 8
Un”Desastre” se caracteriza por ser un Evento de:
1. Alta Incertidumbre
2. Baja Probabilidad de Ocurrencia
3. Alto Impacto
© ALAPSI 2007Lámina 9
¿ Qué se entiende por
“Desastre”
en el ámbito de la Informática cuando se hace referencia a
“Disaster Recovery” ?
© ALAPSI 2007Lámina 10
Un “Desastre” es un evento no planeado que ocasiona la “no disponibilidad” de los servicios informáticos por un periodo de tiempo tal que, para restablecer estos servicios, es necesario utilizar facilidades alternas de cómputo y telecomunicaciones en otra localidad.
Nota: El tiempo de tolerancia a la interrupción que determina en que casos se trata de una contingencia menor o de un desastre, varía de organización a organización.
“Desastre” en Informática
© ALAPSI 2007Lámina 11
De manera muy concreta:
Desastre
=
Interrupción Prolongada y No Tolerable
Del Servicio Informático
“Desastre” en Informática
© ALAPSI 2007Lámina 12
Por extensión, desde el Punto de Vista del Negocio:
Desastre
=
Interrupción Prolongada y No Tolerable
de las Operaciones de la Empresa
© ALAPSI 2007Lámina 13
CAUSAS NATURALESCAUSAS NATURALES
� Incendios� Terremotos� Exhalaciones volcánicas� Hundimientos � Inundaciones� Tornados� Huracanes
CAUSAS HUMANASCAUSAS HUMANAS
� Amenazas de Bomba� Huelgas� Plantones� Empleados Inconformes� Empleados Mal Capacitados� Disturbios Sociales
Pueden ser: •Accidentales o Intencionales•Internos o Externos
Causas de “Desastres” en Informática
© ALAPSI 2007Lámina 14
CAUSAS TECNICASCAUSAS TECNICAS
� Fallas en el Equipo de Cómputo o algún Periférico
� Fallas en el Equipo de Soporte del Centro de Cómputo
� Falla en el Suministro de Energía
� Fallas en Equipo de Telecomunicaciones o algún componente de la red
� Fallas en el Enlace
� “Infección” por Virus Informático
Causas de “Desastres” en Informática
© ALAPSI 2007Lámina 15
1. Destrucción de las instalaciones de T/I
2. Instalaciones de T/I Inaccesibles
3. Instalaciones de T/I inutilizables
Escenarios de “Desastre” en Informática
© ALAPSI 2007Lámina 16
Destrucción de las instalaciones de T/IPor: Incendio, terremoto, inundación, accidente de tráfico, sabotaje,
terrorismo, guerra, etc.
Instalaciones de T/I Inaccesibles Por: Huelga disturbios públicos, acordonamiento del área, visita delPapa, contaminación química, contaminación nuclear, etc.
Instalaciones de T/I inutilizables por cualquier razónFallas de componentes de equipos o dispositivos que los hacen no utilizables.Ejemplos: Defectos de la infraestructura del edificio, tales como: Fallas del sistema de energía electrica, Goteras, fallas en el sistema hidráulico, fallas en el sistema de aire acondicionado, fallas de los transformadores externos al edificio, fallas en el Sistema de Comunicaciones, en la Red, en el Sistema telefónico, en el Sistema de Transportación, etc.
Escenarios de “Desastre” en Informática
© ALAPSI 2007Lámina 17
Recuperación del Servicio Informático (DRP)
Respuesta
RestaurarS.O.
Restaurar aplicaciones
Restaurar datos
Restauración de la REDDatos/VozDesastre
Reubic. funciones negocio
Reubicaciónáreas de
soporte no DP
AplicarBacklog
ReanudarNegocio
Sitetemporal?
SitePermanente
Registros Vitales
Transacciones perdidas
Transacciones generadas (Backlogged)
SYNCH
Recuperación de las Funciones del Negocio (BRP)
Proceso de Recuperación Sistemas / Red de Comunicaciones/ Función del Negocio
© ALAPSI 2007Lámina 18
Recovery Time Objective (RTO)
El tiempo en el cual la función de Negocios o Aplicación debe ser restaurada a niveles aceptablesde capacidad operacional para minimizar el impacto de una interrupción de la función (outage)
Punto deInterrupción
Recuperación de las operaciones (del negocio o de losServiciosInformáticos
Procesos del negociofuncionales
Recovery Time Objective
Es el tiempo entre el punto de interrupción y el punto en el cual las funciones del Negocio o las Aplicaciones deben estar operacionales y actualizadas al último status
Tiempo
Funciones del Negocio o Aplicaciones en operación con datosprecisos y actualizados
© ALAPSI 2007Lámina 19
Ultimo Backup
RegresoRegresoa Casaa Casa
Transacciones porProcesar
(Datos Catch Up)HabilitaciHabilitacióónn de de
InfraestructuraInfraestructura y y ááreasreas de de trabajotrabajo parapara
UsuariosUsuarios
RecuperaciRecuperacióónn de lade laInfraestructuraInfraestructuraInformInformááticatica
Transacciones Perdidas(Datos Huérfanos)
RespuestaRespuesta a la a la EmergenciaEmergencia
Sincronización de los Datos
ReanudaciReanudacióónn dedeOperacionesOperaciones
RegistrosRegistrosVitalesVitales
Secuencia de Eventos en la Recuperación de las Operaciones del Negocio
en un Desastre
© ALAPSI 2007Lámina 20
1. Determinar los Requerimientos del Negocio respecto a “Recuperación en Caso de Desastre”
2. Determinar los Requerimientos de T/I
3. Diseñar la Solución de Respaldo y Recuperación
4. Determinar la Estrategia de Respaldo y Recuperación
5. Implementar la Solución de Respaldo y Recuperación
6. Probar, mantener y actualizar la capacidad de Respaldo y Recuperación
Metodología para Diseñar, Desarrollar, Implementar y
Mantener un Plan para Recuperación de Desastres
© ALAPSI 2007Lámina 21
ANALISIS DEL RIESGO DE UN DESASTRE
La realización de un Análisis de Riesgo muestra los puntos débiles de una Organización que podrían llevar a la pérdida de Activos y de Funciones Críticas de la empresa.
El Análisis de Riesgo debe incluir (pero no estar limitado a) las siguientes áreas:
- Seguridad Física- Seguridad de Datos- Empleados Inconformes- Sistemas de Respaldo y Recuperación- Vulnerabilidad de la Infraestructura- Ubicación del Centro de Cómputo- Habilidades Clave
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 22
Amenazas:
Incendio Terremoto InundaciónFalla de HW Falla de SW BombazoHuelga Explosión Fugas de GasFugas de Agua Corto Circuito Guerrilla UrbanaAltas de tensión Guerra Actos TerroristasVirus Informáticos Acordonamiento del AreaCaída de ceniza VolcánicaManifestaciones CallejerasAtaque de Empleados inconformes
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 23
Tabla para el Análisis de Riesgos de Desastre
Amenaza Probabilidad Alcance Escenario Duración de Impacto de ocurrencia de efecto de Desastre la Interrupción
Incendio Alta Sala Destrucción < 12 horas AltoMedia Piso No Acceso 12 a 24 horas MedioBaja Edificio No uso 24 a 48 horas Bajo
Campus 48 a 72 horas $$$$Zona / Plaza +72 horas1 a 10 Kms de radio10 a 50 Kms de radio50 a 100 Kms de radio+100 Kms de radioSistema de CómputoSistema de ComunicacionesCiudadRegión, País
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 24
NIVELES DE CRITICIDAD
1. Alto Nivel Crítico (Crítico) RTO < 24 horas
La pérdida de la capacidad para procesar información produciría un impacto inmediato y fuerte en la capacidad de la organización para mantener los servicios que proporciona a sus clientes o usuarios
2. Nivel Crítico Medio (Importante) RTO < 48 horas
La pérdida de la capacidad para procesar información tendría un fuerte impacto en la capacidad de la organización para operar con efectividad.
3. Nivel Crítico Bajo (Poca Importancia) RTO > 48 horas(Pueden esperar varios días o semanas para ser recuperados.)
La pérdida de la capacidad para procesar información no tendría impacto inmediato ni severo en la capacidad de la organización para satisfacer las necesidades de información de sus clientes o usuarios.
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 25
ANALISIS DE LOS PROCESOS DEL NEGOCIO
El Análisis de los Procesos del Negocio debe definir:
* Cuáles Procesos del Negocio deben incluirse en el alcance de una Recuperación.
* El Impacto (Costo en dinero, pérdida de ingresos, de clientes, etc.) de una Interrupción de Servicio en cada Proceso del Negocio.
* La Máxima Interrupción de Servicio permisible para cada Proceso del Negocio (RTO = Recovery Time Objective).
* La Prioridad de Recuperación para los Procesos del Negocio.
* La dependencia entre los Procesos del Negocio.
* El nivel de las transacciones irrecuperables que será aceptable para cada Unidad de Negocios en el caso de un desastre (RPO = Recovery Point Objective).
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 26
- Utilidades no percibidas- Intereses no ganados- Penalizaciones- Pérdida de Negocios existentes (Medida en % del Negocio actual) - Pérdida de Negocios Futuros
(Medida en función del crecimiento estimado de ingresos de la empresa)- Costo del Proceso de Recuperación- Pagos de Imprevistos- Salarios pagados durante la interrupción- Demandas- Pagos como compensación del servicio- Costo de recreación de Datos Huérfanos- Costo de recreación de Datos Catch-UP- Costo de transacciones perdidas
Cuantificación del Impacto
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 27
IMPACTO DE UNA INTERRUPCIÓN DE SERVICIO
Factores Mitigantes:
- Procedimientos Manuales- Capacitación de Personal- Procedimientos de Respaldo y
Recuperación
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 28
El Impacto con la duración de la Interrupción !!!!!!
13
714
30
S1
$495,634,783
$-
$50,000,000
$100,000,000
$150,000,000
$200,000,000
$250,000,000
$300,000,000
$350,000,000
$400,000,000
$450,000,000
$500,000,000
US$
Días de InterrupciónEmpresa en General
1 37 14
30
Recursos Humanos
Administración
Producción
Ventas
Tesorería
Compras
$-
$50,000,000
$100,000,000
$150,000,000
$200,000,000
$250,000,000
$300,000,000
US$
Días de Interrupción
Acumulación dePérdidas
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 29
Valor Total del Negocio
Máximo Costo Tolerable
Duración del Outage
Cos
to d
el O
utag
e
Tiem
po d
e B
anca
rrot
a
Costo de la Interrupción (Outage) vs
Duración de la Interrupción (Outage)
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 30
• The recovery strategy implemented mustaddress the requirements by businessfunction or application
• What is a tolerable downtime?• How much data can afford to be
lost and reentered?• How will image, market share,
control and regulatory issues be affected?
• Cost effectiveness is achieved by balancing the cost impact of an interruptionagainst the investment cost of recovery
• An effective Recovery Program will, overtime, implement an integrated strategywhich will provide for maximum protectionwithout over investment
Cost ofInterruption
Out ofBusiness
MajorBusiness Loss
Disruption
Inconvenience
Hours Days Weeks Months
Duration of Interruption
Application#1
Application#2
Application#3
Application#4
Impacto al Negocio por Aplicación
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 31
Ventana de Recuperación(Costo/Tiempo)
Costo y duración de la Estrategia
de Recovery
Costo
y Dur
ació
n del
Outag
e
Tiempo
Cos
toDependencia Costo y Tiempo / Estrategia
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 32
• The recovery strategy implemented mustaddress the requirements by businessfunction or application
• What is a tolerable downtime?• How much data can afford to be
lost and reentered?• How will image, market share,
control and regulatory issues be affected?
• Cost effectiveness is achieved by balancing the cost impact of an interruptionagainst the investment cost of recovery
• An effective Recovery Program will, overtime, implement an integrated strategywhich will provide for maximum protectionwithout over investment
Cost ofInterruption
Out ofBusiness
MajorBusiness Loss
Disruption
Inconvenience
Hours Days Weeks Months
Duration of Interruption
Application#1
Application#2
Application#3
Application#4
Cost of RecoveryCurve
Impacto al Negocio por Aplicación
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 33
1. Identificar los Procesos Críticos del Negocio
2. Identificar Interrelaciones y Dependencias entre los Procesos Críticos
3. Determinar el impacto al Negocio por la no operación de cada Proceso Crítico debida a la Interrupción del Servicio en función de la duración de la interrupción
Impacto por:
1 hora 24 horas 1 Semana4 horas 48 horas 2 Semanas8 horas 72 horas 1 Mes
12 horas
Pasos para llevar a cabo un BIA
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 34
4. Determinar el RTO o Máximo Tiempo Tolerable de duración de la Interrupción del Servicio para cada Proceso Crítico del Negocio.
RTO 1 = 0 a 12 HorasRTO 2 = 12 a 24 HorasRTO 3 = 24 a 48 HorasRTO 4 = 48 a 72 HorasRTO 5 = +72 Horas
5. Determinar el RPO o Máxima Pérdida Tolerable de datos
RPO 1 = 0 a 4 HorasRPO 2 = 4 a 12 HorasRPO 3 = 12 a 24 HorasRPO 4 = 24 a 48 HorasRPO 5 = +48 Horas
Pasos para llevar a cabo un BIA
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 35
6. Clasificar los Procesos Críticos por Nivel de Criticidad
Nivel 1: RTO = 0 a 12 Horas / RPO = 0 a 4 HorasNivel 2: RTO = 12 a 24 Horas / RPO = 4 a 12 HorasNivel 3: RTO = 24 a 48 Horas / RPO = 12 a 24 HorasNivel 4: RTO = 48 a 72 Horas / RPO = 24 a 48 HorasNivel 5: RTO = +72 Horas / RPO = +48 Horas
Determinar los Requerimientos del Negocio
Pasos para llevar a cabo un BIA
© ALAPSI 2007Lámina 36
7. Elaborar las Gráficas de Impacto vs Duración de la Interrupción del Proceso para cada Proceso Critico
8. Elaborar las Gráficas de Impacto vs Duración de la Interrupción para cada Nivel de Criticidad
9. Elaborar la Gráfica de Impacto Total al Negocio vs Duración de la Interrupción de las Operaciones
Determinar los Requerimientos del Negocio
Pasos para llevar a cabo un BIA
© ALAPSI 2007Lámina 37
Segmento 1
Segmento 2
Segmento 3
Segmento 4
EstrategiaDe
Segmentación
Requerimientos de Continuidad de las Operaciones de la Organización
RTO / RPO Recovery Time / Recovery Point
Estrategia de Segmentación para la Continuidad de las Operaciones
0-12 hrs / 0-4 hrs
12-24 hrs / 4-12 hrs
24-72 hrs / 24 hrs
>72 hrs / 48 hrs+
Determinar los Requerimientos del Negocio
© ALAPSI 2007Lámina 38
Determinar los Requerimientos de T/I
© ALAPSI 2007Lámina 39
Asociar los Requerimientos del Negocio con las Aplicaciones
* Identificar las relaciones entre los Procesos del Negocio, las Aplicaciones y los Datos requeridos.
* Los requerimientos para recuperar una Aplicación y sus Datos son los mismos requerimientos para la Recuperación del Proceso del Negocio al que soportan.
* Si un Proceso del Negocio tiene una Máxima Interrupción Tolerable de 12 horas (Recovery Time Objective RTO =12 horas), entonces las Aplicaciones y los Datos que dan soporte a ese Proceso del Negocio deben restablecerse y recuperarse en 12 horas o menos.
* Si un Proceso del Negocio sólo puede aceptar una pérdida de transacciones de hasta una hora antes del desastre (Recovery Point Objective RPO = 1 hora), entonces las Aplicaciones asociadas deben recuperarse de manera que aseguren que la pérdida de datos sea de menos de 1 hora.
Determinar los Requerimientos de T/I
© ALAPSI 2007Lámina 40
XPN1
Procesos del Negocio
Aplicaciones
PN2X
PN3
XAPL1
XAPL2 APL3
XAPL4
DatosXD1
XD2 D3
XD5
Relación entre Procesos del Negocio, Aplicaciones y Datos
X= componente crítico
Determinar los Requerimientos de T/I
© ALAPSI 2007Lámina 41
..............Aplic. n
....
NingunaNinguna.10 Min.1Aplic. 3
Cadena Batch XYZÚltimas 500 trx.
36 hs.3Aplic. 2
Entrada para aplic. N, DB2
Últimas 3 hs.
18 hs.2Aplic.1
Interrelación con otras aplicaciones y datos
Pérdida de datos máxima
Tiempo de Interrupción permitido
Nivel de Criticidad
Requerimientos de Respaldo y Recuperaciónde las Aplicaciones (Parte #1)
Determinar los Requerimientos de T/I
© ALAPSI 2007Lámina 42
12 lineas
1 x 4800
2 x 64 k
2 x 9600
NetworkLoad (baud)
160,00070 GB96 MB32.0Total
....
5,0000.4 GB6.2 MB1.4Aplic. 3
40,0003.6 GB12.8 MB6.1Aplic. 2
10,0001.1 GB7 MB7.0Aplic.1
PrintVolume(pages)
DASD Storage
ProcessorStorage
ProcessorPerformanceUnits
Requerimientos de Respaldo y Recuperaciónde las Aplicaciones (Parte #2)
Determinar los Requerimientos de T/I
© ALAPSI 2007Lámina 43
Data Center
Empresa Clientes o Usuarios Remotos
PC PC
PC PC
CARRIERCLIENTE
- Oficina Central con Sucursales
- Posiciones de trabajo con PC’s
- Servidores Intel
- Equipo de Comunicaciones
- Acceso a Usuarios y Clientes Remotos
- Proveedores de Comunicaciones
Diseñar la Solución de Respaldo y Recuperación
© ALAPSI 2007Lámina 44
Data Center
Empresa Clientes o Usuarios Remotos
PC PC
PC PC
CARRIERCLIENTE
- Oficina Central con Sucursales
- Posiciones de trabajo con PC’s
- Servidores Intel
- Equipo de Comunicaciones
- Acceso a Usuarios y Clientes Remotos
- Proveedores de Comunicaciones
Diseñar la Solución de Respaldo y Recuperación
© ALAPSI 2007Lámina 45
Configuración de Recuperación:
– Infraestructura de Oficina • Copiadora, Fax, Impresora
– 15 Posiciones de trabajo• PC, Línea y Equipo Telefónico
– 2 Servidores Intel– Equipo de Comunicaciones
• Ruteador, Puerto Ethernet, Tarjeta Serial
Diseñar la Solución de Respaldo y Recuperación
© ALAPSI 2007Lámina 46
Data Center
Empresa Clientes o Usuarios Remotos
PC PC
PC PC
CARRIERNACIONAL
- Oficina Central con Sucursales
- Posiciones de trabajo con PC’s
- Servidores Intel
- Equipo de Comunicaciones
- Acceso a Usuarios y Clientes Remotos
- Proveedores de Comunicaciones
Site Alterno
PC PC
- Infraestructura de Oficina
- Posiciones de trabajo con PC’s
- Servidores Intel
- Equipo de Comunicaciones
- Acceso a Usuarios y Clientes Remotos
- Proveedores de Comunicaciones
Diseñar la Solución de Respaldo y Recuperación
© ALAPSI 2007Lámina 47
Configuración para la Recuperación:– Infraestructura de Oficina
• Copiadora, Fax, Impresora– 150 Posiciones de trabajo
• PC, Línea y Equipo Telefónico– 30 Servidor Intel– Equipo de Comunicaciones
• Ruteador, Puerto Ethernet, Tarjeta Serial – 2 Equipos AS/400 (en USA)– 4 Equipo Tandem (en USA)– 1 Equipo Sun 15000 (en USA)– 1 Equipo Mainframe IBM (en USA)– Enlace Internacional y Equipo de Comunicaciones (USA)
Diseñar la Solución de Respaldo y Recuperación
© ALAPSI 2007Lámina 48
Data Center
Empresa Clientes o Usuarios Remotos
PC PC
PC PC
CARRIERNACIONAL
- Oficina Central con Sucursales
- Posiciones de trabajo con PC’s
- Servidores Intel
- Equipo Midrange
-Equipo Mainframe
- Equipo de Comunicaciones
- Acceso a Usuarios y Clientes Remotos
- Proveedores de Comunicaciones
Ssite Alterno en México
PC PC
- Infraestructura de Oficina
- Posiciones de trabajo con PC’s
- Servidores Intel
-- Equipo Midrange
-- Equipo Mainframe
- Equipo de Comunicaciones
- Acceso a Usuarios y Clientes Remotos
- Proveedores de Comunicaciones
- Enlace Internacional
Site Alterno en USA
PC PCEnlace Internacional
AS/400
IDC
IDC
AS/400
- Equipo Midrange
- Equipo de Comunicaciones
Diseñar la Solución de Respaldo y Recuperación
© ALAPSI 2007Lámina 49
Cómo Determinar la Distancia más correcta entre el Site de Producción y el Site de Recuperación ???
Site deProducción
Site deRecuperación
Alcance de Efecto de la Amenaza
Diseñar la Solución de Respaldo y Recuperación
© ALAPSI 2007Lámina 50
Objetivos de un DRP/BRP
1. Reducir significativamente la probabilidad de dañopara la empresa por causa de un desastre
2. Mejorar la capacidad de supervivencia de laempresa en caso de problemas que impidansu operación.
3. Reducir la duración de la no-operabilidad
4. Reducir el costo de la Recuperación
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 51
Estrategias de Respaldo y Recuperación
* Identificar alternativas de respaldo de datos fuerade sitio
* Identificar alternativas de respaldo deprocesamiento
* Identificar alternativas de respaldo de redes
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 52
Es deseable que el tiempo entre el momento del desastre y el reinicio del trabajo de producción en el Site de Recovery sea corto.
Un rápido restablecimiento de las operaciones es posible si el Site de Recovery está totalmente preparado, con todo el HW instalado, y con todoslos datos al último nivel de actualización.
En la industria de Servicios de Recovery, se utilizan los términos: - Cold- Warm y - Hot
para describir el grado en el cual se tiene preparado el Site de Recovery.
Preparación del Site de Recovery
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 53
Aunque puede haber definiciones másprecisas sobre las fronteras entre: COLD, WARM y HOT, la realidad esque estos términos son usadosampliamente de una manera subjetiva.
Preparación del Site de Recovery
COLD ????, WARM???, HOT ??????
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 54
De quién debe ser el Site Alterno ???
Quién debe controlar y administrar el Site Alterno ???
A. Site Alterno propiedad de la Empresa
B. “Mutual Agreement” con algun(os) DisasterRecovery Partner(s).
C. Recovery Service
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 55
1. Site Alterno Propio exclusivo para Recuperación
2. Site Alterno Propio con División de la Carga de Trabajo
* Backup & Recovery Mutuo
* Backup & Recovery Mutuo con División de la Carga de Trabajo Crítica
* División de la Carga de Trabajo a través de múltiples Sites
A. Site Alterno Propiedad de la Empresa
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 56
B. “Mutual Agreement” con algun(os) Disaster Recovery Partner(s).
Esta Estrategia es de muy bajo costo para algunos ambientes, pero tiene serias desventajasy riesgos en muchos casos.
- El desastre puede ocurrir en el peor momento cuando el Recovery Site tiene la “cargapico” o tiene algún otro problema.
- La mayoría de estos Sites no tienen recursos excedentes disponibles.Consecuentemente, estos acuerdos son de valor cuestionable para los grandes Sites,los cuales requieren de muchos recursos en caso de un desastre
- Si una instalación sufre un desastre por descuido de su personal, la otra está en riesgo.
- Los acuerdos verbales, generalmente no son funcionales
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 57
B. “Mutual Agreement” con algun(os) Disaster Recovery Partner(s).
¿ Cuanto tiempo estará disponible el Site prestado?� ¿ Que lugar y equipos se proveerán?� ¿ Se proveerá de asistencia del personal?� ¿ Que velocidad de acceso puede tenerse al Site de recuperación?� ¿ Durante cuanto tiempo puede continuar la operación de
emergencia?� ¿Con que frecuencia puede probarse el sistema para comprobar la
compatibilidad?� ¿ Como se conservará la confiabilidad de datos?� ¿ Que tipo de seguridad se tendrá para las operaciones de
procesamiento de datos?� ¿ Con que antelación debe solicitarse la utilización del centro?� ¿ Existen épocas del año, del mes, etc.. en las que no se dispondrá
del uso del sistema?
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 58
C. Recovery Service
- Subscripción a Servicios Comerciales de:+ Hot Site+ Cold Site+ Mobile Data Center+ WorkGroup Recovery Area+ Quick Ship+ Hosting Services+ High Availability Services
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 59
Servicios de Hot Site
Uso inmediato y exclusivo de las InstalacionesNo hay preferencias de
acceso y/o usoSistemas de Cómputo
totalmente operacionalesMúltiples Niveles de
Redundancia en RedesInstalaciones Robustas
y SegurasSoporte Técnico Especializado a la medida
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 60
Command Centers del HotSite
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 61
Infraestructura en el HotSite
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 62
Areas de descanso y cafetería en el HotSite
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 63
• Evita altos costos de inversión.
• Evita altos costos de Mantenimiento.
• Exime la posibilidad de unsabotaje interno.
• Las actualizaciones de hardware en dispositivos se hacen sin grandes previsiones de actualización y presupuesto.
• Expertos en la materia apoyan en el proceso de pruebas y Recuperación en caso de Desastre
• Evita riesgos de operación.
• Evita la creación, capacitación yadministración de un área específica.
• Mayor control y supervisión.
Ventajas del Site Alterno Externo:
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 64
Servicios de Hot Site
Generálmente, existe una relación de Costo de 10 a 1 entre las opciones de
“Construir un Site de Recuperación Propio” (Hot Site Interno)
vs.
“Contratar los Servicios de Una empresa especializada”(Hot Site Comercial)
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 65
Cold Site
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 66
“Mobile Data Center”
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 67
“Mobile Data Center”
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 68
• Infraestructura de Oficinas funcionales y seguras para servir a grupos de trabajo de nuestros usuarios incluyendo los siguientes servicios:
— Salones de Conferencias, Salones de descanso, Oficinas y Cafetería— Estaciones de Trabajo
Amuebladas — Servicios de Teléfono,
Copiadora y Fax— Configuración de
Equipo de Cómputo y Comunicaciones necesario para la Recuperación
— Soporte especializado
Servicios de “WorkGroup Recovery”
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 69
Servicios de “WorkGroup Recovery”
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 70
Servicios - “Quick Ship”• Entrega de Servidores y PC’s, Unidades de Cinta,
Impresoras, MUX’es, Modems, Routers, Controladores, etc.
• El servicio se garantiza al clienteen 48 horas de haber declaradoel Desastre.
• Uso inmediato y exclusivodel Servicio.
• Esquema “First Come - First Serve”.
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 71
Hosting Services- Tele-Housing- Tele-Port- Co-Location- Shared Services- Dedicated Services- ASP (Application Service Provider)- ISP (Internet Service Provider)- Data Center Provider- Managed Services
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 72
• Continuidad de acceso para el procesamiento de información de misión crítica.
— Vaulting, Mirroring, Shadowing• Protección segura de datos fuera de sitio en tiempo real• Reducción de la Ventana
de Recuperación— Ventana de Recuperación
Standard = 24-48 hours— Los servicios de High
Availability pueden reducir este tiempo a minutos
• Acceso inmediato a los datos en caso de desastre
Servicios High AvailabilityServicios High Availability
Determinar la Estrategia de Recuperación
© ALAPSI 2007Lámina 73
Estrategias para Recuperación del Servicio Informático en caso de Desastre
Cold Site
Site Alterno RedundanteHotSite Comercial con Servicios adicionales
Electronic Vaulting,Journaling & Vaulting
HotSite ComercialTradicional
Minutos Horas Días Semanas
Cos
to d
e la
Rec
uper
ació
n $$
Requerimientos de Tiempo de Recuperación
Requerimientos de Actualidad de Datos
Replicación de Datos
ATOD
© ALAPSI 2007Lámina 74
Segmento 1
Segmento 2
Segmento 3
Segmento 4
EstrategiaTipo de Aplicación y
Estrategia RecomendadaRequerimientos de Continuidad de las Operaciones de la Organización
RTO / RPO Recovery Time / Recovery Point
Aplicación: Facturación
Estrategia:- Hot-Site Comercial
Aplicación: No Crítica
Estrategia:- Recuperación “ATOD”
(At Time Of Disaster)
Aplicación: E-commerce
Estrategia:- High Availability
Aplicación: Inversiones
Estrategia:- HotSite + Servicios
Complementarios
Estrategia de Segmentación para la Continuidad de las Operaciones
0-12 hrs / 0-4 hrs
12-24 hrs / 4-12 hrs
24-72 hrs / 24 hrs
>72 hrs / 48 hrs+
© ALAPSI 2007Lámina 75
OPCIONES DE DISPONIBILIDADOPCIONES DE DISPONIBILIDAD
-24 -12 0 12 24 36 48 60 72 84
Recuperación Tradicional• Recuperación a partir de Registros Vitales
(Sist. Operativo, DBMS, Aplicaciones y Datos)
Data Staging*Se puede iniciar restauración inmeditamente
Sist. Operativo Precargado(Stand by Op. System)• Se puede dar IPL inmediatamente
Electronic Vaulting*Se simplifica la Logística
Protección de Transacciones“Remote Journaling” Automático
(incluye un Electronic Vaulting limitado)
Data Shadowing*Elimina los Riesgos de la Recuperación de
Datos (incluye Protección de Transacciones)
Hot Standby*Restauración Inmediata
(incluye Data Shadowing)
Horas de Transacciones Perdidas (RPO) Horas Requeridas para reestablecer operaciones del Negocio (RTO)
Recreación deTransacciones
TransaccionesNo Capturadas
DeclaraciónDe Desastre
Recuperación deRegistros Vitales
Traslado RestauraciónDel Sistema
IPL & Activa-ción de la Red
Restauraciónde BD´s
© ALAPSI 2007Lámina 76
Desarrollo del Plan
•Definición de Grupos de Recuperación•Procedimientos de notificación y activación•Procedimientos de respuesta a la emergencia•Procedimientos de recuperación detallados•Procedimientos de retorno a la operación normal•Procedimientos de distribución y control
Implementar la Solución de Respaldo y Recuperación
© ALAPSI 2007Lámina 77
DR Organization Teams
� Equipo de Acción ante Emergencias (Emergency Action Team)� Equipo de Determinación de los Daños (Damage Assessment Team)� Equipo Administrativo de Emergencia (Emergency Management Team)� Equipo de Almacenamiento Externo (Offsite Storage Team)� Equipo de Software (Software Team)� Equipo de Aplicaciones (Applications Team)� Equipo de Seguridad (Security Team)� Equipo de Operaciones de Emergencia (Emergency Operations Team)� Equipo de Recuperación de la Red (Network Recovery Team)� Equipo de Comunicaciones (Communications Team)� Equipo de Transporte (Transportation Team)� Equipo de HW del Usuario (User Hardware Team)� Equipo de Preparación de Datos y de Archivos (Data Preparation and Records Team)� Equipo de Soporte Administrativo (Administrative Support Team)� Equipo de Suministros (Supplies Team)� Equipo de Salvamento (Salvage Team)� Equipo de Reubicación (Relocation Team)
© ALAPSI 2007Lámina 78
Actualizar la Solución en forma constante
Crear e implementar procedimientos para:* Mantenimiento* Prueba y* Auditoría del Plan de Recuperación
Probar, Mantener y Actualizar la
Capacidad de Respaldo y Recuperación
© ALAPSI 2007Lámina 79
Pruebas, Capacitación y Mantenimiento
•Desarrollo del plan de pruebas•Pruebas de Hotsite•Evaluación de resultados de las pruebas•Retroalimentación de acuerdo a los resultados•Desarrollo del proceso de actualización y
mantenimiento•Desarrollo de programas de concientización•Desarrollo de programas específicos de capacitación
Probar, Mantener y Actualizar la
Capacidad de Respaldo y Recuperación
© ALAPSI 2007Lámina 80
Pruebas del DRP
Primer EjercicioVerificación del Sistema OperativoPrueba de Aplicaciones SelectivasPrueba limitada de la Red de Comunicaciones
Ejercicios SubsecuentesPrueba completa de AplicacionesPrueba completa de la RedInvolucración de Usuarios
Mock Disaster Exercise
Probar, Mantener y Actualizar la
Capacidad de Respaldo y Recuperación
© ALAPSI 2007Lámina 81
!! La mejor evidencia
de que un DRP funciona
es la prueba !!
Probar, Mantener y Actualizar la
Capacidad de Respaldo y Recuperación
© ALAPSI 2007Lámina 82
1. PROJECT INITIATION AND MANAGEMENT
2. RISK EVALUATION AND CONTROL
3. BUSINESS IMPACT ANALYSIS
4. DEVELOPING BUSINESS CONTINUITY STRATEGIES
5. EMERGENCY RESPONSE AND OPERATIONS
Metodología del DRII para el Desarrollo de un BCP
DRII = Disaster Recovery Institute International
© ALAPSI 2007Lámina 83
6. DEVELOPING AND IMPLEMENTING BUSINESS CONTINUITY PLANS
7. AWARENESS AND TRAINING PROGRAMS
8. MAINTAINING AND EXERCIZING BUSINESS CONTINUITY PLANS
9. PUBLIC RELATIONS AND CRISIS COMMUNICATIONS
10. COORDINATION WITH PUBLIC AUTHORITIES
Metodología del DRII para el Desarrollo de un BCP
DRII = Disaster Recovery Institute International
© ALAPSI 2007Lámina 84
Factores Críticos de Éxito en un Plan de Recuperación
1. Infraestructura de Cómputo de Respaldo2. Red de Comunicaciones de Respaldo3. Respaldo de Archivos, DB´s y Software4. Recuperación de “Grupos de Trabajo”5. Personal Capacitado6. Apoyo de la Alta Dirección7. Plan Documentado8. Pruebas9. Mantenimiento y Actualización
© ALAPSI 2007Lámina 85
¡ Muchas Gracias !