美国 飞康 软件 公司 环境适应性容灾 解决方案 中 国 区 技术总监 颜军
DESCRIPTION
美国 飞康 软件 公司 环境适应性容灾 解决方案 中 国 区 技术总监 颜军. 美国 飞康 公司 简介. 成立于 2000 ,主要成员来自 原 美国 Cheyenne Software ( 夏恩软件)的 专业团队 成功 创 立 ARCserve 为 基于 服务器备份软件的第一品牌 1996 年被 Computer Associates (CA) 以 12 亿美金 (US$1.2Billion) 收购 公司总部设在美国纽约州的 Melville 全球销售及支持体系,在十五个主要国家设有办事机构 全球超过 300 名员工 中国分部近七十人,分布北京及上海 - PowerPoint PPT PresentationTRANSCRIPT
美国飞康公司简介
成立于 2000 ,主要成员来自原美国 Cheyenne Software ( 夏恩软件 ) 的专业团队
成功创立 ARCserve 为基于服务器备份软件的第一品牌 1996 年被 Computer Associates (CA) 以 12 亿美金 (US$1.2Billion) 收购
公司总部设在美国纽约州的 Melville 全球销售及支持体系,在十五个主要国家设有办事机构 全球超过 300 名员工 中国分部近七十人,分布北京及上海
基于网络存储的架构,为企业数据的高可用性提供最佳解决方案 已拥有全球近千家企业级用户 创新的数据保护技术获得业界的公认并被广泛采纳 美国 NASDAQ 上市公司,市值 超过 3 亿美金,股票代码为 : FALC
2005 年销售额增长 69%
重要的业务连续性指标
(1). 数据恢复点目标 RPO ( RECOVERY POINT OBJECTIVE ):体现为该流程在灾难 发生后,恢复运转时数据丢失的可容忍程度;如丢失 1 小时数据称 RPO=1 小时。
(2). 恢复时间目标 RTO ( RECOVERY TIME OBJECTIE ):体现为该流程在灾难发生后,需要恢复的紧迫性也即多久能够得到恢复的问题;如业务停止 1 小时称 RTO=1 小时
Savings ($)
IAIA
V
A
I
L
A
B
I L
I T
Y99.999999.9999
99.99999.999
99.9999.99
99.999.9
99.599.5
99.099.0
98.098.0
95.095.0
%%UptimeUptime
450+ hours450+ hours
180+ hours180+ hours
87.6 hours87.6 hours
43.7 hours43.7 hours
8.75 hours8.75 hours
52 minutes52 minutes
5 minutes5 minutes
30 seconds30 seconds
每年宕机时间每年宕机时间
IT 系统高可用 HA 的级别
常规容灾的技术手段Offsite tape storage
难于管理 耗费人工 需要漫长的恢复手段 磁带恢复的可靠性?
Host-to-host replication
SD
Select Unload
HEWLETTPACKARD SureStore DLT70
SD
Select Unload
HEWLETTPACKARD SureStore DLT70
SD
Select Unload
HEWLETTPACKARD SureStore DLT70
SD
COMPAQPROLIANT 1500
SD
COMPAQPROLIANT 1500
SD
COMPAQPROLIANT 1500
多个管理点 OS 内需要专用软件 影响主机的处理能力 缺少数据库的特别支持体系 主机必须为同一系统
Disk array-to-disk array replication 无法跨设备复制,形成设备瓶颈 需要加接远程传输设备 缺少数据库的特别支持体系
SD
COMPAQPROLIANT 1500
SD
COMPAQPROLIANT 1500
SD
SPARCserver 2000Sun
SD
COMPAQPROLIANT 1500
SD
COMPAQPROLIANT 1500
SD
SPARCserver 2000Sun
IP WANApplicationservers
Site A Site B
Applicationservers
SD
COMPAQPROLIANT 1500
SD
COMPAQPROLIANT 1500
SD
COMPAQPROLIANT 1500
Vendor A Storage Same Storage,Vendor A
IP WAN
磁盘阵列 A
FC Switch FC Switch
Tape Library
OracleLinux
SQLWindows
SQLCluster Windows
Oracle RACBackup Server+Backup Software
LAN LAN
SAN Backup Stream
远程复制
P
Exchange
IP 远程连接
一个典型的用户现有环境和 DR 环境
磁盘阵列 B
问题
容灾中心设备选择
-- 容灾中心的设备选择能否开放?
-- 生产中心的原有主机系统和存储系统能否保留?
恢复指标
-- 数据库数据一致性如何保证?
-- 人为的误操作能够恢复吗?
-- 本地恢复的速度有多快?
建置本地系统的 HA 时,主机与存储之间没有依赖关系,但建置容灾( DR 时,是否也能如同 HA 般无相关性?还是被强置要求一定要连同主机、存储设备一起进行对称性建设? --- (异构设备间的容灾)
除了部署异地灾备系统以避免火灾,水灾,地震,停电等天灾外,能否保护长期潜在的病毒、黑客、人员误操作等带来的人祸呢?
--- (渐变式灾难的保护)
问题
一个典型的 Exchange 系统恢复时间
恢复步骤 Time
确认恢复磁带或存档 ? 分钟
安装 Windows 操作系统 60 分钟
安装 Service Pack 及安全性更新
50 分钟
执行 Exchange Disaster Recovery 模式安装
20 分钟
安装 Exchange Service Pack and Patch
20 分钟
还原 130GB 数据 ? 小时
运行观察 ?小时
一个典型的误操作恢复时间
恢复步骤 Time
从备份系统确认恢复磁带或存档磁带
? 分钟
数据库全恢复 120 分钟
找到丢失记录,进行回写 20 分钟
如果是当天生成的文件记录丢失,恢复时间
???无法恢复
C: D:C: D:
Hostnot on SAN
(DASD)
飞康公司的 CDP+DR 解决方案
Key Benefits 任意存储之间 增量级别的复制(时间增量、数据增量) 重点在于最佳的 RTO (minutes) 连续复制,并且提供 256 个快照拷贝能力
DiskSafe
C: D:C: D:
C: D:C: D:
TM-1TM-1
TM-2TM-2
飞康公司的几种保护模式 In-band
很小的性能影响,释放主机和存储负荷 提供强大的服务功能 智能 cache 提速
Side-band 旁路型 不占用数据通路 使用低级别存储 保护生产系统,最小改动
PP PP SS
Host
IPStor
PrimaryStorage
SecondaryStorage
In-Band Side-Band
SANFabric
Replication
CacheCache
Replication
DiskSafe
面向高速恢复的快照技术
IP Switch
LD1LD1
LD2LD2
LD1LD1*
数据影像
M-LD1M-LD1*
M-LD1M-LD1 M-LD1M-LD1*
M-LD1M-LD1*
M-LD1M-LD1*
10:00 11:00 12:00 12:15
Group1
09:30 10:00 10:30 11:00
AutomaticHourly
Snapshots
SnapshotStorage Area
Original Source Data Volume
9am
Initial Snapshot(contains no data)
10am
11am
12pm
147
10
258
11
369
12
NewData
Blocksadded
10:00-10:59
147
10
258
11
369
12
11:00-11:59
NewData
Blocksadded
147
10
258
11
369
12
StorageBlocks
Containdata
9:00-9:59
147
10
258
11
369
12
NewData
Blocksadded
26
7
910
1
12
2 6 7
9 10
1 12
Old data blocks are stored in the
Snapshot Storage Area
26
7
26
7 910
不同时间点的自动快照
如何恢复? 检查 11:00 快照保护的数据
直接选择时间点数据
LD1LD1
LD2LD2
EthernetSwitch
LD1LD1*
T-11T-11SnapshotTime-View Disk
M-LD1M-LD1
M-LD2M-LD2
M-LD1M-LD1*
M-LD1M-LD1*
M-LD1M-LD1*
M-LD1M-LD1*
M-LD1M-LD1*
10:00 11:00 12:00 12:15
Group1
M-LD1M-LD1
M-LD2M-LD2
M-LD1M-LD1
M-LD2M-LD2
M-LD1M-LD1
M-LD2M-LD2
M-LD1M-LD1
M-LD2M-LD2
10:00 12:00 14:00 16:00
T-11T-11*
T-11T-11*
MON
TUE
WED
典型用例:各分公司的应用服务器保护系统
M1-3M1-3
M1-2M1-2
M1-1M1-1
M1-3M1-3
M1-2M1-2
IP Switch
D1D1
D2D2
D1D1
M1-1M1-1
MD1MD1Continuous Mode AM10:30
AM11:00
AM11:30
DiskSafe
DiskSafe
DAS DiskSafeMirror Disk
Mirror DiskSnapshot
DDnn MDMDnn
MD1MD1
Mn-sMn-s
MD1MD1 Periodic Mode
M2-3M2-3
M2-2M2-2
M2-1M2-1
MD2MD2
AM09:00AM10:30
AM11:00
PM01:00
持续同步
两小时同步一次
D1D1
DiskSafe
分公司服务器
Internet/WAN
M1-3M1-3
M1-2M1-2
M1-1M1-1
MD1MD1 Periodic Mode
每天同步一次
网络流量控制
备份服务器
Hyper Trac
TM1TM1
TM1TM1
飞康公司 DiskSafe 保护体系
避免服务器负荷
占用最小 CPU System Kernel Filter Driver–, 3-5% CPU
最小的内存占用保护 1TB 磁盘约使用 32MB 内存
适用于各种网络带宽可控制使用的网络流量
远程复制 over IP
IP NetworkFC-SAN@
Primary Site
FC-SAN@
DR Site
DB SnapshotAgent
Delta ReplicationDelta Replication
连续复制和增量复制模式任意的存储设备快照技术确保瞬间恢复能够适应现有环境
IPStor Appliance
IPStor Appliance
飞康采用的 MicroScan 技术,极少的传输量
Application Small-block Writes(2x512 byte sectors)
File-system Writes4K Block Size
MicroScan Transfers2x512 Bytes
Block 级,较多的传输量
Microscan, 最小的传输量
IPStor DR 解决方案概览
ApplicationHost
ApplicationHost
Local-CachePrimary
Primary
CiscoSANtap
Local-Cache
ApplicationHost
Primary
ApplicationHost
PrimarySplit-Mirror
e.g. BCV
Backup Server
VTL Storage
Application Host withDiskSafe or FileSafe
Primary Local-Cache
FC/iSCSI SAN
Service Provider
Application Host withDiskSafe or FileSafe
Primary
IP Network
Application HostLocal mirror
Local-Cache Primary
IPStor 企业级网络存储解决方案 存储整合
存储的集中管理 异构存储设备的整合 SAN & NAS 的统一
数据容灾及业务持续性 渐变式灾难后的快速数据恢复 灾难恢复
备份的整合与加速 VTL虚拟磁带库
Exchange 服务 OK
三台 Exchange 服务器,超过 1000 个信箱,130GB以上数据量
原有的 Exchange 的灾难恢复经验备份软件恢复时间无法保障
从原先的五小时缩短到 15 分钟操作系统五分钟启动不需要数据恢复,系统直接上线运行架构简单IT 人员可在短时间自行维护
英华达的分享“ 既然无法避免邮件服务器宕机的可能,我们希望至少在宕机发生后,可以在最短的时间内恢复回来,恢复正常运行。”
飞康的容灾解决方案为您的环境而设计 任意的存储设备和传输协议 涵盖风险防御的所有方面 节省主机开销 无与伦比的存储服务能力,有限的资金获得无限的能力
不仅针对生产主机,同时可以为整个办公系统服务
轻松的单点图形管理,容灾不再是难事 瞬间恢复能力