从0到1:平安云的构建和运维实践

26
从0到1: 平安云的构建和运维 实践 方国伟 [email protected] 平安科技

Upload: hardway-hou

Post on 08-Jan-2017

33 views

Category:

Internet


1 download

TRANSCRIPT

从0到1:

平安云的构建和运维

实践

方国伟

f [email protected]

平安科技

定位 设计 产品 运维

内容概要

定 位

平安云专注于成就金融客户

专业、增值、可靠、安全、合规

弹性高效

自助服务 按需计费

动态智能

新“混合云”服务

标准接口/门户/控制台

平安云计算、存储、网络基础设施

平安原有基础设施

深圳、上海、北京等多地域金融数据中心

公有云租户 私有云租户 传统金融业务

多层次金融云服务 IaaS/PaaS/SaaS

设 计

IAAS

IAAS+

PAAS

技术能力 开放服务

业务能力 开放服务

(Open API)

计算、存储、网络等服务

数据库、中间件等服务

消息队列、通知、大数据等服务

公共 服务

(门户,计费,监控,部署,身份认证等)

平安云的功能模块

汇保云服务等 主账户服务 银行一账通

技术选型思路

开源的技术例子

高可用架构设计

AZ1 AZ2

网络

主机

存储

北方互联网数据中心

上海异地灾备中心

上海互联网数据中心

• 深圳生产中心 • 深圳同城灾备中心

“多地多中心”的站点分布

上海 骨干网络

北京

深圳

产 品

云磁盘 EBS

云主机 ECS

云备份 CBS

2014 2015 2016

WebLogic 自动部署

负载均衡 ELB 对象存储 OBS Redis

虚拟私有云VPC Mysql PostgreSQL

AlphaOps

CaaS 容器服务 脚本推送

Tomcat 自动部署

VAD 可视化部署

快速迭代地构建产品线

云主机 Elastic Compute Server(ECS)

对象存储 Object Storage Service (OBS)

云磁盘 Elastic File System(EFS)

负载均衡 Elastic Load Balancing(ELB)

Cloud Backup Service(CBS) 云备份

Virtual Private Cloud (VPC) 虚拟私有云

块存储 Elastic Block Store (EBS)

自动化部署服务(APS)

NoSQL数据库(MongoDB, Redis等)

数据库服务(RDB)

队列服务(SQS)

产品服务

云门户

身份管理 服务目录 产品订购 计费/账单 资源管理

公共服务

监控

日志

部署

容器服务 (CaaS)

平台层的产品例子

15

例子:容器服务(CaaS)

16

容器服务与持续集成开发

例子: 应用群自动部署

平安云编排框架

平安云API 配置管理API 监控平台API 部署平台 API 数据库API

应用架构信息

控制台

得益于各模块开放的API和编排框架的定义能力,自动部署功能可以按租户为单位从无到有交付一整套应用环境

18

例子:自动化部署

VPC(虚拟私有云)

VPC 虚拟私有云

• 独享网关

• 自主网络域、子网规划

• 自主访问策略,控制颗粒

度可细至云主机间

• 自动化创建,快速搭建

DMZ、SF模型网络

租户1-VPC

云主机Network-1

租户VGW

租户网络

租户2-VPC

云主机Network-2

云主机Network-1

租户VGW

租户网络

云主机Network-2

运 维

ITIL DevOps

SRE

AlphaOps

平安云的运维思想 >> AlphaOps

智能化、自动化

应用高可用

遵守平安集团流程规范

Portal

AlphaOps 的定位

云门户 为平安云的用户入口

目标 为向用户提供易于使用的云产品管

理平台,实现尽可能多的用户自服务。

如:满足自助服务购买,环境搭建,容灾数

据同步,可视化部署,账单管理等。

AlphaOps 为平安云

的自动化运维平台

目标 成为运维的统一入口,

提高运维效率与质量,实现需

求、故障的提前预测与一键式

自动操作等功能

AlphaOps 自动化运维平台

自动化运维

- 维护操作自动化

- 结合运用自研与第三方工具

- 24小时E2E自动化测试+监控,

智能识别和预测潜在问题

应用双AZ部署

物理上独立的可用区,避免底层大规模

故障影响全局

关联性组

用户可指定同资源组云主机自动分布于

不同物理机

应用自启动,应用无状态

底层物理机重启后,应用服务可以自动

恢复

基于ITIL的运维流程

变更管理、事件管理、问题管理、配

置管理、DR/BCP等

平安集团信息安全管理体系

信息安全方针、策略、标准、基线、

流程、指导与守则

高可用

自动智能 规范流程

产品研发参

与生产运维

运维团队参与

产品设计,开

发可运维的产

围绕DevOps构建的运维体系

流程规范

资产管理

容量管理

配置管理

变更历史

报表展现

应用高可用

动态迁移

应急演练

应用集群冗余部署

用户通知

系统监控

E2E不间断测试

自动修复

批量处理

日志管理

自动化

技术研发

产品服务

总结

谢谢!

Q&A www.p inganyun.com