/ 中存储网

保险行业混合云环境数据容灾与备份解决方案

2021-06-20 23:43:04 来源:中存储

云计算、大数据以及人工智能等各种数字化技术正在助力保险行业数字化转型,而其中海量非结构化数据的智能管理需要革命式的转换。与传统业务不同,烟囱式的管理、彼此业务的隔离以及传统数据中心的建设已经不能满足非结构化数据的发展。非结构化数据的重要性、安全性以及管理性需要新的理念以及解决方案去规划、去建设。

目录

一、行业背景

二、需求分析

三、 Veritas 解决方案 介绍

1 ,混合云架构的分析

2 ,应用场景

Veritas 针 对保险行业有明确的解决方案对照

3.1 数据级混合云管理

3.1.1 一对一数据灾备

3.1.2 数据透视分析

3.2 应用级和业务级容灾

四、总结

一、行业背景

随着社会信息化的日益推进,网络与信息系统的基础性、全局性地位越来越强,由于信息化的不断推进,社会需求也在发生重大变化。国民经济和社会发展对网络和信息系统的依赖性越来越紧密。重要信息系统的安全运行直接关系到国家安全、企业发展和人民利益,更关系到社会的稳定。国内外一系列已经发生的事件表明,如果重要信息系统没有一定的灾难恢复能力,这些系统一旦发生重大事故或遭遇突发事件,不仅遭受无可挽回的经济损失,还将严重影响国民经济的发展和社会稳定。另外面对战争威胁,信息资产是非常脆弱的。

信息资产的脆弱性是一个客观现实,社会各方面对此已经对其产生了越来越强的依赖,信息资产如果被摧毁或丧失服务能力,就会产生各种矛盾和冲突。后果是多样的,比如经济损失、社会动荡、政府无法提供服务等。

“ 居安思危,思则有备,有备无患。 ” 事实证明,各类灾难的到来通常具有突发性和偶然性,但只要能够进行行之有效的灾难恢复工作,就可以将损失降到最小。

二、需求分析

我们对保险行业用户进行了需求研究,反馈如下:

(1) 最关注内容影像系统采用混合云的方式部署

调研保险企业用户最关注“内容影像系统”采用混合云的方式部署( 66.67% ),其次是“官网系统”( 50% )、“银保通系统”( 41.67% )。

(2) 针对关注的应用,业务要求的 RTO 和 RPO 目标

电子保单打印系统;电子保单投递系统;展业系统;官网系统;银保通系统;内容影像系统;规则引擎系统等系统为企业的核心系统,其 RPO 为 0 ,其次是内容影像系统趋于 0 ,而排在第三位的电子保单打印系统;内容影像系统趋近于 1 分钟。

(3)最关注混合云环境中图片数据的备份

调研保险企业用户最关注的混合云环境中备份的数据类型是“图片数据”( 100% ),其次是“音频 / 视频”数据( 91.67% )

(4)针对混合云环境的数据容灾与备份,最关注主流容灾备份解决方案的功能支撑

调研保险企业用户针对混合云环境的数据容灾和备份,最关注“主流容灾备份解决方案的功能支撑”( 75% ),其次是“解决方案与运管的统一化集成”( 66.67% )、“特殊数据(如影像文件 --- 海量型数据)针对性容灾备份优化”( 58.33% )。

(5)针对混合云数据容灾与备份场景,最关注解决方案的费用成本

调研保险企业用户针对混合云数据容灾与备份场景,最关注“解决方案的费用成本”( 83.33% ),其次是“解决方案的功能性”和“解决方案的可落地性”(均为 66.67% ),最不关注的是“解决方案产品的市场地位”( 25% )。

从中我们不难看出,行业内的需求侧重点已经从产品转向解决方案的功能支撑,非结构化数据量的增加确实对混合云管理带来了新的课题。如单证类数据、电子保单等,非结构化数据的比例已经达到了 2/3 。由于行业内对数据保留周期的时限增长,为了分担数据中心压力,将测试业务以及长期数据通过云环境管理,实现混合云架构。

三、 Veritas 解决方案介绍 1 ,混合云架构的分析

混合云管理解决方案的制定,是通过多种技术和管理手段相互配合、集成实现的。它必须符合保险行业、保险系统的的业务需求,并紧密结合现有的系统环境,考虑未来的发展方向和发展模式。

成熟- 混合云管理解决方案应该是一个融合的解决方案。部署混合云管理应当尽量减少生产系统的影响,实现数据的整合。

稳定 -混合云管理解决方案应稳定;经过大量实际生产环境及同行业成功案例的验证;

可扩展性 -选择的混合云管理解决方案应有弹性,韧性,可根据系统规模可以逐步扩大;

支持新技术 - 考虑到以后的多云架构,混合云管理解决方案可以应对新技术拓展,以不变应万变。

成本 - 降本增值是永恒的话题,在保险行业也不例外,新型的混合云管理解决方案可以应对数据的增长、多云环境的治理,实现业务在哪里数据在哪里的诉求。

2 ,应用场景

Veritas针对保险行业有明确的解决方案对照

保险行业混合云环境数据容灾与备份解决方案

3.1 数据级混合云管理

3.1.1 一对一数据灾备

保险行业混合云环境数据容灾与备份解决方案

解决方案亮点:

• 全自动: 通过 NBU “生命周期策略”自动完成备份映像和目录库的复制和导入,无需日常人工操作

• 跨备份域: 混合云架构相互独立,互不影响,可靠性高

• 窄带复制: 基于重复数据删除的优化复制,效率高,占用带宽小

• 易恢复: 复制完成即可在异地直接恢复,操作十分简单

• 灵活架构: 支持 1 对多,多对 1 ,双向复制等多种部署架构

解决方案分析:

非结构化数据(单证类、身份证、电子保单等)影响备份性能的性能瓶颈:

备份的 I/O 路径:备份服务器通过 SAN 从挂载的快照文件系统中读取数据,然后通过 SAN 写入磁带库做长期数据保存

磁带库的速度:如果使用 LTO8 的带机理论速度约 300MB/S

传输带宽: SAN 网络的传输能力约 400MB/S

文件系统性能:海量小文件的读取性能是瓶颈所在

数据长期保存:某些数据需要长达 5-10 年的长期数据保存,但是基于磁带的传统数据保护解决方案无法提供足够的可见性,日常需要人工递送磁带,运维困难,同时时间难以保证。

解决思路:

• 提高前端数据读出的性能

• 多个数据流并行读取? —— 海量小文件系统的性能与并发度不是线性关系。 No

• 变文件系统备份为裸设备备份? —— 对文件系统类型有特定要求,改动太大。 No

• 减少备份时需读取的数据量? ——Netbackup 的加速备份功能YES

• 减少磁带恢复速度? —— ACESS 实现近乎主存储的性能,降低恢复时间目标 (RTO) 。

解决方案:

• 利用 Netbackup 的相关功能解决问题

加速备份功能 :以增量备份的速度完成全备份,对平台和文件系统没有特殊要求

重复数据删除: 基于普通磁盘实现重复数据删除,支持前端和后端重删,节省网络带宽和存储空间,提高备份速度和可靠性

自动映像复制: 在两个站点间跨备份域自动复制经过消重的备份映像和目录库,无需日常人工干预,安全、简单、高效。

生命周期管理: 自动完成 备份 - 复制 - 容灾 的过程并管理备份数据在不同设备上的保留和删除,可针对备份策略和调度灵活定义。

• Netbackup Appliance 备份一体机

集成了备份服务器、磁盘存储、操作系统、 Netbackup 软件及辅助软件,并专门针对 Netbackup 进行了优化的一体化设备,安装、配置、管理及维护简单,性能强大。

• ACCESS 一体机解决数据长期保存问题

高度可扩展的软件定义存储:客户可运用该设备在企业发展过程中视需求轻松向上扩展和向外扩展存储容量。它与 Veritas NetBackup 集成 后可实现高度一致的端到端长期数据保留和保护,同时还兼具分类和全局重复数据删除功能。

多云功能:该设备可支持企业轻松从各大云服务提供商中自由选择云,同时还可以构建自己的私有云或配置云存储平台作为便宜的存储层以满足性能需求。

有效的数据保留战略:助力企业轻松淘汰一直以来耗费管理成本的磁带存储,同时还可缩短恢复时间。

架构建议:

保险行业混合云环境数据容灾与备份解决方案

方案描述:

1) 所有与提供备份服务相关的设备组合成一个与生产系统独立的备份系统,其中涉及的角色和设备包括有:

a) NBU主服务器( Master Server ): 负责管理整个 NBU 备份环境,包括备份、存档和还原。主服务器负责备份作业的配置、调度和设备选择。通常,主服务器还包含 NBU 目录库,其中记录着有关 NBU 备份和配置的信息。也可采用两台服务器将 NBU 主服务器部署为 HA 环境,以提高备份系统的可靠性。

b) NBU介质服务器( Media Server ) : 负责管理备份系统中的存储设备,包括备份用的磁盘、 VTL 或磁带设备。介质服务器在主服务器的统一调度管理下,通过 LAN 或 SAN 从 NBU 客户端接收数据并写入备份设备中;或者将备份数据从一个备份设备拷贝 / 移动到另一个备份设备中。在本方案中,采用多台 NBU 备份一体机来承担介质服务区的角色。通过多台介质服务器,可实现备份作业的负载均衡和故障切换功能,提高备份系统的性能、效率和可靠性。

c) 备份存储设备: 挂载在 NBU 介质服务器上用来存储备份数据的设备,可以是磁盘、 VTL 或物理磁带库。在本方案中,备份存储设备包括两部分:每台 NBU 备份一体机中内置的磁盘存储池和外接的 Access 一体机。

2) 每一个需要备份的生产业务系统主机都是 NBU 的客户端,在其上需要安装 NBU 的客户端软件。生产系统主机不需要连接到备份设备,只需要能够访问 NBU 介质服务器。备份时,业务主机上的 NBU 客户端软件从应用层(数据库、文件系统、 OS )获得数据后,将数据传送给 NBU 介质服务器写入备份存储设备完成备份。按照业务系统的重要程度和数据量可以混合采用三种备份模式: LAN 备份、 LAN-Free 备份,以及 Server-Free 备份。其中,采用 LAN 备份的系统只需通过 LAN 网络与备份系统想连接;采用 LAN-Free 备份的系统需通过 SAN 网络与备份介质服务器相连。

a) 一类系统如团险、银保、养老金、个险、电销、呼叫中心、电子商务等都采用 LAN-Free 备份,部分数据量特别大的可考虑 Server-Free 备份

b) 二类系统中如 MDM 、 ECM 、 BPM 、 LDAP 部分数据量较大的采用 LAN-Free 备份,其余采用 LAN 备份

c) 三类系统如数仓、 OA 、 BIP 再保险都采用 LAN 备份

3) 备份数据流向:正常情况下,多台 NBU 一体机的内置磁盘存储组成一个大的磁盘存储池, Veritas Access 一体机( Access 它专为高容量工作负载设计,集长期数据保留、磁带替换和备份归档等功能于一体)作为另一个存储池,数据先备份到磁盘存储池,然后在复制到 Access 存储池。可以根据备份作业和存储池为每一份备份数据设定不同的保存周期,并且 NBU 会自动管理该过程。

4) 备份系统向云容灾中心的扩展:只需要在容灾中心也部署一套备份系统平台(包含 NBU 主服务器、介质服务器、磁盘存储池),并在生产中心和云容灾中心建立网络连接,即可无缝的实现从本地数据备份到或数据异地保存,实现数据级容灾。

5) Saas 数据提供可靠保护:在合规法规变得越来越严格,特别是对数据处理的要求。借助适用于 Microsoft 365 的 Veritas NetBackup Saas Protection ,即可以从所有数据丢失情况中恢复并消除勒索软件和意外 / 恶意删除等威胁。

6) 数据显著减少:将 Veritas Netbackup Accelerator 更改跟踪技术与 Vertias Netbackup Intelligent Client Deduplication 结合,可以进一步减少备份流量,明显提升非结构化数据如:电子保单、内容影像系统等非结构化数据的完全备份速度。 WAN 优化可以进一步提高性能,备份传输到容灾站点时速度可以提高 10 倍。

7) 统一管理:通过安装 OPSCenter 监控软件,用来统一管理所有备份策略,存储,并生成各种报告。

3.1.2 数据透视分析

云计算、大数据以及人工智能等各种数字化技术正在助力保险行业数字化转型,而其中海量非结构化数据的智能管理需要革命式的转换。与传统业务不同,烟囱式的管理、彼此业务的隔离以及传统数据中心的建设已经不能满足非结构化数据的发展。譬如电子保单打印系统;电子保单投递系统;展业系统;官网系统;银保通系统;内容影像系统;规则引擎系统等业务的 RTO 、 RPO 的数值已经趋近于 0 ,充分证明在当今时代,非结构化数据的重要性、安全性以及管理性需要新的理念以及解决方案去规划、去建设。

在保险行业的众多业务中,内容影像系统尤其重要,它串联着当代保险企业的命脉,基本上每套业务系统都无法脱离开内容影像系统。因此不管是私有云、公有云还是混合云:图片数据、音频以及视频的数据存放、数据连续性管理、数据备份以及数据安全都是保险行业最大痛点。 Veritas 公司针对保险行业的痛点进行了总体设计:从易用性、可靠性、安全性以及可扩展性四个方面发力,帮助保险企业用户实现在较低的成本控制的前提下,实现操作方便、快速、简捷的混合式部署,利用混合云的优势打通企业命脉,依托国家政策性指导要求,帮助企业制定一套完整的合理性解决方案。

传统的非结构化数据的管理平台基本上以 NAS 、大容量服务器为主,但从企业的发展来看,老旧的传统思维需要改变以适应新时代信息技术的发展,现在保险行业更加重视的是数据的分析、数据的分类、数据的洞察以及数据的安全。 Veritas 公司即时更新自我解决方案以及方向,推出了 Aptare :全面的数据收集能力、无代理的收集方式以及全面的兼容性。不仅在数据保护优化方面给予监控、规划、成本分摊等,更能通过数据关联、数据展现以及数据提供,使得客户的业务部门和 IT 部门打通,帮助企业良性发展。在满足合规的大前提下风险规避 运营优化并通过大屏展示、集中管理以及报表分析等给与视觉上的冲击。

保险行业混合云环境数据容灾与备份解决方案

分析数据的目的其实是为了控制成本,希望在存储上可以合理利用。随着非结构化数据的暴增以及长期保留的要求,对保险行业来说成为一种负担,也就自然而然的形成了混合云的架构。热点数据在本地保留,长期数据直接云上做为长期保存。那么数据如何上云,未来数据如何下云以及不同的云共同使用?是否可以将备份上云或者归档上云? Veritas 在这方面有自身的解读,通过 NBU “生命周期策略”自动完成备份映像和目录库的复制和导入,无需日常人工操作;混合云架构相互独立,互不影响,可靠性高;基于重复数据删除的优化复制,效率高,占用带宽小;复制完成即可在异地直接恢复,操作十分简单;支持 1 对多,多对 1 ,双向复制等多种部署架构

3.2 应用级和业务级容灾

应用级容灾不仅提供数据的实时同步,且可针对应用进行监管,异常时,由灾备端的应用接管相应的业务,并对外提供服务。正常情形下,灾备端的应用和生产端一一对应,即一主一备模式:

保险行业混合云环境数据容灾与备份解决方案

生产中心和灾备中心(同城或同机房)之间有电子通讯链路连接,利用 InfoScale Enterprise 存储套件的镜像功能实现同时在生产中心和灾备中心写数据的功能,从而保证客户数据零丢失,并提供系统自动切换能力和实时监控的功能。

保险行业混合云环境数据容灾与备份解决方案

VERITAS Cluster Server ( VCS )是整个容灾解决方案的核心软件,与 Veritas Resilliency Platform 结合能够应对完整的,从数据到应用,并自动实时演练的企业容灾方案。

数据镜像

InfoScale Enterprise 存储套件可根据企业的不同需求,提供小到同城数据镜像,大到两地三中心数据容灾,通过与 VCS 紧密集成,可以提供从数据到应用并自动实时演练的企业容灾方案。 InfoScale Enterprise 可利用主中心与灾备中心之间的裸光纤线路构成 SAN 环境,直接依托底层 Volume Manager 在两个存储之间实现存储镜像,将所有数据同时写入两边的磁盘整列中。

对保险行业多以虚拟化支撑的“大核心”架构, InfoScale Enterprise 很好的匹配了这一特点,充分利用 SAN 网络的高并发、高 IO 的特性,实现了主中心、灾备中心数据强一致的严苛要求。

远程复制

VERITAS 拥有高灵活性的数据远程复制方式,无需依赖于光纤线路,只要在主中心和容灾中心之间有连通的以太网络即可。通过 VERITAS Volume Manage 在物理磁盘上建立一个或多个 Volume , VERITAS Volume Replicator( 简称 VVR) 模块基于 Volume 完成远程数据复制。 VVR 同时具备完全同步的数据复制到灾备中心,也能够实现异步复制。

自动进行容灾演练

在企业 IT 系统容灾演练计划中最难的步骤就是容灾演练过程的整体规划与协调,不仅需要将应用、系统级数据库切换到容灾中心运行,更要确保切换后各业务系统能够按照既定逻辑顺序正常启动并承接业务。在实际的容灾演练场景中,最容易出事的环节是业务上线的编排工作,业务编排涉及应用、系统、数据库等层面,对整体业务的流畅性、连贯性以及完整性等多方面起着决定性的作用。

若采用 VCS 作为容灾演练软件解决方案, VCS 的 Fire Drill 功能可完美解决容灾演练场景中数据不一致的问题。按照已预设的演练编排流程, Fire Drill 可在复制不中断的情况下启动上层数据库或应用、自动地验证容灾中心的数据是否可用。 VCS 会持续记录整个过程中验证是否出现问题,若一切正常,演练结束后 VSC 自动停止应用,释放数据空间。

VCS 的 Fire Drill 功能极大程度解决了保险行业在容灾演练中涉及多业务系统(如银保通、中间平台、打印系统等)运维处室之间复杂的沟通、冗长的数据验证流程,提供了标准的自动化编排并将容灾演练进程可视化,充分把控容灾演练的每一个阶段。

应用级容灾

应用级容灾,不仅仅需要保障业务数据完整复制到容灾中心,更要保证在紧急情况下,应用在管理员的确认下,可以很快速地在容灾中心运行承接业务访问。

VCS 同时支持本地应用自动切换与生产中心向容灾中心的应用快速切换。 VCS 与 Global Cluster Option ( GCO )结合,能够同时对生产中心与容灾中心的系统运行状态、应用状态及复制情况进行监控和切换管理,一旦发现生产中心出现异常, GCO 自动或提示管理员进行一键式切换, VCS 快速地在容灾中心将应用启动。

VCS 与 GCO 的结合实现了容灾演练的半自动化需求,兼容所有主流操作系统,构建企业统一的高可用性可视化管理平台。对于保险行业“大中台”、“大核心”的业务逻辑结构,可按业务流程视图按需配置集群管理、应用容灾、容灾演练等多重策略,减少了保险信息化的 TOC 成本,持续发展。

保险行业混合云环境数据容灾与备份解决方案

在面对业务连续性、现代化技术编排以及应用程序对基础架构的需求等, Veritas 可以提供以工作负载为中心的解决方案,可抽象化来自基础架构的应用程序,运用企业级功能实现业务连续性、性能优化、统一编排和敏捷性。以软件定义为核心,支持企业自由选择硬件、多云等各大主流平台,通过自身的硬实力可最大限度的减少物理、虚拟和云部署环境中应用程序的停机时间,支持本地、跨云和多云架构的灾难恢复,实现快速灵活的恢复。根据企业的基础架构以及云架构,优化服务级别目标,实现企业的最终 RTO 以及 RPO ,通过扩展云韧性编排以应对复杂的工作负载,统一备份和灾难恢复,实现不同区域之间近乎零的 RPO ,并通过恢复可靠性和勒索软件的保护,实现运行简单化、一键灾难恢复、满足合规满足性能需求并降低资本支出和总拥有成本,通过大屏展示对企业的数据监控、业务恢复等了如指掌。

预先定义容灾演练网段 可编排的演练流程,自动化控制、启停 可视化、基于导向的恢复演练功能 演练排演和清理流程,不影响生产环境和容灾环境 丰富的报表功能,跨数据中心的健康状态报告 一键式切换、容灾演练 RTO<30 分钟,分钟级 RPO 基于业务逻辑的切换顺序编排 图形化容灾统一管理 四、总结

在面对业务连续性、现代化技术编排以及应用程序对基础架构的需求等, Veritas 可以提供以工作负载为中心的解决方案,可抽象化来自基础架构的应用程序,运用企业级功能实现业务连续性、性能优化、统一编排和敏捷性。以软件定义为核心,支持企业自由选择硬件、多云等各大主流平台,通过自身的硬实力可最大限度的减少物理、虚拟和云部署环境中应用程序的停机时间,支持本地、跨云和多云架构的灾难恢复,实现快速灵活的恢复。根据企业的基础架构以及云架构,优化服务级别目标,实现企业的最终 RTO 以及 RPO ,通过扩展云韧性编排以应对复杂的工作负载,统一备份和灾难恢复,实现不同区域之间近乎零的 RPO ,并通过恢复可靠性和勒索软件的保护,实现运行简单化、一键灾难恢复、满足合规满足性能需求并降低资本支出和总拥有成本,通过大屏展示对企业的数据监控、业务恢复等了如指掌。

【作者简介】陈征   昆仑联通科技发展股份有限公司担任基础架构-数据管理事业部技术总监一职 ,CBCP 国际认证业务连续性专家。主要负责业务全生命周期数据管理解决方案架构设计、体系建设。从业十多年一直服务于该领域。