网络安全时代下的关键容灾技术比较

薪科技快评 2024-02-18 21:05:59

中国网络安全时代下的关键技术比较指南

了解不同技术在保护数据和隐私方面的优势

随着中国网络安全要求的日益严格,各组织迫切需要了解关键技术在保护数据和隐私方面的优势。本文深入比较了当前最热门的技术,为网络安全专业人士和企业决策者提供了宝贵的见解。

亮点:

* 加密算法比较:AES、RSA、ECC

* 防火墙和入侵检测系统的深入分析

* 云安全平台的优点和缺点

* 了解量子计算对网络安全的潜在影响

* 符合中国网络安全法律法规的技术选择

关键容灾技术比较

【摘要】每一种容灾技术方案,可以从实现的技术复杂度、需要投入的成本、需要承担的风险、技术的先进性、技术的成熟度等几个方面来综合评估,寻求适合企业的最佳技术组合方案。本文对几类关键容灾技术进行了比较分析。

1. 容灾设计规划的步骤

容灾规划至关重要,其设计规划是核心关键。采用循序渐进的方法论,遵循以下步骤:

1. 识别并评估风险

2. 制定容灾目标和策略

3. 选择合适的容灾解决方案

4. 设计容灾架构

5. 测试和验证计划

6. 定期评估和改进 IT建设来讲是非常重要的事情,如何进行企业的容灾架构设计规划是整个容灾建设的核心关键事宜,因此需要一套方法论或者科学的步骤来参考。概括起来应该遵循以下逻辑进行:

根据图中所示的逻辑思路,我们需要依次解答以下几个问题:

① 为什么要搞容灾建设?

容灾建设的目的因行业、监管、业务而异。金融行业为满足监管要求,部分企业因曾经历数据中心灾难或借鉴他人教训而主动建设。不同的建设目标决定了技术方案和资源投入的差异化。看到别人的教训而主动搞容灾建设。不同的建设目的会导致追求的目标不尽相同。

② 建设成什么样的容灾架构体系,用什么样的标准去衡量?

容灾建设的核心目标:RTO 和 RPO

在容灾建设中,RTO(恢复时间目标)和 RPO(恢复点目标)是至关重要的指标。

RTO 指明了灾难发生后企业恢复正常运营所需的最大时间。RPO 则表示在灾难发生时允许丢失的数据量。

所有容灾建设活动都应以评估 RTO 和 RPO 为目的,以确保业务在灾难发生后能够迅速有效地恢复。

1:什么是企业容灾》文章当中详细阐述过:RTO&RPO是搞容灾建设的最核心目标,一切容灾建设目的都需要回到RTO和RPO的评估上来。

RTO:企业可容许服务中断的时间长度,简言之业务可以恢复的最快时间。

RPO:企业可容许数据丢失的数量级,简言之数据可以恢复到最新的时刻点。

数据保护目标优化

企业的容灾目标基于不同的保护需求而有所差异。严格的 RTO 和 RPO 指标符合监管要求,而宽松的指标则平衡了成本和收益。

严格指标:

* 政府和行业标准要求的最低标准

* 适用于不同规模和性质的企业

宽松指标:

* 企业自定义的目标,考虑成本和收益

* 定义在特定范围内,允许更高的灵活性RTO和RPO的目标也会有严格和宽松之分,所谓严格的RTO&RPO指标就是政府或行业监管的最低标准,不同规模性质的企业有不同的最低标准要求。

所谓宽松就是企业为了平衡投入成本和容灾架构带来的收益,可以将RTO&RPO锁定在一定范围内。

③ 建设的容灾架构应该是什么级别(国家标准&国际标准)?

根据监管要求,银行业需满足5级容灾标准,即RPO(数据恢复点目标)不超过15分钟,RTO(恢复时间目标)不超过30分钟。

而国际标准Share78定义的六级容灾标准更严格,RPO为0,RTO为分钟级;七级容灾标准则要求RPO和RTO几乎为0。

1:什么是企业容灾》文章当中详细阐述过:银监局和中国人民银行对商业银行业最严格的要求标准是5级容灾标准,RPO<=15分钟,RTO<=30分钟。而根据国际标准share78,六级容灾标准是RPO=0,RTO=分钟级;七级容灾标准是RPO=0,RTO近似为0。

企业可以根据这些标准界定自己应该实现的最低标准,比如说5级或者6级标准。

④ 选择什么样的容灾架构技术体系,如何评估各种容灾中的关键技术方案?

同城双中心容灾评估涵盖网络、应用、数据库和存储等层面。关键在于选择评估维度和风险控制。本文将深入探讨关键技术方案评估方法和思路,帮助企业实现高效容灾策略。。

2. 评价容灾技术的维度

通过评估容灾技术方案的复杂度、成本、风险、先进性、成熟度等关键指标,可优化解决方案组合,契合企业特定需求,实现高效、可靠的容灾保护。 。

容灾技术方案的架构应尽量简洁。在相同目标可达性的情况下,架构越简单,技术复杂度越低,方案的可行性越高,实施和运维也更便捷。

技术复杂度: 对于容灾技术方案的技术复杂度,总的原则是同目标可达的情况下,架构越简单越好。

复杂度评估须全面考量:

- 建设与运维的难度

- 方案本身与依赖环境的复杂性

- 横向与纵向影响的范围。

投入成本是企业灾备方案的关键考量因素。成本优化应遵循以下原则:

* 确保在满足目标的前提下,成本最低化。

* 考虑设备、软件、建设、运维等综合成本。

* 包括资源、人力等资源成本。

* 既要关注一次性成本,也要考虑持续投入成本。

投入成本:对于企业来讲,投入成本是非常总要的一项因素。总的原则是同目标可达的情况下,成本越少越好。大的方面分析来看,投入成本不仅包括容灾方案本身的设备成本还需要考虑软件成本;不仅需要考虑建设成本还需要考虑运维成本;不仅需要考虑资源成本还需要考虑人力成本;不仅需要考虑一次性成本还需要考虑持续投入成本。

风险管理

* 适度降级:在不增加灾难性风险的情况下,适当降低宽容范围内的数据恢复时间目标 (RTO) 和数据恢复点目标 (RPO) 风险。

* 关键风险:着重管理极端情况下的数据丢失和区域性业务中断蔓延。

承担风险:所谓风险,最主要的就是极端情况下的RTO和RPO风险。总的原则是可以在宽松目标范围内适度降低,但是不能因此而承担灾难性的风险概率。

大的方面分析来看,承担风险主要包括极端情况下的数据丢失风险、区域性业务中断扩展的风险。

技术优势

考量技术时,需评估其:

* 与行业趋势的匹配度:符合主流发展方向。

* 性能与可靠性:具备高性能、可用性。

* 扩展性:可轻松适应业务增长需求。

* 兼容性:与现有系统无缝对接。

在可达成目标的前提下,选择先进的技术架构至关重要。

技术先进性:所谓技术先行性,一方面要看技术本身与主流发展的方向是否匹配,另外一方面要看技术本身在性能、高可用、扩展性、兼容性等方面的能力。总的原则是在目标可达的情况下,选用先进的技术体系。

技术成熟度评估:

考量技术成熟度需全面评估:

* 技术体系:健壮性和稳定性

* 应用案例:部署记录和效果反馈

* 市场响应:用户采用率和满意度

以此为基础,深入理解技术的成熟程度,为项目决策提供依据。

技术成熟性: 所谓技术成熟性,不仅需要从技术体系本身的发展历史来看它的健壮性和稳定性,还需要从技术方案应用的案例情况以及市场的反馈情况来看技术的成熟性。

评估技术方案时,根据方案特点制定评估指标体系,按维度评分,综合评估方案。指标维度包括:创新性、可行性、经济性、适用性、可持续性。。

3. 关键容灾技术比较分析3.1 DB:HA vs AA vs AS

数据库集群模式是容灾设计中不可或缺的,包含三种类型:

* 操作系统 HA 与数据库服务相结合

* 数据库层 AA 服务模式

* 数据库层 AS 容灾技术HA与数据库服务相结合的模式;通过数据库层实现的AA服务模式;通过数据库层容灾技术实现的AS服务模式。下图是我们对这三种模式的抽象描述:

服务模式 :只有一个浮动VIP,以主数据中心为基础提供对外数据访问接口服务。

集群模式 :主备模式,主节点提供服务,备节点故障时刻接管服务。

主备节点均可以激活存储卷,正常时刻只有激活节点可以挂载存储卷并具备读写权限。

跨地域容灾架构:

* 专属跨数据中心 L2 网络

* 共享存储卷(OS 或网关虚拟化)

* 第三方仲裁站点,独立 L3 网络连接主备数据中心 :跨数据中心L2网络;

共享存储卷(可以是操作系统或者是存储网关实现的虚拟共享卷);第三方仲裁站点(与主备数据中心有相互独立的L3网络)。

服务模式 :SCAN IP+2个VIP,主备中心以负载均衡的模式对外提供服务。

集群模式 :主主模式,节点可以扩展,主备节点同时提供服务。

存储模式 :主备节点共享存储卷,通过节点间的缓存协调机制以及锁机制实现并发控制。

环境依赖优化:

* 跨数据中心 L2 网络:无缝互联不同数据中心。

* 共享存储卷:操作系统或存储网关提供的虚拟共享存储。

* 第三方仲裁站点:独立于主备数据中心的外部站点,提供故障仲裁。

跨数据中心L2网络;共享存储卷(可以是操作系统或者是存储网关实现的虚拟共享卷);第三方仲裁站点(与主备数据中心有相互独立的L3网络)。

服务模式 :主库VIP+备库VIP,并且不能是同网段地址;主库对外提供服务。

主备集群:提供高可用性,主库 A 可扩展至 AA 集群。主库负责对外服务,备库故障时可无缝切换为主库,确保业务连续性。 主备模式,但是主库的A可以扩展为AA集群,主库对外服务,备库故障时切换为主库。

存储模式 :主备节点各自拥有自己的存储卷,从主库到备库实现数据复制。

环境依赖 :双中心网络三层可达即可。

技术方案对比分析

通过技术复杂度、成本投入、风险承担、技术先进性和成熟度,我们对技术方案进行对比分析。

具体表现如下:

* 技术复杂度: 方案A最复杂,方案D次之,方案B和C相对较低。

* 投入成本: 方案A成本最高,方案C其次,方案B和D较低。

* 风险承担: 方案A风险最高,方案D次之,方案B和C较低。

* 技术先进性: 方案D最先进,方案C其次,方案B和A相对较低。

* 技术成熟度: 方案C最成熟,方案D次之,方案B和A相对较低。。

HA 和 AAA 模式:灵活应对数据中心和网络威胁

HA(高可用性)模式

* 优点:依赖于数据中心,冗余性强

* 缺点:技术复杂度高

AAA(Authentication、Authorization、Accounting)模式

* 优点:仅需一个数据中心,成本低

* 缺点:与 HA 模式相比,技术复杂度低

比较

相比之下,AAA 模式技术复杂度较低,成本也更低。然而,对于需要高冗余性的关键基础设施来说,HA 模式仍然是更合适的选择。

选择正确的模式

选择合适的模式取决于具体需求和预算。如果您需要极高的冗余性和数据完整性,那么 HA 模式是理想的选择。如果您更看重成本和易用性,那么 AAA 模式可能更合适。

HA 和 AAA 模式提供了不同的优势,可以满足各种安全性和可用性需求。通过仔细考虑特定的业务需求,您可以选择最能满足您组织需求的模式。 HA和AA模式均依赖于跨数据中心L2网络,AS模式仅需要跨数据中心L3可达即可,相对来讲AS模式的技术复杂度会更优。

选择HA或AA灾难恢复架构时,需要考虑以下关键成本因素:

* 建设阶段:HA和AA需要跨数据中心的L2链路,导致更高的高速线路成本。

* 切换管理:AA通常需要手动切换,而HA则需要专门的高技能团队进行灾难切换管理。 ,建设阶段HA和AA模式会因为跨数据中心L2网络环境的建设而投入更多的设备、软件以及线路成本,AS模式多数需要人为干预切换,因此后期需要专门的高水平团队管理容灾切换。

不同部署模式的风险对比:

- AA模式:

- 高风险:Cache/Lock管理至关重要,私网不稳定会导致性能问题或数据损坏。

- HA模式:

- 中等风险:单节点控制读写,避免读写竞争带来的问题。

- AS模式:

- 低风险:仅日志单向复制,风险远低于AA和HA模式。 AA模式两个节点之间的Cache/Lock管理非常重要,一旦私网出现不稳定问题,影响极其重大,小则性能出现问题,大则数据重大损坏集群崩溃;HA模式正常情况下是单节点控制读写,因此不会产生因为读写竞争出现的重大性能或数据损坏问题;AS模式双节点之间只是日志单向复制,风险相对较其他两种模式小很多。

容灾能力方面,AA模式凭借零RTO和RPO,可实现7级容灾目标,超越传统HA(6级)和AS(6级)模式。AA模式在架构灵活性上也胜出,支持多节点集群扩展,而HA和AS的扩展性受限。性能方面,AA模式提供横向扩展,AS额外支持读写分流,超越HA单节点处理能力提升。

AA模式RTO&RPO理论上都是零,可以达到7级容灾目标;HA模式(RPO=0,RTO约为0-30分钟级别),可以达到6级容灾目标;AS模式(RPO约为0,RTO约为0-30分钟级别),也可以达到6级容灾目标。架构扩展和灵活性方面,AA可以扩展到多节点集群,AS模式可以扩展多一对多以及级联架构,而HA的扩展性和灵活性都非常差;性能方面,AA模式可以横向扩展,AS不仅可以横向扩展,而且可以读写分流;HA模式只能增加单节点处理能力。

技术成熟度对比:

* HA模式:历史悠久,但受限于操作系统机制,成熟度较低。

* AA模式:成熟的高可用技术,适用于数据库集群服务。

* AS模式:官方认可的成熟容灾技术。

因此,对于高可用性,AA模式更具优势;对于容灾性,AS模式是官方推荐的选择。 ,HA模式虽然历史较长,但是并不是一个成熟的数据库高可用技术,它受限于操作系统方面的处理机制。

而AA模式就是基于数据库集群服务而诞生的成熟高可用技术,但是官方并没有把它作为一种成熟的容灾技术宣传(例如Oracle将Extended RAC作为过渡的容灾架构,而不是官方正式认可的容灾技术方案),而AS模式是官方认可的成熟容灾技术。

镜像复制与日志复制:深入剖析

镜像复制和日志复制是数据库复制的两种主要方法。它们在实现、功能和性能方面存在差异。

镜像复制创建数据库的精确副本,实时更新。日志复制捕获数据库中的事务日志,并在副本上重新播放,提供数据一致性。

选择复制方法取决于具体需求和可用资源。镜像复制提供高可用性,而日志复制则更加灵活,可提供成本效益更高的解决方案。

数据复制技术可分为两种模式:

* 镜像双写复制:数据同步写入多个副本,确保数据一致性高。

* 端到端拷贝复制:通过日志拷贝技术,不断记录数据变更,将这些变更复制到目标存储。总结来看,其实无非两种模式,一种是基于镜像的双写复制技术,一种是基于端到端的拷贝复制技术(日志拷贝应用 &存储Block复制,仅考虑日志拷贝应用模式 )。

数据复制模式对比:风险、复杂度和先进性

* 风险:

* 块复制:风险较低,少量数据出错时易于恢复。

* 文件复制:风险较高,数据出错时可能导致整个文件丢失。

* 技术复杂度:

* 块复制:技术简单,实现成本低。

* 文件复制:技术复杂,实现成本高。

* 先进性:

* 块复制:技术成熟,广泛应用。

* 文件复制:技术较新,具有更好的性能和功能。

基于镜像和重做日志的数据复制模式对比

镜像模式:

* 基于双写进行数据复制,与数据库事务操作无关。

* 无法识别业务数据,存在逻辑错误复制风险(如数据库配置损坏)。

* IO延时不平衡,影响性能。

重做日志模式:

* 完全由数据库应用层实现,仅复制实际业务数据。

* 消除配置损坏风险。

* 性能不受网络波动影响。

基于镜像实现的数据复制模式,其复制原理主要是基于操作系统存储卷或者存储的Block来进行双写,跟数据库层的事务操作没有任何关联性,无法识别Block里面包含的业务数据。极端情况,如果主数据中心因为数据库层配置文件或元数据之类的数据损坏而导致的灾难,这个时候备数据中心也会发生同样的问题。

而基于重做日志应用的数据复制完全是数据库应用层的事务操作实现的数据复制,它的复制不会掺杂数据库配置层、系统层等外界的多余的写操作,因此不会存在这种逻辑Block损坏的事故概率。另外一方面,这种模式的镜像是不平衡的,每一次写过程都会受到IO延时不平衡的影响,性能极大受到外界不稳定网络的影响,而且放在AA数据库集群环境会无限放大。

镜像技术中,跨数据中心镜像远高于操作系统层或储存层镜像的技术难度。原因在于远距写入的每一次IO操作都需要跨越较远物理环境,增加了技术难度。 ,如果是本地镜像,那么技术复杂度并不高,但是如果是跨数据中心的镜像技术,无论是基于操作系统层还是基于存储层,都是需要基于远距离SAN环境做跨中心的镜像,每一次IO都需要经历远距离写的过程。因此它的技术复杂度一定高于后者。

基于镜像的数据复制技术在技术先进性方面更为突出,理论上可实现 RTO 和 RPO 均为零。

而基于日志应用的复制技术虽能实现同步复制,但实际应用中通常采用高可用或性能模式。即便在网络传输良好情况下,RPO 也只能接近于零,并且故障时需要切换时间,导致 RTO 逊于镜像复制技术。 基于镜像的数据复制技术,那么RTO&RPO理论上都是零。基于日志应用实现的复制技术虽然也可以实现同步复制,但是实际应用当中绝大多数采用高可用或者性能模式,网络传输质量好的情况下,RPO只能接近于零,出现故障的时候需要切换时间,RTO指标也不如前者。

3.3 Storage:HA vs AA

存储网关集群数据复制采用镜像实现,市面上主要有两种模式:

- 双活网关模式:以 VPLEX 为代表,在双活网关间进行镜像复制。

- HA 网关模式:以 SVC 为代表,提供高可用性保障,确保数据在单个网关故障时仍能访问。

VPLEX为代表的双活网关模式,另外一种是以SVC为代表的HA网关模式(厂商的宣传永远是双活,但是我们需要从单个存储卷的维度去看它是不是双活,另外即使双活做到卷和IO的粒度也不一定是好事,需要辩证去看):

基于 HA 和 AA 模式的存储网关数据复制技术:

HA 模式

* 主备模式,单点故障时可切换至备用节点。

* 高级产品支持同步缓存和虚拟机漂移。

AA 模式

* 主主模式,通过分布式机制控制并发。

* 双写机制,确保数据一致性。

HA模式和AA模式的存储网关实现数据复制的基本技术轮廓,主要区别在于两个网关节点的工作模式。HA两个节点针对同一个卷的工作模式是主备,单边故障的时候可以切换到备节点工作,有些产品可以做到同步缓存,甚至利用存储操作系统虚拟化技术做到虚拟机漂移并自动接管存储卷读写,有些则需要较长的切换过程。

AA两个节点针对同一个卷的工作模式是主主,通过全局缓存和分布式锁机制控制并发。底层都是双写,只是由一个点写下去还是由两个点协商写下去的区别。

存储网关的 AA 架构采用双节点通信,但数据量庞大且关键。通信不稳定会阻碍节点间协商和并发写入控制,甚至可能导致严重问题。

如果与数据库 RAC 集群配合使用,风险会加剧,因为两组集群(数据库和存储)都依赖双节点通信质量,增加了不确定性。

HA 架构双节点通信是由单边发出的,协调控制,避免了协调不稳定带来的性能和数据安全风险。

值得注意的是,无论采用 AA 还是 HA 架构,在与数据库集群配合时,都可能面临仲裁冲突的风险,需要谨慎考虑。 ,存储网关的AA架构类似于Oracle RAC架构,两节点之间的通讯数据量不仅量非常大(维持全局Block缓存和分布式锁),而且非常重要,一旦出现通讯不稳定问题,两节点无法协商完成并发写入控制,严重的时候可能出现更严重的问题。如果与数据库层的RAC集群配合使用,那么风险无疑是雪上加霜,纵向两套集群(DB、Storage)都是同类机制,都严重依赖双数据中心的通讯质量,不确定性就太高了。

HA架构相对于AA来讲,最大的优点在于双写是由单边发出的,无需协调控制,最少不会出现因协调不稳定出现的性能及数据安全风险。这两种模式与数据库集群配合的时候,都会面临同样的风险,那就是仲裁冲突的问题,还需要谨慎考虑。

技术先进性不应成为双活系统的唯一衡量标准。企业更关注业务连续性,而非技术细节。只要两套系统均可运作,即可满足业务需求。

因此,以IO级别为最小粒度的双活与以应用级别为最小粒度的双活,在满足业务连续性的前提下,并无显著差异。 ,站在理论的高度,认为可以实现存储卷、IO级别的双活就是技术上的制高点,实现以应用为最小粒度的双活就是伪双活;其实站在业务的高度,我们认为只要两套系统都能运作,都能承载应用就可以了,企业追求的目标是业务连续性,不是IO连续性。这个意义上讲,二者没有区分出太大的优劣。

二者均采用操作系统和数据库高可用技术实现存储容灾,技术成熟度较高。市场应用状况值得关注,以评估实际适用性。 ,二者都是基于操作系统及数据库高可用技术实现的存储容灾技术,技术源头都有较长历史传承。所以大家还要从市场的应用状况来考察。

-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

0 阅读:7

薪科技快评

简介:薪科技评说,发现技术的点滴,记录科学的飞跃!