银行数据中心私有云平台2.0建设
银行数据中心私有云平台一期建设完成后,因审批流程、自动化程度、CMDB联动、裸金属纳管等问题,影响了平台的使用效果。
对问题进行根源分析后,对资源管理模式、审批流程、资源部署、微服务部署等方面进行了优化,解决了实际问题,提升了平台的使用效率。
通过优化,审批流程更加合理,自动化程度显著提高,云平台与CMDB成功联动,裸金属纳管问题得到解决,平台使用体验得到极大改善。
优化经验供大家参考,助力私有云平台建设与运维。
某行数据中心私有云平台一期建设后投入使用。但在使用过程中遇到了诸多实际问题:审批流程不贴合实际情况、自动化程度较低、云平台无法与CMDB联动、裸金属纳管等。本文对问题根源进行了探讨,并分享了通过对资源管理模式、审批流程、资源部署、微服务部署等方面进行优化解决问题的实践经验。
一、前言
云计算助力银行数字化转型
云计算已成为企业IT转型的核心驱动力。2017年,中国人民银行印发《中国金融业信息技术“十三五”发展规划》,明确提出稳步推进云计算技术应用研究。
某银行为适应业务飞速发展,亟需建立统一管理、高效响应、灵活部署的私有云环境。通过采用云计算技术,该银行成功实现:
* 集中管理,提升效率:统一管理服务器、存储、网络等IT资源,大幅降低管理复杂度,提升管理效率。
* 快速弹性扩展,满足业务需求:云计算平台可根据业务需求快速弹性扩展,满足高峰期或突发业务需求,确保业务稳定运行。
* 安全可靠,保障数据安全:云计算平台采用多重安全措施,保障数据安全,满足金融行业监管要求。
某银行通过采用云计算技术,实现了数字化转型,提升了IT基础设施的敏捷性和可扩展性,为业务创新提供了坚实的基础。已经成为企业IT转型的核心驱动力。2017年中国人民银行印发《中国金融业信息技术“十三五”发展规划》,明确提出稳步推进云计算技术应用研究,支持实力较强的机构独立或者联合建设金融业云服务平台。某银行随着业务的飞速发展,建立统一管理,高效响应,灵活部署的私有云环境已迫在眉睫。
二、私有云平台背景
- 私有云平台建设背景与目标:
为有效提升信息化建设水平,打造引领创新发展的“战略高地”,该行科技部首次提出构建以 IaaS 层为基础架构的私有云平台。该平台将统一纳管异构虚拟化平台、分布式存储、全闪存储等资源,向上提供计算、存储资源、数据库和中间件等软件的自助申请服务,实现多服务目录体系,并具备计量计费、统计报表等功能。
- 私有云平台建设一期项目遇到的主要问题:
2019 年,该行完成了总行数据中心私有云平台一期建设并投入使用。但在使用过程中遇到了诸多实际问题,主要包括:
- 资源管理困难: 由于私有云平台采用了异构虚拟化平台,导致资源管理复杂,难以统一纳管和调度。
- 服务质量不稳定: 私有云平台的存储资源存在性能瓶颈,导致服务质量不稳定,难以满足业务需求。
- 运维成本高: 私有云平台的运维工作繁琐,需要大量的人力物力投入,导致运维成本过高。私有云平台,统一纳管异构虚拟化平台、分布式存储、全闪存储等资源,向上提供计算、存储资源、数据库和中间件等软件的自助申请服务,实现多服务目录体系,同时提供计量计费、统计报表等功能。2019年完成总行数据中心私有云平台一期建设,并投入使用。但在使用过程中遇到了诸多实际问题。主要问题如下:
审批流程不贴合实际情况系统割裂,流程繁琐,重复登录,效率低下。云平台审批和现有ITIL运维管理工具审批割裂,参与人员需重复登录不同平台完成申请、审批和操作,流程繁琐,效率低下。维管理工具的审批流程割裂,各级参与人员需要重复登录不同平台完成申请、审批及操作工作;
云平台进行资源创建涉及到的变更操作实施与行内变更审批流程割裂。自动化程度较低资源创建需要手工选择安装所使用的的镜像;安装软件需要手工选择调用的自动化运维编排名称,填写参数。云平台无法与CMDB联动云平台的操作系统、软件列表不能跟CMDB中维护的版本联动;云主机物理机配置信息均需要手工填写,无法自动获取。裸金属纳管云平台无法申请裸金属类型资源;物理资源管理方式较为传统未能与云平台特性结合。三、问题分析
云管平台助力银行私有云落地
云计算凭借其对软硬件资源统一管控、服务化的资源快速供给等特性,为企业信息化建设提供重要平台。但云平台功能无法取代或适配银行现有的复杂且多样的管理系统,导致落地生根困难。同时,云平台的灵活性、便捷性与银行IT的逻辑复杂、严谨性强的审批流程相悖。
云管平台是资源服务的全生命周期管理平台,通过多样化的服务目录、固化的编排参数、标准化的审批流程,在业务需求和IT资源之间建立起桥梁。云管平台与云化资源层分开处理,运维部门要投入技术和人员来保证架构鲁棒性,保障基础环境的正常、稳定运行。而云管要做的更多的是与银行内各种各样的平台进行对接,以便实现统一管理,提供更多的服务和更高程度的自动化。
针对银行私有云落地的挑战,云管平台可以提供如下解决方案:
* 统一管理,提供更多服务:云管平台可以统一管理银行现有的IT资源和云化资源,并提供丰富的服务目录,包括计算、存储、网络、安全等,满足银行不同业务需求。
* 自动化审批流程:云管平台可以提供标准化的审批流程,简化银行IT资源的申请和部署过程,提高效率。
* 提升灵活性:云管平台可以提供灵活的资源调度和扩容能力,满足银行业务的快速变化需求。
* 增强安全性:云管平台可以提供完善的安全机制,包括身份认证、访问控制、数据加密等,保障银行数据的安全。
* 降低成本:云管平台可以帮助银行优化IT资源的使用,提高资源利用率,降低成本。
云管平台可以帮助银行私有云落地,实现IT资源的统一管理、自动化运维、快速扩展和安全保障,从而降低成本、提高效率,助力银行数字化转型。其一是云厂商现有的功能虽然完备,但是银行IT有着较大的存量IT资源与管理系统,云平台功能无法取代或直接适配现有的复杂且多样的管理系统,直接在行内落地生根。其二是云平台的灵活性,便捷性先天便与银行IT的逻辑复杂、严谨性强的审批流程相悖。私有云在银行IT落地,从技术和理念方面,均存在巨大的考验。探讨此问题前,首先我们先来分析一下云计算的概念。共享和敏捷是互联网时代下企业信息化建设的最大转变。云计算则以其对软硬件资源统一管控、服务化的资源快速供给等特性为企业信息化建设提供重要平台。消费者无须关心底层的IT技术,仅需要选择所需的服务来实现业务目标即可。而云管平台实际上是一种资源服务的全生命周期管理平台,它的本质是“资源服务”的提供者,通过多样化的服务目录,固化的编排参数,标准化的审批流程,在业务需求和IT资源之间建立起桥梁。由于银行行业的特殊需求,云管在银行落地时就需要与云化资源层分开来处理,对于云化资源层,运维部门要投入技术和人员来保证架构鲁棒性,保障基础环境的正常,稳定运行。而云管要做的更多的是跟行内各种各样的平台进行对接,以便实现统一管理,提供更多的服务和更高程度的自动化。四、私有云平台2.0建设实践
1、打造云化资源管理模式
私有云平台流程优化方案
一、痛点剖析:流程繁琐、审批效率低下
* 原有上架流程沿用多年,仅满足基本功能,难以应对激增的业务需求。
* 单个业务系统上线几十台设备的情况屡见不鲜,导致审批流程繁复冗长,消耗大量人力物力。
二、优化策略:升级流程平面,简化审批操作
* 将原有流程升级为设备入库、设备上架、资源申请三个平面。
* 设备入库:代理商统一录入新设备信息至标准EXCEL表,专人导入ITIL系统作为库存设备。
* 设备上架:无需填写设备基础信息,从库存中选择要上架的设备,补充必要信息即可。
* 资源申请:将虚拟机和物理服务器资源申请入口置于ITIL管理平台,采用单点登录方式调用云平台申请页面。审批流程仍放在ITIL中进行,与现有流程相契合。
三、优化成果:审批效率大幅提升,用户体验显著改善
* 简化申请流程,减少用户填写输入,优化每一处细节,提升用户体验。
* 审批流程更加清晰明了,审批效率大幅提升。平台1.0时代为了最大限度与现有流程贴合,未启用云平台自带的审批功能。全套审批流程使用ITIL管理系统中的虚拟机、物理机上架审批流程。此流程为前私有云时代申请虚拟机、物理机的流程,已使用多年,仅仅包含满足上架的基本功能。若干年前,业务需求还比较温和,一个上架流程对应一台设备也比较合理。而如今业务需求比暴风雨来的更猛烈,一个业务系统上线几十台物理机、虚拟机已经家常便饭了。几十台设备就对应几十个审批流程,这导致所有的流程参与者都疲于机械的审批操作。管中窥豹,可见一斑。原有的流程已经完全不能满足迅猛的业务发展速度。在私有云平台2.0中,把原有的流程升级成了三个流程平面:设备入库、设备上架、资源申请。设备入库 :新设备采购后,由中标代理商将设备的硬件信息,例如型号、序列号、高度、功率、CPU、内存、硬盘等基础信息统一录入标准的EXCEL表中。设备发货同时,代理商提供EXCEL表,并由专人导入ITIL系统中作为库存设备。设备上架 :设备上架管理员在ITIL中提交设备上架申请,填写设备信息时无需填写设备基础信息,只需从库存中选择要上架的设备,补充其他必要信息即可。设备上架也告别了之前烟筒式的管理。批量上架后纳入统一的云化资源池集中管理。资源申请 :资源申请流程分为虚拟机资源申请和物理服务器资源申请,是原上架流程申请入口的升级版。作为私有云平台提供的重要的两项服务,与ITIL进行对接后,将入口放在了ITIL管理平台中,采用单点登录的方式调用云平台的申请页面。审批流程仍然放在ITIL中进行,与现有审批流程相契合,普通用户无需在两个平台间进行相互切换。而且在开发过程中,对资源申请页面每一处细节进行了非常细致的调整、优化,让用户能以最简便的操作方式,最少的填写输入进行申请。2、审批流与技术流相结合
私有云平台2.0:自动化运维,简化繁琐流程
私有云平台2.0对传统的上架审批流程进行了优化,将审批流程与技术流程相贯通,大大简化了繁琐的日常操作。
流程梳理与分类,实现自动化变更发起
首先,平台对变更流程进行了梳理,包括上架变更、资源施工变更、堡垒机纳管变更等。通过对变更进行分类及设定变更角色,系统可以自动发起变更至相应处理人员,无需人工提出、关联变更,免去繁杂操作。
自动化触发云平台订单生成
变更审批完成后,系统将自动触发云平台按申请单生成待施工订单,包含云平台IAAS资源施工及自动化运维编排。这一自动化流程极大地提高了施工效率,并降低了出错几率。
与网络IP管理工具深度对接,实现自助式IP申请及自动分配
私有云平台2.0及ITIL管理平台与网络的IP管理工具进行了深度对接,在ITIL上架流程中增加了物理机IP申请模块,在云平台云资源申请中添加了虚拟机IP申请以及负载均衡虚拟IP申请两个模块。通过选择网络区域、IP类型等字段并向IP管理工具传递参数,即可实现自助式IP申请及自动IP分配,简化了IP申请流程。
自动生成布线工单,进一步提升工作效率
值得一提的是,在IP申请模块中还附加了布线相关信息,可以将布线工单信息自动生成EXCEL表格并附加到变更申请单中,从而简化了日常工作。
私有云平台2.0的优势
- 流程自动化,简化繁琐操作
- 自动发起变更,提高处理效率
- 自动生成云平台订单,提升施工效率
- 自助式IP申请及自动分配,简化IP申请流程
- 自动生成布线工单,进一步提升工作效率
私有云平台2.0通过自动化运维,简化了繁琐的日常操作,提高了工作效率,并降低了出错几率,为企业提供了更加高效、可靠的云计算服务。私有云平台1.0中服务器和虚拟机上架审批流程在ITIL中进行。实际操作时需要先提交上架申请,上架流程审批通过后。云主机管理员在实际操作前需要提交变更申请手动与上架流程相关联。变更审批完成之后,云主机管理员可以去生产环境按ITIL中提交的需求进行施工操作。施工时也需要参照ITIL中的需求手工填写云主机的配置信息,若安装软件还需手工选择所需要调用的自动化运维编排。云主机管理员需要进行多次关联及需求转换操作,操作较为繁琐且易出错。在私有云平台2.0中,将审批流程与技术流程贯通,简化了繁琐的日常操作。首先针对流程中涉及到的变更例如上架变更、资源施工变更、堡垒机纳管变更等进行了梳理,通过对变更进行分类及设定变更角色等方式实现流程自动发起变更至相应处理人员,免去了人工提出、关联变更的复杂流程;其次,变更审批后自动触发云平台按申请单生成待施工订单,包含云平台IAAS资源施工及自动化运维编排。此外,云平台2.0及ITIL管理平台与网络的IP管理工具进行了深度对接,在ITIL上架流程中添加了物理机IP申请模块,在云平台云资源申请中添加了虚拟机IP申请以及负载均衡虚拟IP申请两个模块。通过选定网络区域、IP类型等字段并向IP管理工具传递参数,实现自助式IP申请及自动IP分配。值得一提的是通过在上架流程中的IP申请模块中附加了布线相关信息,可以实现将布线工单信息自动生成EXCEL表格并附加到变更申请单中,极大简化了日常工作。
3、全自动资源部署
自动化运维,解放人力、提高效率
通过自动化运维平台与操作系统、软件类型的版本进行关联,匹配自动化安装编排,实现资源申请单一键自动部署。云管理员无需任何手工操作,只需确认信息即可完成资源施工。
智能选择,优化资源配置
云平台自动从IP管理平台获取IP信息,匹配网络分区,确定虚拟化集群。根据操作系统信息匹配虚拟机镜像。通过算法计算,考虑反亲和性原则以及宿主机计算资源和存储资源的负载情况,最终确定资源部署位置。
标准化参数,简化操作
各类参数标准化,云管理员仅需确认信息,即可完成对资源的施工。极大地简化了操作流程,提高了工作效率。动匹配自动化运维平台的编排进行安装,通过对各类参数的标准化,云管理员仅需要确认信息,无需任何手工操作即可完成对资源的施工。施工时,云平台通过从IP管理平台获取的IP信息,自动匹配网络分区,根据网络分区确定所使用的虚拟化集群,根据操作系统信息匹配合适的虚拟机镜像。最终根据同一订单反亲和性原则以及宿主机计算资源和存储资源的负载情况条件,通过算法进行计算实现最终落点的选择。
4、微服务部署架构
云管理平台升级:现代化、高效、弹性
1. 高可靠、高可用架构
- 微服务架构:各个组件模块相互解耦,保证服务可靠性。
- 前端负载均衡:分发客户访问,确保高可用性。
- 后端数据库:MariaDB 主主复制模式,保证数据一致性。
- 独立管理节点:监控平台健康状况,调度业务负载。
2. 统一集成平台
- 内置API网关:统一对接第三方平台,保证数据一致性。
- 统一接口网关:减少数据依赖和调用需求,提高效率。
- 标准API和开放接口生态:支持全系统API文档自动生成,便于集成和扩展。
3. 弹性扩展,在线升级
- 分布式集群部署:支持在线平滑升级和扩展。
- 横向扩展:支撑大规模资源管理场景。
4. 安全可靠,行业标准
- 国密算法支持:满足国家安全要求。
- 多重认证机制:保障数据安全。
- 定期安全漏洞扫描:确保平台安全。2.0中的云管理平台升级,采用微服务开发框架,各个组件模块之间相互解耦。前端由负载均衡设备分发前端客户访问,相关微服务模块采用主备、主从、集群等模式分摊在多台应用节点上部署,各自保证其微服务的可靠性;后端数据库采用 MariaDB 主主复制模式,并发单写,保证数据一致性;另外管理节点独立部署,主要负责监控云管理平台自身的健康状况及调度业务负载。通过内置的 API网关,统一对接第三方平台,以保证平台对外数据的一致性;同时统一接口网关减少了不同平台模块之间数据相互依赖、相互调用的需求,保证数据调用的效率;加之标准 API,开放接口生态,支持全系统 API 文档的自动生成,便于平台后续的集成及扩展。此外,云管理平台采用分布式集群部署方案,支持在不影响业务正常运行的前提下,在线进行平滑的升级和扩展,可横向扩展支撑大规模资源管理场景。五、总结
云计算的"核心目标"是资源按需快速供给,是对IT基础设施的重大创新。
私有云团队致力于通过融合前沿技术和实际情况,不断推进云化数据中心建设,实现管理规范化、资源池标准化和全生命周期自动化。
团队将遵守规章制度、沿着技术研究路线,提供更完善、高效、智能的服务,为数字化转型奠定坚实基础。的“核心目标”是资源按需快速供给,大力发展云计算是对IT基础设施的巨大创新。私有云团队旨在通过将最前沿的技术与该行实际情况相结合,不断推进云化数据中心建设,推进管理流程的规范化、资源池建设的标准化,资源全生命周期管理的自动化。将以该行的各项规章制度为本,以云计算的技术研究路线为纲,以提供更加完善、高效、智能的服务为宗旨,为数字化转型提供最坚实的基础。