数据中心“三要三不要”,助力金融行业AI落地

迪哥说 2025-03-27 17:28:42

面对日新月异的人工智能技术,金融行业正站在新一轮变革的风口浪尖。AI落地金融业正在如火如荼推进,各方都在期待新的IT架构出现,既能有效利用数据资源、满足实时性要求,又能降低企业运营成本。

金融AI行业化落地,新的技术逻辑正在形成

当前,AI浪潮席卷全球,各行各业都在落地AI应用,尤其是金融行业,正在积极融入其中。

业内已经认识到,AI大模型的出现,可以唤醒原来那些沉寂在业务系统里的基础数据,可以创造新的业务价值。这一过程中,通过进一步挖掘数据价值,为金融业务的发展“造血”,成为共识。

从大方向看,在金融行业落地AI,需要相关企业通过自己的IT系统建设,对海量的数据进行训练和推理,然后生成高质量、有价值的金融数据,最终满足AI业务场景需求。

但在实操过程中,我们发现相关金融企业,受外界舆情影响,往往将目光聚焦在AI算力上,而忽视了数据存力的重要性。要知道,AI数据的质量、共享、流动、读取,都与AI大模型设计与训练,有着密切联系。

对金融企业来说,如果只是一门心思搞算力建设,忽视存力的重要性,等于与高质量数据擦肩而过,等于金融AI行业化,成了无源之水。

这意味,推动金融企业的AI进程,需要一个更可靠的系统和架构,让那些沉寂在业务系统重的基础数据,再次焕发生命力,再次创造新的价值。而且,面对庞大的数据量,需要系统性思考,如果提高存算效率,让企业对IT投入的每一分钱,都花在刀刃上。所以在AI时代,数据中心建设要牢记“三要三不要”:

一、数据中心要 “存算分离”,不要“存算一体”,提升AI基础设施投资效率

AI落地金融行业,需要走“存算分离”路线。通俗理解,将数据存储与计算能力解耦:数据存储在本地私有化环境中以保证安全与合规,而算力(如CPU、GPU资源)可以通过云化实现弹性扩展和资源高效利用,从而实现“数据隔离”与“资源优化”的双重目标。

数据不出本地,仅将计算任务(如算法、模型)提交到云端处理,减少数据传输中的暴露风险,从而达成数据隔离的效果。

从实际运维角度看,存算分离后,好处多多。比如说,可以更方便的纵向扩盘,以往本地盘槽位有限,直接扩盘很难。如今存储空间外置,想怎么扩就怎么扩,灵活方便。再比如说,用外置存储本身故障率低得多,6个9的可靠性,服务器坏了就将外置存储LUN映射过去,不用从零重建副本。

另外,通过建设统一的存储数据池,实现数据资产集中化管理,避免数据冗余,同时还能促进跨云的数据共享。像不同云服务上的计算资源访问同一数据源,无需多次复制数据,节省存储成本并保持数据一致性。

二、数据中心要“建数据湖”,不要“建数据岛”,降低数据接入难度,加速AI数据的共享与流动

AI在行业化落地过程中,最难的不是AI模型的应用过程,而是前期海量数据接入、模型工程对接等过程。AI数据湖具备三大核心能力:(1)要解决数据池化,通过Omini-Dataverse加速AI场景下海量数据的流动与共享,利用DME做好数据管理。(2)要使能数据和模型工程,通过ModelEngine全流程工具链,帮助金融企业降低数据接入的难度,提高视觉、文本等各类模型的对接和训练效率。(3)要提供极简的应用对接开发平台,让伙伴通过开放的应用生态,完成各类模型应用的对接、编排、发布。

同时,在建设AI数据湖的过程中,还要注意一定要用SSD半导体硬盘去替代机械硬盘。在AI时代,数据需要持续的被访问,而且数据作为资产也需要持续长时间被保留下来,因此未来冷数据会越来越少,而且今天半导体的SSD硬盘在当年的采购价格应该比机械HDD硬盘要贵,但是考虑十年数据中心的耗电、机房设施的各种费用, SSD半导体硬盘远远机械硬盘的成本低很多。

三、数据中心要“数据备份”,不要“数据裸奔”,守护AI核心数据资产安全

AI时代数据已经资产化,数据越来越有价值,做好数据保护非常关键。数据作为资产形式出现之后,数据保护一定会成为一个热点话题。在今天,比如像中国重要的金融、政府行业,数据被保护下来的占比也是极低的,远远低于瑞士、新加坡和美国这样的发达国家。因此数据保护产业在中国大有可为。此外,数据中心的存储设备,还需要具备数据防勒索能力,构筑金融企业数据安全最后一道防线。

从去年开始华为推出了三合一的OceanProtec备份系统,把备份软件+服务器、备份介质三合一,真正提供高效率的备份系统,同时自带数据防勒索功能。而且还向业界开源了华为的备份软件Open-eBackup,至今为止已经有很多伙伴开始采用这些开源软件来构建自己的备份系统。

总之,AI的行业化落地,首先会在金融、医疗这样数据量比较大,数据质量比较高的行业落地。而数据存力建设是实现AI的必要前提,需要引起广大金融企业和监管机构的重视。

0 阅读:12
迪哥说

迪哥说

感谢大家的关注