释放“数据要素”价值,软通动力唤醒企业沉睡的积累

因为科技是阴天 2024-05-07 17:41:01

释放数据要素价值的路径不止有一条。有一条路相对较短,但多数企业学不来;另一条路正在修,未来可期;还有一条路此前没有形成闭环,影响了数据要素的价值释放,但软通动力现在就想走通这条路。

01 数据要素三部曲五步走

两个概念需要再被明确。

初步测算,2023年中国数据生产总量预计超32ZB,数据要素市场规模或也已超过1200亿元。但数据与数据要素有关系,可并不是一个概念,两者的差别大概就如石油与汽油之间的不同。

另一个概念。

传统数据治理与面向AI的数据治理也不是一个概念。过去十年,多数数字化服务商,其实就是在证明——“不是所有的牛奶都叫特仑苏”。他们对原始数据进行整理、清洗、加工,将原始数据从无序变为有序。

但这也是传统数据治理。

传统数据治理所生产的“产品”,与大规模语言模型(LLM)所需要的语料数据集,其实还存在一定的差距。大模型需要投喂海量的、文本格式的、多样化语言风格的数据,也需要高质量、多渠道、多语言的数据。

而“面向AI的数据治理”更需要解决四个挑战:数据“拥”而难“用”、数据“汇”而难“慧”、数据“通”而不“统”、数据“治”而不“智”。也只有解决上述挑战,数据才能成为产品化的数据集,才能称之为“数据资源”。

但这还没有完成业务闭环。

如前所述,自“数据要素”概念提出后,业内逐渐清晰了数据与数据要素之间的差别,以及传统数据治理与面向AI的数据治理之间的差别。只不过,这也才厘清了从数据到数据要素脱变的前半段路径。

后半段路径,则需要有新的模式、新的技术介入。或者说,“数据资源”经过确权、登记、评估、定价、入表等一系列环节,才能成为了可流通的“数据资产”。更进一步,将“数据资产”融入社会生产经营活动,融入行业应用场景,并以大模型为载体进行价值释放,才能最终成为可产生经济效益的“数据资本”。

这就是数据要素蜕变的三部曲。

也正是厘清了其中的每个环节,软通动力就形成了自己业务主线,他希望分五步走——以咨询服务为牵引;以数据基础设施为支撑;以数据标注和数据归集等服务为辅助;以算法基础设施,以及行业大模型训练和微调为发力点;以大模型场景应用为驱动,唤醒数据要素的潜能,帮助用户构建数据要素业务闭环。

02 咨询服务可落地

“自从进入数智化转型的深水区,就已经没有什么‘最佳实践’。”杨念农是软通动力咨询与数字化创新服务线联席总裁。在此前接受的采访中,杨念农就表示要跳出“最佳实践”的套路,首先要对企业的“业务战略”抽丝剥茧。

说得再直白些,“最佳实践”是可以套用的模板,对“业务战略”的抽丝剥茧,才是对数智化转型的个性化设计。或者说。大到城市小到企业,构建数据战略,都是牵一发而动全身的大事,不可能千篇一律——其需服从企业的“业务战略”,即数据战略向上要与企业业务战略打通,向下要与数字基础设施对齐。

正是遵从将“业务战略”拆解为“数据战略”的思路。目前,软通咨询已可提供主数据管理咨询、数据治理咨询、数据能力规划、数据平台咨询与实施、数据安全规划与实施等9大类解决方案,可提供从咨询到落地的端到端服务能力。

03 “软硬一体”的数字基础设施

承接咨询服务的落地,即是数据基础设施建设。近年来,软通动力布局了“四大业务增长战略”,其中的两项——计算产品与数字基础设施,以及数字能源与智能算力,都与基础设施有关。而且不同于多数数字化服务商,软通动力不仅关注实施交付能力,更具备“软硬一体”的全栈数字化产品方案。

随着同方计算机的加入,软通动力补强了PC、通用算力、智能算力、AI一体机产品,以及存储服务器、分布式存储系统、归档存储系统、备份存储系统等产品。协同软通动力自研的天鹤操作系统、天鹤数据库、鸿鹄SwanLinkOS、数字孪生与仿真平台等,其从底层构建起了软硬一体化的能力。

更重要的是,软通动力借此能力,已有条件完成基础设施的向下垂直打穿。其可针对芯片、计算、存储、网络、云平台、数据库等全栈技术产品,进行验证、适配、定制和调优,所谓“多云、多芯”就再不是问题,而且还将最大限度地激发算力的能量。

04 数据治理是当务之急

更进一步,数字基础设施之上即是数据治理。如前所说,软通动力在此环节,提供的是“面向AI的数据治理”,而且其采用了“平台+服务”模式,将自身的行业沉淀、场景理解融入其中。

此前,“云上中台·重明”数据中台已正式发布。据软通动力副总裁唐平介绍,该平台已可提供数据集成平台、主数据管理平台、数据工厂、数据资产管理平台、数据开放平台等13款独立产品,能完整覆盖企业数据应用与全生命周期数据治理两大体系。

举例说明,在能源革命和信息通信技术革命的驱动下,车企正在经历一场智能化的变革。此过程中,知名合资车企选择部署了“云上中台·重明”主数据管理平台(iMDM)。该方案搭建起了企业级的数据治理平台,建立主数据标准体系,消除了企业内部数据“孤岛”,显著提升库存流转效率,从而实现了数据治理工具链端到端闭环。

不仅如此。

软通动力还已建立起一支专业团队,面向行业提供数据标注和数据归集服务。或可如此比喻,未经标注的数据,就像是在说着各自家乡的方言,而经过数据标注,所有的数据学会了说普通话,数据质量已大幅度提升,将这样的数据语料,喂给大模型,更将极大地提升大模型训练应用效率。

但这里需要澄清误解——万不要认为数据标注和数据归集,是两项既不起眼,又没什么技术含量的工作。如标注安全帽等低端的数据标注,确实将被人工智能技术取代。但更多的数据标注如“寻宝”,服务团队需从图片、文字、地理信息等数据载体中,“寻宝”标注出有价值的信息。

而且高端的数据标注,必须由懂行业、懂场景的行业专家执行。例如,保险行业数据归集,服务团队就必须理解保险业务的导购、理赔、精算等场景。这也才是真正的“面向AI的数据治理”。

05 “大模型”释放数据价值

正是凭借“平台+服务”模式,软通动力已在持续帮助用户,完成“面向AI的数据治理”。

因为这工作,软通动力也将支撑其业务闭环中的关键一环。而接下来的工作,即是将数据要素融入社会生产经营活动,完成数据变现,这也就是通常所说的“数据要素×”。

其实,数据要素价值释放的路径不止有一条。互联网企业在此方面颇有心得,其数据可在生态内部流转变现。例如,电商平台数据可反哺入驻电商平台的商户,而且这条有一条路相对较短,闭环变现能力也较强。

还有一条路正在修——我国已成立超过50家数据交易机构,他们以数据API、数据集、数据报告等为主要交易标的,并注重在解决数据供给难、确权难、定价难、入场难、监管难、安全难等关键共性难题。但不得不说,这条路还处于持续探索之中。

另外,还有一条路是“圆的”。

此前这条路没有形成闭环,现在大模型补上了断点。正是因为具有“面向AI的数据治理”能力,软通动力希望以算法基础设施为支撑,以行业大模型训练和微调为发力点,以大模型场景应用为驱动,帮助用户形成数据要素价值释放的业务闭环。

其实,自大模型出现之后,就捅破了应用的天花板。根据IDC预测,伴随AIGC技术的发展,智能化应用将出现爆发式增长,2024年,全球将涌现超过5亿个新应用,相当于过去40年的总和。

这就为数据要素价值释放,创造了更多的窗口。只不过,有窗口还要有窗框——2023年,软通动力正式推出软通天璇2.0 MaaS平台,其在大模型技术底座层,加入了升级的软通训推一体化平台,并扩展接入了多个开源和闭源大模型接入以及深入研究的开源大模型。

同时,在软通天璇2.0 MaaS平台的行业大模型及管理层,软通动力为客户提供了大模型的数据处理、继续训练、调优、部署、推理和数字资产管理服务,并形成了软通动力应用开发平台。

在此之上即是行业应用。

这也是业务闭环的中的最后一环。例如,在保险领域,软通天璇2.0 MaaS平台接入盘古大模型,已经帮助企业极大地提升了能效。其在在核保、核赔等环节,可以回答保险理赔、方案定制、产品推荐、保单查询等相关问题,甚至在部分场景能够做到全自动化秒级处理。

06 数据要素联接数字中国

当然,这也只是开始。未来,数据要素更将连接在数字经济侧与实体经济侧,联接一家家企业,联接一个个行业,并在智能制造、智慧农业、供应链金融等领域,创造全新的业务模型,激发新质生产力。

这也正是软通动力的业务方向,而他现在唯一要做的事情就是,提供从“第一公里”到“最后一公里”的服务,提供从算力基础设施,到算法基础设施,再到场景应用的服务,唤醒企业沉睡的积累,释放企业数据要素价值潜能,为客户创造可量化的经济效益。

0 阅读:144

因为科技是阴天

简介:感谢大家的关注