作者 |葛覃
编辑 | 阿文
2024年,大模型从理论研究的殿堂,迈向广阔的现实世界,AI技术的落地正掀起一场影响深远的变革浪潮。
9月19日,华为AI用户峰会在沪举办,众多大咖嘉宾聚而论道,围绕大模型如何与行业深度融合,关于技术和非技术的实践难题,企业的共性需求和个性要求如何满足等议题,探讨大模型落地的解决之道。
去年海内外巨头与独角兽不断刷屏,争相推出自家大模型的“史诗级更新”,大模型也被寄予厚望,仿佛任何业务领域和应用场景都能掺上两脚,FOMO(“Fear of Missing Out”)的情绪从大模型厂商,传递到每一家有想法和资源的企业身上,狂热与不理智达到了顶峰。
今年“大模型泡沫论”甚嚣尘上,以高盛6月份发布的《生成式AI:投入过多,收益过少?》报告为例,其中提到,未来几年科技巨头、企业和公共部门将在生成式AI上投入约一万亿美元的资金,但目前来看,这些投资似乎并没有带来预期的回报。
期间的反差来自于一个目前无法证实的担忧——AI会不会陷入新的低谷?
当然这种担忧并不多余。自从1956年的达特茅斯会议之后,人工智能技术和产业经历了三起三落,少有一类技术能够跨越如此之长的周期,既不归于沉寂也尚未实现规模爆发。
曼哈顿研究所高级研究Mark P. Mills认为,正如汽车、无线电、互联网等革命性技术,新技术在改变世界之前,都会经历漫长的蛰伏期,绕不过发明创造、商业可行、大规模推向市场三个阶段。
“颠覆性创新”通常每个阶段持续20年左右。例如在汽车发明(1886年)之后多年,T 型车设计才出现(1908 年),到了1920年代末,美国汽车渗透率上升到20%。
有时创新发生得也会快一点,从“分组交换”的想法到创建互联网不到十年,万维网公开商业化花了 20 年时间,但只用了 10 年时间就看到了显著的市场渗透。
AI技术为时代创造了一个极限弯道赛段,弯道超车还是被狠狠甩下,甚至跌落崖底……一切都是未知,在探索未知的过程中,隐藏在背后的迷雾和暗礁若隐若现。仅就目前来看,企业落地大模型的共性难题,包括场景、数据、成本、IT架构、实践等方面,相互交织又相互联系。
场景之困境:如何找到大模型落地场景人工智能和机器学习领域的知名学者吴恩达认为,大模型在众多场景中具有巨大的潜力,但也需要与领域知识相结合。
目前学术界与产业界已经达成共识,大模型不是“万能药”,只有把大模型任置于具体的场景中,才能兑现技术价值,避免陷入“拿着锤子找钉子”的窠臼。
此前大模型厂商“内卷”参数和数量,千亿参数、万亿参数的大模型,代表了大模型厂商的硬实力,但在很多业务场景中,百亿级别参数大模型已经足够,十亿级参数大模型也应用颇多。
如果说以前企业更多看到了炫目的大模型,那么现在更
关注的是,如何将已有的模型应用到实际场景中,解决自己的具体问题,并且持续评估某个具体场景的前景。如此,企业也从前期探索大模型时的试验性质,转而关注实实在在的指标,可以是降本、增效、以及新体验。
识别大模型落地场景大致可以分为三大方向,商业价值决定了是否值得做,场景成熟度决定是否能做,持续运营空间决定了是否可进化。
数据之难题:如何为大模型做好数据治理大模型有多依赖数据?中国科学院院士梅宏一言以蔽之:现阶段AI的成功源于深度学习,这只是AI研究的一个子领域,其本质是数据驱动的智能、计算实现的智能,即“数据为体、智能为用”,犹如燃料与火焰的关系,燃料越多,火焰越大,燃料越纯,火焰越漂亮。
在深度学习算法没有出现原理变革的前提下,大模型对数据的依赖越来越严重,对算力的消耗也越来越巨大。在这种情况下,数据规模和质量就成为影响大模型落地的关键因素。
值得一提的是,大模型需要的数据,是全场景、全流程、全方位的知识数据。对于企业而言,企业原有数据库和大数据平台中的数据,并不能直接为大模型使用,需要将数据加工为大模型能使用的知识。现实是企业往往不具备相应的数据治理能力,部分企业积累了数据却没做面向AI的数据治理,部分企业只是简单储存了数据,还有更多的企业缺少足够的数据。
企业数据可能存在缺失值、噪声数据、重复数据等质量问题,需要进行数据清洗。数据加工也是常见的需求,这可能涉及到数据的转换、编码、特征提取等操作。例如将文本数据转换为向量表示,以便大模型能够进行处理和学习。
成本之考量:如何在有限成本下探索大模型成本,贯穿大模型从研发到落地再到持续运营的全过程,早期的算力供给就是一个典型问题,大模型的训练和推理需要大量的算力支持,这就意味着企业需要投入巨额资金来建设和维护强大的算力基础设施。
构建一个大型语言模型可能需要耗费数百万美元甚至更多的资金用于购买高性能的 GPU 和 NPU 等计算芯片,以及支付高昂的电力费用和数据中心运营成本。即便企业采取云服务的方式,也需要考量成本。数据的收集、清洗和标注也需要投入大量的时间和金钱,构建一个高质量的数据集可能需要数千小时的人工工作。
企业应用大模型不仅需要评估启动成本,更要考虑运营成本。研究公司 Gartner 表示,将 AI 直接部署到公司的系统中,成本可在 500 万至 2000 万美元之间,预计到 2025 年底,30% 的生成式 AI 项目将因为这些高昂的费用而被放弃。
IT之变革:什么样的企业IT架构才能更好支撑AI智能化的基础是数字化,业务数字化的程度,决定了 AI 能不能落地。以往信息化、数字化做得好的企业,在探索大模型时更得心应手。而企业越是探索大模型,就越发现需要补足其他数字化能力,进而倒逼自己新一轮的 IT 变革。
以数据为例,数据治理和数据能力建设,往往代表企业有良好的数字化能力,企业内部有没有统一的数据标准,有咩有明确数据的主权和责任人,有没有区隔不同的数据空间。诸如此类的数字化能力,都是支撑企业探索大模型的必经之路。
如果一个场景连信息化都没有做到,不可能期盼大模型一下子将其智能化,而这也往往代表该场景有难以克服的问题,不适合被数字化和智能化。
在一个具体大模型应用中,大模型可能只占据30%的比重,而剩下的70%都依赖于原有的IT和业务,如果没有数字化的业务能力,那就意味着大模型只落地了一个“大脑”,缺少“四肢”和“五感”,AI 运营的成本也会大大增加。
因此,大模型一定要与企业的流程、组织、技术相结合,同时企业的数据也要与业务场景做深度结合,才能将人工智能融入企业,真正把人工智能变成一个企业可用、能为企业带来价值增长的工具。
路径之探索:企业如何寻找大模型落地最佳实践大模型的落地是一场系统性变革,不仅涉及到技术,也需要流程、组织和认知等相应的能力支撑,场景、数据、IT等,都是大模型落地的突出问题,而如何将这些关键动作梳理清晰,形成一套可执行的连贯动作,企业都在期盼这样的“最佳实践”。
行业内常说,数字化是一把手工程,实际上大模型也是,它不仅能够确保项目的战略一致性和资源的有效配置,还能够提高决策效率,促进跨部门协作,控制风险,并塑造积极的企业文化。
进入到具体的实操阶段后,企业需要识别业务痛点,明确业务目标,并通过现状诊断、能力建设、应用部署和运营管理等步骤,逐步推进大模型的应用。这包括了对数据的治理、模型的训练、服务的融入以及持续运营的规划和配套。
此外,大模型的落地还需要考虑数据安全和隐私保护的问题,安全合规始终是企业开展业务的前提。企业在确保数据安全和合规性的同时,还需要建立相应机制,遵守各个国家和地区的法律法规,避免大模型“水土不服”。
在推动大模型落地的过程中,企业还需要关注人才培养和组织变革,例如沿着大模型的边界构建跨部门协作机制,以便更好地利用大模型技术进行数据分析和决策支持。同时建立一个能够快速响应市场变化和客户需求,减少层级和冗余的敏捷组织结构,对于早期的大模型探索,速度决定生死。
大模型的诞生,来自于非共识。OpenAI信奉“大力出奇迹”工程化的方式,将数据、算法、算力等要素资源再融合创造,才有了AI时代新的开端。
而大模型要实现规模落地,仰仗于形成新共识。当所有企业都在寻找新时代的取胜之匙,大模型落地才有业务价值。
是时候拿着新地图去开启AI大航海时代了。