AI里程碑:专家解读大模型技术8大趋势

薪科技快评 2024-03-09 15:41:40
张宏江:大模型技术发展的八点观察

大模型技术蓬勃发展,催生各行业AI热潮。在亚布力年会上,专家张宏江分享了八大关键洞察,揭示大模型的惊人能力和对社会的迅速影响:

第一,大模型取得突破的核心是Scaling Law

Transformer 架构革新了大模型的发展,奠定了人工智能 2.0 时代以算力、数据、算法为核心的融合之路。大模型的崛起不仅归功于算法创新,更是系统研究的重大胜利,为人工智能迈向通用化目标铺平道路。

大模型时代,Scaling Law(规模律)为模型性能持续提升提供动力。该定律表明,随着模型参数增加到数十亿甚至数百亿的规模,可有效解决自然语言处理(NLP)中的棘手难题。这一规律已被证实,并预计将在未来推动持续的技术突破。

随着模型参数规模的指数级增长,模型性能呈现爆炸式提升。以 PaLM 为例,当参数数量增加到 5400 亿时,其性能获得了显着飞跃。

模型规模扩大带来能力涌现,模型性能随参数激增。在特定规模之下,性能提升渐缓;超过拐点后,性能随参数大幅提升。

数据质量与规模同等重要。相同规模的数据,高质量数据能训练出更优模型。

随着模型参数的扩大,精度显著提升。自 2018 年以来,参数规模呈指数级增长,每 4.2 个月翻一番。

第二,大模型是新的操作系统和计算体系

大模型革新了人机交互,犹如一个便捷的“操作系统”。它无需编程或打字,即可执行用户指令,效仿传统的计算机运算流程——用户输入、系统处理、信息输出。通过与大模型(如GPT)的自然语言交互,用户可轻松实现数据的输入、处理和获取,彰显了大模型在人机交互中的强大潜能。

作为操作系统,模型简化了人们调用应用程序的过程。正如微信小程序帮助人们减省了在App Store下载应用的过程,大模型甚至省去了搜索小程序的过程。例如,人们只需告诉大模型,画一个亚布力的美景,它就可以画出亚布力各种角度的美景,甚至生成视频。因此随着大模型的应用日益广泛,App这种形态可能会消失,甚至连小程序也会被淘汰。从另一个角度看,大模型作为一种新的操作系统,也给计算体系带来了巨大的转变,即从原来的以CPU为核心转变为以GPU并行处理为核心。这种体系转变会带来新的核心技术和新的玩家。近日英伟达发布财报后,股票上涨了15%,也印证了过去CPU时代的Wintel体系会被当今的大模型和GPU体系所取代。

图3 大模型是新的操作系统,计算体系从CPU为核心转变为GPU为核心

第三,大模型作为新的平台,会带来新的生态

大模型革新计算方式,成为平台级服务。其底层基于云平台,通过云服务可调用大模型 API,使开发者便捷地将其融入应用,释放 AI 潜能。

OpenAI持续发布创新功能和部署新代理,引发业界担忧,因为它们对大模型应用开发商的业务构成潜在威胁。正如当年微软Windows对软件厂商带来的冲击,这种担忧验证了"模型即平台、应用、产品"的趋势。

图4 大模型:新平台,新生态

大模型将颠覆所有应用,促使软件重写。互联网公司纷纷抢滩大模型,否则将失去平台地位。当前亚马逊市值被超越,正是其落后于大模型趋势的体现。

第四,大模型性能是大规模商业落地的关键

优化后文字:

采用垂直小模型的策略不可取,因为其能力不足以支撑广泛应用。历史证明了这一点,例如 30 年前苹果公司推出的“牛顿”平板电脑。尽管被视为革命性产品,但其关键技术——手写和语音识别——未能达标,导致用户数量暴跌,产品被撤回。因此,专注于构建具有强大能力的大模型对于稳定性和持续成功至关重要。

图5 大模型性能是大规模商业落地的关键

提升大模型性能,解锁商业潜力

大模型在智能客服、文本生成等领域潜力巨大,但高错误率和幻觉现象会阻碍其发展。优化大模型性能是实现商业落地的关键。持续改进模型准确性和减少幻觉将提升用户体验,推动应用层创新,从而为基于大模型的商业模式创造无限可能。

第五,大模型将同时推动存量和新增应用

大模型革命性地提升生产力,超越 AI 1.0 时代。凭借强大的能力,大模型已广泛应用于办公、视频制作和医疗领域,显着提高效率。未来,大模型将继续推动原生应用落地,带来更多价值。

在大模型时代变革中,抓住投资机遇至关重要。历史经验表明,在技术迭代和发展阶段,极具潜力的产品会不断涌现。不过,无需过度焦虑,市场参与者应:

* 快速了解大模型带来的影响。

* 专注于当前业务,评估大模型成熟后的转型潜力。

图6 大模型将同时推动存量和新增应用

大模型不仅会催生一系列原生应用和AI创业公司,同时也将推动存量市场的增值和发展。正如从PC互联网转移到移动互联网的过程中,存量巨头的市值增长,远大于新生公司的市值总和。放眼未来,我们有理由相信,大模型带来的效率提升必将赋能新的应用场景,同时推动存量市场的增长与原生应用的创收,从而带来整体市值的增长。此外,AI时代原生应用的核心特征,是人与机器的自然交互,因此大模型本身即是AI时代最大的原生应用,我们可以期待这一超级应用的出现。

第六,多模态大模型是AGI的终极模型

多模态模型,突破传统,将视频、语音、图像等数据融入训练,打造跨模态理解的大模型。其超强理解能力已席卷各行业,引领新一轮人工智能革命。

图7 Sora模型演示

Sora,一款突破性的AI模型,缔造了惊叹场景:SUV在山路驰骋,精准遵守交通规则,流畅过弯。无需预设地图或3D建模,该模型自主模拟了这一影像,展现了对物理世界的深刻理解。这一突破为构建理解、描述和模拟现实世界的“世界模型”铺平了道路,增强了我们对实现通用人工智能的信心。

图8 世界模型指能够理解,描述和模拟现实世界的模型

文生视频是Sora最令人惊叹和备受瞩目的功能,但事实上多模态模型的能力范畴不止于文生图、文生视频,更包括对图片或视频的理解和阐释——多模态模型应同时具备正向的生成与反向的理解能力。诚如美国物理学家理查德·费曼的箴言所揭示:“What I cannot create, I do not understand”。只有大模型真正理解物理世界,才能更好地创造和模拟。如何训练这样的模型?打个比方,飞行员学习驾驶飞机需要先在模拟驾驶舱中训练很长的时间,模拟驾驶舱是由空间模型和飞机动力学模拟形成,飞行员先从模拟的数据中学习一切操作再应用到现实驾驶当中。同样的道理,我们可以通过观察和描述物理世界产生新的训练数据,从而训练出能够理解和模拟物理世界的大模型。按照这个逻辑,谈及未来应用,多模态大模型很可能重新改写自动驾驶系统。过去,所有自动驾驶公司每到一个新的城市,必须花费3到6个月时间重新扫描这个城市的所有街道,未来这项工作可以由多模态大模型代劳。

第七,多模态大模型驱动通用机器——从简单指令到自我规划

具身模型结合了多模态大模型和机器人,增强机器人的环境感知和决策能力。这种融合使机器人能够理解并描述周围世界,从而实现自主行动。该模型代表着通用机器人的未来,拥有无限的可能性。

例如,在训练机械手打开微波炉的任务中,传统机械手可能难以应对微波炉门锁的操作。而引入多模态大模型后,机械手可以通过与模型的交互,学习操作手册,从而掌握打开微波炉前需要先按下解锁按钮的步骤。从这个角度讲,未来的机器人不仅能够执行已经被训练的任务,还可以通过大模型的加持,完成之前没有经过训练,但是能够通过自主学习理解的任务。在大模型的带动下,机器人将完成从简单指令到自我规划的能力跃迁,这个过程让研究者看到了实现通用机器人的可能性。

图9 多模态大模型驱动通用机器: 从简单指令到自我规划

第八,“奇点”来临,未来将是自主智能的世界

随着人工智能模型的不断进步,通用机器人的实现预期时间大幅缩短至 5 年内。语言、视觉和具身控制技术的成熟已为自主行动系统的诞生铺平了道路,它将彻底改变我们的生活。

人工智能(AI)在棋盘上的崛起颠覆了人类主宰的地位。

三十年前,“深蓝”开创了AI作为“副驾驶”的时代,辅助人类提升棋艺。而AlphaZero的出现则宣告了AI独立思考的时代,它以人类无法理解的招式,凭借机器算法和目标函数制胜。

如今,人类大师在棋盘上的优势荡然无存,AI独步天下。这种进化表明,随着AI技术不断迭代,人类作为“副驾驶”的角色将逐渐被取代。

图10 历史来看,Copilot将会被迅速替代

AlphaZero 的出现展示了机器在特定领域展现出的上帝视角。人类看到的只是一部分信息,而机器却能洞察全貌。

《奇点来临》一书预言,当技术发展超越人类学习能力时,机器将超越人类,取代需要平均智力和技能的任务。如今大模型强大的学习推理能力预示着“奇点”临近。

图11 奇点即将来临?

未来企业增长不再依赖于人力,而是利用算力与自主智能体。大模型预示了一个分化的未来,3% 的精英掌握技术,而 97% 的人处于闲置状态。企业应重新考虑增长策略,拥抱自动化和自主智能,以提高生产力和实现业务发展。

-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

0 阅读:21

薪科技快评

简介:薪科技评说,发现技术的点滴,记录科学的飞跃!