文 | 智能相对论
作者 | 陈泊丞
在2024世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上,百度创始人、董事长兼首席执行官李彦宏谈了些对于AI大模型的看法,语惊四座。
他先是指出,“百模大战造成了社会资源的巨大浪费,尤其是算力的浪费。但同时也使得我们追赶世界上最先进基础模型的能力得到了建立。”
而后又强调,“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”同时李彦宏也表示,要跳出移动时代的思维逻辑,避免掉入“超级应用陷阱”,不是只有10亿DAU的应用才叫成功。
可以说,李彦宏的发言挺激烈的。这似乎也是第一次有大佬在这么高级别的场合去把“百模大战”和大模型的发展摊开了说。
当然,秉持着类似观点的,也不只是李彦宏。
金沙江创投主管合伙人朱啸虎在6月的黑马大课上也提到,很多创业者盲目投资AI底层技术。虽然创造了“百模大战”的盛况,但也造成了社会资源浪费。
他强调,“很显然,AI创业的赚钱风向,已经彻底变了。”
怎么变?
除了李彦宏、朱啸虎之外,还有猎豹移动董事长兼CEO、猎户星空董事长傅盛,智谱AI COO张帆、百川智能创始人王小川等大佬在不同的场合也或多或少谈到了大模型行业竞争转变的方向,能最终达成共识的关键点在于“场景”和“应用”。
聚焦基础大模型的“卷”所导致的“百模大战”似乎该喊停了,大模型的重点还是得“卷”场景应用。
大佬们在这一点上达成了共识。今年以来,大家的口风都变了!
不要过度竞争基础大模型,该“卷”场景应用了
在过去一段时间内,美国涌向了大量专注于大模型应用开发的创业公司,如Adept、Stability.ai、Runway、BettrData、Tinybird、UnSkript等等。
同时,像OpenAI、Anthropic这样的大模型头部领军企业以及如谷歌、微软等科技巨头也在致力于利用开源模型或自主研发的基础模型,开发出各种应用场景的解决方案。
GPTs的推出以及OpenAI宣称的一系列给开发者让利的行为,都旨在吸引更多的创业团队参与到GPT技术的创新和应用中,从而丰富GPT生态系统,帮助OpenAI在接下来的时间内占据大模型领域在场景应用方向的优势。
以国外大模型行业的趋势来看,国内这些大佬们的口风转变并非空穴来风。
目前,百度文心一言的日均调用量已经超过5亿,而在两个月前百度官方才刚刚宣布文心一言的日调用量超过2亿。
期间2个月的时间,调用量就发生如此之大的变化,可见大模型要“卷”场景应用不仅仅是厂商们的推动,还有整个市场的需求已经摆上台面,呈现出爆发式增长趋势。
类似的信号也在阿里云的主场上释放。
在世界人工智能大会上,阿里云CTO周靖人公布了近期通义大模型和阿里云百炼平台的最新进展——近2个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。
谈及大模型,比起参数上的比较,现如今国内的大佬们似乎更愿意去告诉市场自家的大模型如何好用,有多少人用,接下来还能怎么用等等一系列与场景应用落地相关的事情。
而以朱啸虎为代表的投资者们也开始在应用层去寻找大模型的投资机会。
市场的风向变了,不仅仅只是大佬的口风在变。
“超级能干”的应用在哪?
“AI时代,‘超级能干’的应用比只看DAU的‘超级应用’更重要。”在世界人工智能大会上,李彦宏试图为接下来的大模型应用开发趋势下一个结论。
然而,“超级能干”的应用或许理解起来并不难,市场悬而未决的问题在于这样的应用是如何开发出来的,又是如何推向大众?
基于现阶段的行业表现,「智能相对论」认为有几点思考值得探究。
一、在“超级能干”的应用背后,大模型技术的迭代和适配是必要的。
行业的趋势大多殊途同归,大模型领域在今年以来掀起的MoE架构迭代趋势,则是代表了在技术方面大模型正为“卷”场景应用而作支撑。
如今,OpenAI的GPT-4、谷歌的Gemini、Mistral AI的Mistral、xAI的Grok-1、昆仑万维的天工AI、浪潮信息的源2.0-M32、通义千问团队发布的Qwen1.5-MoE-A2.7B等国内外大模型都采用了MoE架构。
MoE架构通过引入专家网络(Expert Networks)和门控机制(Gating Mechanism)实现了模型的稀疏化和模块化,在数据处理、算力资源调配、输出结果优化等方面都有相当不错的反馈。这为大模型的场景应用落地和推广提供了非常关键的技术支持。
比如,微软就提出了一个端到端的MoE训练和推理解决方案DeepSpeed-MoE,其通过深度优化MoE在并行训练中的通信,减少通信开销,实现了高效的模型并行。此外,DeepSpeed-MoE还提出了基于微调的专家排序机制,可以根据训练过程中专家的损失动态调整输入样本到专家的分配,提升效果。
二、“超级能干”的应用意味着一场更商业化的生态竞争。
技术没问题,但商业化路径不清晰仍然会在今天的市场面临崩盘。日前,微软官网更新了一条通知——“GPT Builder即将停用”。曾经掀起AI圈无数热议与高潮的GPTs似乎正在走向败局。
谁又能想起,当时GPTs概念横空出世的那场发布会还被外界形容为“OpenAI的iPhone时刻”。
OpenAI本意是想借助低门槛的技术能力以及全球开发者们共同打造出一批“超级能干”的应用,结果却因技术问题带来的体验瑕疵以及模糊不清的货币化政策,让GPTs这一概念的商业化路径始终走不通,最终只能“凉凉”。
“超级能干”的应用大多是建立在成熟的商业生态之上,或许全球的AI厂商都需要认清楚这一点。值得一提的,在大洋的彼岸,阿里云在2022年11月牵头发起的开源AI模型社区刚刚斩获2024 SAIL之星奖的魔搭ModelScope。
历经一年多的发展,魔搭社区已成为国内规模最大、最活跃的AI模型社区,汇聚5500多款优质模型和上千数据集,为超过560万开发者提供了模型及免费算力服务。或许,OpenAI没能走通的生态路径,在中国会有新的生机吧。
三、“超级能干”的应用必然萌芽于行业场景中。
朱啸虎送给大模型创业者的忠告,“不要迷信AI,聚焦尖刀场景尽快落地。”——场景是孵化“超级能干”应用的摇篮,然而更深入地来看,也不能只看场景,最终还得看用户反馈和价值呈现。
医疗、教育、金融、制造、交通、农业等等这些行业领域是大模型应用“高发”场景,但打造出来的智能体或解决方案究竟如何,“如人饮水,冷暖自知”罢了。
To B的项目看效率。在快递领域,目前通过大模型来帮助处理订单,就可以做到了“一张图、一句话寄快递”,不再需要其他繁琐的流程,时间从3分多钟缩短到19秒。而且90%以上的售后问题,也都由大模型来解决。——这样的效率提升,才称得上是“超级能干”。
To C的场景看用户。此前,在高峰期,百度的高考智能体每天要回答超过两百万个考生的问题。对于全国1000万的考生来说,这一比例是相当高的。——这样的用户数量,也算得是“超级能干”。
今天,大模型应用覆盖文本生成、数据处理、PPT制作、市场营销、客服售后、医疗诊断等各类通用的和垂直的场景。实际上,市场并不缺场景,而是缺乏能干、有效的应用,“卷”应用须在场景中找用户、找价值。
*本文图片均来源于网络