大模型应用如何点燃?

钛媒体APP 2024-07-06 15:42:37

ChatGPT 还没有颠覆世界。

身处“第三次信息革命”,很多人被浓烈的FOMO(Fear of Missing Out)情绪裹挟。

业界的共识是,随着技术迭代曲线放缓、基础大模型赛道的竞争格局企稳,生成式AI市场的性质正在发生变化,更多的创新和价值创造正在向应用层汇聚。但目前的现状是,2C端入口难觅超级应用,2B端高附加值的闭环应用尚未规模化呈现。

从“百模大战”到“降价潮”,从“卷技术”到“卷价格”再到“卷应用”,真正可行的商业模式究竟几何——擅长回答问题的GPT们还无法给出答案。国内厂商蚂蚁、字节、腾讯以及初创企业已经在趟不同的路了。或许,他们的行动能带来未来的答案。

国内首款办事型AI生活管家“支付宝智能助理”

当AI进入“补贴互联网时代”

李开复说,美国人的“ChatGPT时刻”发生在17个月前,但中国用户却还在翘首以待属于自己的“中国式AI时刻”。

比“AI时刻”更早到来的是中国人熟稔的大模型“价格战”。6月,OpenAI发出封禁邮件选择“脱钩”,几乎所有国产大模型均表示要以降价或免费的方式兼容OpenAI。5月,字节跳动旗下云平台火山引擎宣布,其自研的豆包大模型正式对外提供服务,并给出大幅低于行业主流水平的定价。随后,阿里、百度、腾讯、讯飞等厂商纷纷跟随降价。

行业计价标准从以分计价发展到以厘计价。可以说,“百模大战”硝烟未净,国内大模型已从参数规模、性能指标“卷”到了token价格。AI快速进入了补贴互联网时代。

各大模型降价的目标很明确:吸引开发者,推动大规模应用落地。但有业内人士认为,当前的大模型价格战,表面上是在降低使用门槛,实际则是由于市场需求不足,企业不得已而为之。

在供给端,价格战的背后是当前大模型产品能力的逐渐趋同——这也并不是仅仅中国市场的问题,Scaling Law 是否还会持续有效最近受到热议也与此有关。

最典型的信号是GPT-5的一再跳票。OpenAI首席技术官Mira Murati近日透露,GPT-5有望在2025年底或2026年初推出,而市场此前的预测时间是2023年底或2024年夏季。

猎豹移动董事长兼CEO傅盛认为,目前大模型在性能上遭遇了提升瓶颈,各家难以拉开显著差距,于是降低成本、降低售价成为了当前各家公司的首要任务。

低价是优势,但不一定构成竞争力。只有真正能结合场景,把大模型用起来,才能疏通供需两端。

工作与娱乐:大模型应用的两个场景

中国大模型市场的竞争无疑非常激烈。但历史经验告诉我们,竞争是产品创新最重要的催化剂。

没有科技公司想错过这波AI应用浪潮,中国的大模型技术已经“卷”出了多种多样的创新应用。

一些互联网科技企业集体出动:支付宝开发出了智能助理,下拉支付宝帮你办事,简单方便,实用;百度已通过文心一言大模型调整搜索结果的传统信息,还发布了多个AI社交应用、AI绘画工具与医疗AI产品;微信推出了元宝小程序,实现AI搜索、文档总结和AI作图功能;科大讯飞除了“讯飞星火”聊天机器人,还推出了AI口语助手和多个提高效率的工具;商汤科技不仅发布了其大模型,还推出了生成式AI应用如“商量”和“秒画”。

创业公司同样积极入局,典型者如月之暗面(Moonshot AI)旗下国产大模型Kimi智能助手一度凭借200万字级的长上下文处理能力骤然走红。

总结目前中国市场上的大模型应用,可以大致分为娱乐场景下的对话工具和工作场景下的生产力工具。

前者如抖音“豆包”、微软“小冰”、微信“小微”,它们普遍具备聊天、陪伴、写作文案、翻译等多种功能。这类大模型应用富有情感和互动体验,可以满足用户的情感需求。

而生产力工具典型者如Kimi、百度飞桨(PaddlePaddle)以及各类智能客服机器人、写作助手、代码助手等等,它们往往聚焦于某一具体的生产力环节,通过工具的智能化帮助企业实现效率提升。

据了解,一些传统办公软件甚至已经可以支持写Java代码。没有专业IT团队的制造业工厂的员工可通过简单的培训学习,自主开发特定需求的应用程序。

同时,编程助手确实已成为大模型落地的重要场景。蚂蚁已经有一半员工用他们自己研发的代码大模型codefuse写代码,去年的支付宝“五福”项目开发里,程序员的工作效率提升了30%。腾讯云称,“AI代码助手对鹅厂整体研发效能的提升,超过20%。”

可以说,通用生产力工具和娱乐型对话代表着中国大模型应用发展的两个方向。生产力工具专注于提升企业效能和决策能力,推进各行业智能化变革;而娱乐型对话则致力于提升用户体验,通过互动和娱乐功能增加用户参与度。

这两条路径展示了大模型在不同领域的应用潜力。虽然未来的商业化前景还是未知数,但庞大的用户规模和既有的场景能力,意味着巨大的增长潜力。

专业智能体,中国大模型的下一步

如果我们将观察大模型的视野向深处探究,中国的智能体未来将走向何方?

在笔者看来,智能体的生命力在于应用,而应用的核心在于能否真正解决用户的问题。

沿着这一逻辑,在既有的工作和娱乐之外,大模型还有另外一个应用场景的增量,那就是垂直领域专业服务。越是复杂的问题,越是专业的领域,越能孕育出更具价值的智能体。最典型者如医疗、金融等行业。

中国蓬勃发展的移动互联网为大模型行业提供了丰富而复杂的应用场景,以医疗和金融为代表的高专业度、高壁垒行业,虽然已经初步实现数字化或线上化,但在大模型时代,谁能深刻改造这些场景,破解更复杂的问题,谁就能抓住发展的先机。

在2024年世界人工智能大会上,蚂蚁集团一连对外展示了三个“AI管家”,分别对应金融、医疗和生活场景。在这些场景下,智能体为用户提供的都是专业服务——不是简单的聊天式对话,而是要在对话交互之后配合理财分析、辅助诊疗、消费预定等一系列服务。

蚂蚁集团董事长兼CEO井贤栋在世界人工智能大会上提出“专业智能体”概念,“从我们的实践来看,专业智能体是大模型落地严谨产业的最佳路径。”

蚂蚁集团的最新动作,也代表了中国大模型产业发展的一个面向。

蚂蚁集团大模型应用总经理顾进杰向钛媒体App进一步阐释了“专业智能体”。所谓“专业”,即指向那些更需严谨的产业,需要在相当程度上确保服务的准确性和可靠性。

业界普遍认为,通用大模型落地严谨产业,面临着三个“能力短板”:领域知识相对缺乏、复杂决策难以胜任,以及对话交互不等于有效协同。

这几点得到顾进杰的认同。他提到,以医疗行业为例,医疗行业的大量知识并没有在互联网上呈现,甚至很多都是医生经验性的认知积累。行业内擅长复杂推理的专家,其最具价值的思维框架、思维模式远未形成文档化或者数字化。

更进一步地说,单纯的对话形态产品一定解决不了全部问题——比如,问答可以实现医疗问诊,但是不能帮你挂号、帮你回复药品相关问题以及帮你复诊。

为了解决这些问题,蚂蚁集团采取了多层次的策略。

以医疗行业为例,蚂蚁做的第一件事,就是强化大模型的专业认知。基于蚂蚁百灵大模型开发的支付宝医疗大模型 ,背后是支付宝与合作机构构建的全国权威医学专业教材医疗知识图谱;蚂蚁和上海市一医院联合打造Al就医助理,背后是上海市一医院自建的“服务与病例知识库”。

这些垂直领域不同类型的数据,进而被抽象成不涉及隐私信息的领域知识,“合成〞为大模型的“专业教材〞。

在处理复杂决策方面,蚂蚁的大模型方案中引入了“专家级决策框架(FoE)”——即通过一种框架机制,让AI的决策机制线性化、流程化,让AI在某一专业领域模仿人类专家的思维方式进行决策。例如,医疗管家“安诊儿”不仅能解答问诊问题,还能提供精细的治疗建议。智能金融管家则通过综合分析市场和风险,为用户提供个性化的投资方案。

顾进杰还提到,“RAG(检索增强生成,可以在一定程度上克制幻觉)在严谨行业下不能完全解决问题,RAG实际上也会引入其他类型的幻觉错误”。在蚂蚁看来,单一大模型无法解决全部问题。专业智能体的进步,还需要更多行业专家、生态伙伴的参与,全行业的协作,可以有效提升智能体的“专业性”。

第二个层次的工作,是让智能体的能力更具综合性。蚂蚁的策略是多智能体协作。专业智能体不仅要在单一领域表现出色,还可以覆盖用户的多种需求。比如,在医疗场景中,用户可以通过“安诊儿”帮助病情诊断,并由“生活管家”安排就医相关交通和住宿。对用户而言,这些交互都可以在支付宝App内完成,支付宝App也由此从移动互联网入口升级为智能AI入口。

如果将大模型时代与移动互联网时代相比照,在移动互联时代,APP、小程序是应用的关键载体;大模型时代,智能体则成为新的应用范式,聚焦严谨领域的“专业智能体”是中国智能体的新方向所在。

在今年的世界人工智能大会(WAIC)上,专业智能体和它背后的相关技术也受到了广泛关注和认可。支付宝针对生活场景开发的支付宝智能助理入选八大“镇馆之宝”,而蚂蚁与浙江大学合作开发的用于提升AI在严谨产业中的认知、推理和决策能力的“ 智能认知决策技术与平台”也获得了2024WAIC的SAIL(卓越人工智能奖)TOP30。

在井贤栋看来,通过专业智能体的深度连接,Al会像互联网一样,带来服务的代际升级。

尽管在中国,关于大模型的商业模式的讨论尚显早期,但智能体,尤其是专业智能体,蕴藏着巨大的潜力。通过“专业智能体”实现各领域的深入应用,解决用户的实际问题,这是大模型的中国机遇,超大市场规模和海量需求,也会释放专业智能体的商业价值。(本文首发于钛媒体APP,作者|蔡鹏程,编辑|刘洋雪)

0 阅读:10

钛媒体APP

简介:中国财经科技信息服务提供商。