从这场智能客服魔法对抗赛上,我看到了AGI落地的正确姿势

极客公园 2024-09-26 12:25:47

刚刚落幕的云栖大会百炼杯「智能好客服」PK 赛现场,上演了一场智能客服领域的「魔法对抗」。

比赛规则很简单,8 支参赛企业赛前卷算法,现场看效果,主办方阿里云提供模型开发平台百炼,选手用各自的解题思路去构建「智能好客服」而好的标准便是把个色人格的消费者都接待满意。

不过,主办方派出的聊天客户,却并非真人。而是同样通过百炼刻意为了「刁难」参赛队伍打造的不同人设 agent:其中,既有讲话错别字连篇还不会网购的阿姨;也有正在气头上的暴躁都市丽人。

只有魔法,才能打败魔法。参赛企业的应对,也堪称教科书级别。

比如冠军云梦科技,靠着一群技术宅团队做出了能应对暴躁都市丽人的 agent。面对买家沟通时的情绪波动,不仅能连续妥善识别应对,甚至还能分清「黄二白」「混油皮」这样的专业美妆术语,并根据买家对产品的特定需求,迅速推荐适合的产品,最后,还能在眼花缭乱的促销活动中,给出用户精准无误的解释。

获得了此次比赛亚军的合力亿捷,则派出了刚进入公司的职场新人,培训了两天不到,就直接通过阿里云百炼平台,让 Agent 就完成了三版迭代,回答的有效性从 80% 提升至 96%。

更「激进」的,是最佳创意奖得主企业云蝠智能,干脆放弃程序员参与,直接派来了公司的财务迎战「退休老大妈」agent,全程负责这次比赛的应用开发。而在此之前,这位财务,仅仅接受了 20 分钟的大模型与提示词培训。

当然,智能客服只是大模型发挥作用的经典场景之一;以此为切口,大赛主办方阿里云试图传达的更深层次意图在于:

大模型,已经真正进入卷应用的时代。

01 为什么是智能客服

关于这场挑战赛,很多人的都有一个疑问,大模型明明有很多炫酷的应用,比如自动驾驶,比如生物制药,为什么要选择智能客服这么一个看起来一点也不性感的方向?

一个基础的行业共识是,大模型应用爆发时代已经来临,每种生意都值得在大模型时代重做一遍。但每种生意的门槛与成本收益比却不尽相同。

图片来源:阿里云

毫无疑问,智能客服会是大模型落地持久战中,一个成本低、收益高的重要赛道,而它的落地场景,也渗透到了日常生活的方方面面。

一方面,智能客服是大模型长文本、多轮对话能力最直接的应用。

另一方面,智能客服背后潜藏的,是一个商业化潜力巨大蓝海市场。IDC 报告《中国智能客服市场份额,2023 :新旧交替,增长可期》中显示,2023 年中国智能客服市场规模已达到 30.8 亿人民币,较上一年增长近 37%。

更重要的是,智能客服场景往往非常垂直,想要进入这个行业,只需要开源模型微调;但想要做好这个行业,在各行各业累积起的独家数据优势则是必不可少的一环。

也是因此,在现实中,面对智能客服机械式的问答,80% 的用户都会选择转接人工。

就以常见的买衣服来说,客服进行推荐时,往往需要用户的身高体重数据,但大部分用户并不能给出一个精准回答,而且有人习惯用公斤有人习惯用斤,有人统计身高数据用厘米,有人用米,三围数据上,更是有人有厘米,有人用尺……

这就需要模型不仅能精准理解用户需求,对用户给出的数据进行统一的单位转化,也需要能够根据判断出的用户需求,做出精准的款式与尺码推荐。

而一旦涉及到更复杂情况,比如用户讲话方言、用户情绪波动、多轮对话,以及用户随时的打断,那么,如何正确理解用户的讲话内容、保证用户的体验,就成了摆在眼前的拦路虎。这中间不仅比拼模型的技术能力,更考验对场景的理解以及对用户需求的精准洞察。

未来的市场很大,眼前的问题也不小,那如何弥合这种技术到落地之间的鸿沟?

这届百炼杯企业级 AI 应用开发挑战赛,百炼平台与浩鲸科技、亚信科技、合力亿捷、贝斯平、云梦智能、汇智智能、煜象科技、云蝠智能在内的 8 家行业知名独立开发商一同,为智能客服落地打了个样。

02 HR 也能做大模型应用,百炼凭什么?

与移动互联网时代,技术成熟与行业爆发之间需要漫长的等待期不同;大模型产业自 OpenAI 正式推出 ChatGPT 的那一天起,商业化就被按下了加速键。

短短两年时间,AI 绘画,AI 陪伴,AI 文案,就以摧枯拉朽之势将无数行业的格局与工作流颠覆,下游应用的爆发,更远远超出了所有人的预期:

数据显示,2030 年中国 AGI 应用市场规模将达到 4543.6 亿元人民币,更为重要的是,AGI 的应用市场还处在加速增长阶段:截至 2024 年 6 月 15 日,中国大模型市场共计发布中标公告 230 个,远超 2023 年全年的 190 个。

在一片蓬勃爆发的广阔蓝海,谁抓住了最多的开发者,谁就拿到了通往未来的门票。

图片来源:视觉中国

而如何培养更多的开发者,则需要一个门槛足够低,低到公司财务与HR也能动手开发的大模型应用开发平台。

2023 年 10 月,阿里云发布了大模型应用服务平台——百炼。通过集成通义以及上百款三方和垂直领域模型 API,并配套相应的开发工具,百炼可以让即使没有模型自研能力的中小企业开发者,也能以「拖拉拽」式的开发方式,在 5 分钟内创建自己的专属 AI 应用。

其中,底层算力上,百炼依托阿里云,可以支持千亿级模型的万级并发推理需求;让开发者把精力更多放在数据、业务、场景创新上。

而在生态侧,上百款大模型 API 接入之外,百炼同时还提供全链路模型服务和丰富的工具箱,并针对不同客户需求,推出了三种不同的大模型应用方式:

针对定制化需求较低,主打「开箱即用」的企业,百炼可以提供通义、Llama、ChatGLM 等在内上百款大模型 API,同时提供百川等系列三方模型的托管服务。

针对有一定定制化需求的微调型用户,百炼则提供从数据管理、模型调优、评测到部署的全链路模型服务。不仅让用户找到最合适的模型,同时让用户的算力支出,实现弹性调用,整个训练过程可视化。

而针对那些想要打造自身 RAG 应用的企业,百炼则提供 Assistant API,用户可在百炼上轻松创建知识库,并一键开启 RAG 应用,通过 Assistant API 联合输出。

不仅是针对不同开发水平的客户给出不同的开发模式;针对特定场景,百炼也推出了不同的落地扶持思路。

就比如针对此次比赛选定的客服场景,往往单一的大模型并不能很好的解决用户意图识别等问题。百炼平台通过提供完整的全链路模型工具,开源、闭源等多种模型选择,参赛者可以自由的选择不同的模型与工具进行组合搭配,以及大模型与小模型的联动,从而集多模型之所长,来更好的回答用户产生的问题。

再比如,应答客服场景中经常出现的专业知识,仅仅依靠模型以及开源数据,无法对做出精准回答,百炼则提供了集成 prompt 优化工具、流程管理工作流、插件等能力,开发者可以通过借助 RAG 搭建专属领域的知识库,来很好解决大模型的「专业知识短板」。

此外,通过高性能的模型调用服务、完整的应用创建流程、支持使用开放架构创建智能体应用,百炼更是做到了零门槛上手,财务也能开发大模型应用。

门槛降下来了,用户规模自然也就涨上去了。

根据云栖大会的最新消息,当前百炼平台服务客户数已达 30 万,其中,付费客户数较上一个季度增长超过 200%。大批开发者放弃私有化部署,直接在百炼上使用与微调各类 AI 大模型,构建自己的大模型应用。迄今为止,百炼已经成为当前市场排名第一的大模型应用服务平台。

03 技术到落地,仍需千锤百炼

不难看出,相比单纯讲述参数堆砌,打榜卷模型,本次比赛更多聚焦到了那些国内最早真正尝试 AI 应用到各行各业的人,以及为企业提供软件定制开发的 ISV 在各行各业深耕探索的开发者,甚至是对技术一无所知的行业一线员工。解决他们大模型落地过程中的开发上手难,产品用户体验等细节问题。

而这也是阿里云今年对外传达出的重要信号:深入产业,才是现下大模型产业最重要的关键词。

事实上,在大模型落地中,类似智能客服的尺码不统一、用户说方言、产品专业壁垒高深这样的问题并非孤例。

如何从上千页的产品说明中找到工程师需要的那一页,如何让财务轻松处理厚厚的票据,用户到底需要精准的正确还是模糊的可能性组合……都是摆在眼前,一个又一个具体而琐碎的问题。

而阿里云的答案是从技术中来,到落地中去,做大模型、做云服务、投资、做 MaaS、办比赛,做标杆,也做基础设施,把自己卷成国内大模型产业链中最努力也最全能的公司,从传统的云计算厂商一步步升级成为大模型时代的基础设施。

一直坚持下去,不只是因为大模型前路似锦,蓝海广阔;更是因为通往未来的路,就是一步步,一点点从解决怎么搭建客服 RAG 这样的小问题中摸索着走出来的。

真正的落地,从来都是一路咬着牙千锤百炼。

*头图来源:阿里云

0 阅读:4

极客公园

简介:极客公园是一个关注互联网创新的社区。