我曾经在一篇文章里提到,京东要实现“消费者需要的低价”,不但要有“硬功夫”,还要有“巧功夫”。
例如,京东正在利用产业大言犀模型的力量,找准小切口,在多个环节充分的降本增效。
至关重要的是,在目前大模型的落地应用还是一个待解的难题的当下,融合在京东业务里的AI却屡屡能够找到应用的突破口。
虽然不是每一个AI技能点的提升,都可以直接转化为成本的下降,但无数个优化点的改善,使得京东在降低成本同时保证了服务效率和体验。
而目标明确的产业AI,正是“真低价”的京东手中的有力武器。
——笔者按
01山在那里著名的登山家马洛里曾经有一句旷世名言。
在那个还没有人登顶珠穆朗玛峰的日子里,有一个记者问他,攀登珠峰的目的是什么?
马洛里的回答是:Because it’s there.(译为:因为山就在那儿)
在笔者看来,京东产业AI能够迅速的发展,并在帮助企业降本增效方面取得一系列进展,正是因为有Because it’s there式的价值观。
也就是说,他们充分坚持痛点导向,问题在哪里,他们就在哪里。
此前,京东科技成立智能服务业务部,这可能是京东第一个在“智能”之后加上“服务”两个字的部门,其指向已经非常精确,就是利用AI等技术来提高服务水平,提升用户体验。
这本身是一件非常难以做到的事情,但京东在两个维度上找到了自己的突破口。
第一个是找到了用力的方向。
就在这两天,笔者与京东云AI相关负责人进行了一次交流:“两年前第一次和你交流的时候,你刚接手京东云的AI部门,那时候你说你管几百人。现在,京东AI在智能服务方面进展这么大,你的部门是不是人数翻了好几番?”
他的回答是:“不是,我们部门还是几百人。”
他的解释是:“AI其实不是一个堆人力的部门, openAI在发布GPT3.5的时候,也只有100多人。依赖于产业大模型的横向拓展能力,言犀每开辟一个新的方向,其实只用增加几个算法的核心人才就可以,这就是AI的魅力。”
第二个是找到了AI真正的价值。
近期,是一个行业密集发布大模型和模型即服务(MaaS)的爆发期,但绝大部分企业都没有公布自己的营收目标。而这位负责人明确的告诉我,部门这两年来,除了服务内部客户,对外的营收一直在正增长,也就是说,他们不仅养活了自己,还在为京东赚钱。
这从另一个维度证明了京东的AI能力,因为让企业去尝试一下AI很容易,但目前这个阶段,愿意真金白银花钱买单的企业仍然相对较少。
也就是说,京东的AI能力经过了反复的打磨,他们的技术能力其实完全达到了商业级交付的水平,并能够为企业提供扎实的价值,这和许多大模型仍然处于实验室阶段,是完全不同的。
02赢在细节任何业务的成功,都体现在是否遵循了符合自身规律的第一性原则。
比如特斯拉,在推动电动汽车的时候,远远没有今天如此发达的供应链,也没有一套现成的规律可以摸索。
但他们就是选择了自主建厂、自行研发电池系统、拿掉激光雷达……换言之,特斯拉成长背后遵循的第一性原理,就是用技术升级降低产品成本,将产品卖给更多人,获得更多利润,继续投入技术研发。
而在笔者看来,京东在技术领域的第一性原则就是问题导向、痛点导向, 跳出纯技术、纯学术的固有思维,针对现存复杂场景里的普遍性痛点问题,用技术升级降低企业、品牌的运营、营销、服务成本,探索本质,思考解决之道。
比如用于直播的数字人,以前大部分企业宣传的都是逼真度、对真人的替代度、数字人生成的速度等等,但言犀团队选择的优化方向有所不同,比如“局部高清”和“需求分层”。
如果你使用过数字人,你可能才会知道,数字人使用的账单中,很大一部分是来自于带宽,因为视频所需要的带宽远远高于文字和语音。
如果是其它的企业,可能直接把成本转递给应用方,但京东云多想了一层,他们考虑的问题是——如果能够降低数字人的成本,就会有更多的人来用,只有累计一定的用户数量级别,才能体现为“降本增效”。
因此,在使用数字人方面,言犀提供给了用户更多选择。
一个较为通用的维度是,可以选择数字人的精细度和画质,类似于你在看视频方面选择“高清”还是“流畅”,而另一个维度,一般人都想不到。
“可能你自己不会发现,你看数字人直播的时候,你其实重点看的只有几个地方,一个是数字人的五官,包括眼睛、嘴巴;另一个就是数字人展示商品的时候,你会重点看数字人的手和手里拿的商品“,该负责人说:”所以我们选择了一个技术方向,叫做‘动态局部高清’,也就是用户的注意力、关注点集中的地方,进一步提升清晰度,而对其它地方稍微弱化,这样能做好到更好的综合性体验和带宽成本的平衡。
听起来很简单,但如果没有言犀产业大模型的加持,传统的直播技术是很难做到这样既动态又优化局部的,这需要专门的算法,而言犀团队就是磕下了这个算法。
“关键是这个技术,可以真正降低用户部署成本,这至关重要”,他很坚定的告诉笔者:“如果这个技术吸引了用户使用数字人技术,客户的直播成本会降到此前的十分之一甚至更多,这样最终会传导到商品的价格上,也就是对低价做了贡献。”
这样接地气的巧思,在笔者看到的大企业的AI实践中,是不多见的。
我一直认为京东是一家在小处也能见真章的企业。物流小哥坚持送货上门是看得到的,看不到的是他们为了降低用户使用成本,甚至会关注到机房的物理布局这种“题外话”。
该技术负责人指出,“大模型训练过程中为了效率,为了时间需要并行,每一个微秒都很重要。” 在重庆超算中心,他们把服务器和服务器之间物理的距离都优化了,“导线的传输是按光速,比光速慢一点,实际上是要损耗的。但是即便这样,按光速来算,每短一厘米,可以算一下,乘以万亿级的数字,就是海量的数字。”
京东云言犀团队在语音技术、智能对话方面的技术,也是世界级的。此前笔者曾谈到过,他们团队曾经获得过中国AI的最高奖——吴文俊奖,而他们获奖的项目就是——任务型对话。
而目前,京东云言犀团队把任务型对话发展到了一个新的高度,其中的一个非常有魅力的技术点,被拟称为“声音供应链”。
我们都知道,LLM是通过学习大量的文本数据,来预测下一个词或下一段话的可能性,从而使计算机能够更好地理解和生成人类语言。
对于用户意图的理解或预测,简单说就是”听懂人话,猜出意思“。例如,用户咨询“能刷公交卡的手机”,智能客服就能理解用户是需要“支持NFC功能”等商品属性,抓取相关商品直接推荐给消费者,提高准确应答率。
但“猜出意思”只是第一步,而“声音供应链“,则源自于一个名为”基于多颗粒度韵律的增强语音合成技术“,也就是从篇章、句子、字词的不同粒度,准确把握用户的情绪,对应的提高合成语音的韵律丰富度和可控性。
而“声音供应链”,顾名思义就是根据不同的场景提供不同的声音。
“这就需要从开始供应声音最基础的元素上进行规范,制定标准,后面技术进行相应的适配,使得技术能够把不同的声音体现出来,进而自动生成、自动适配”。不同场景需要不同的声音和情感。例如,在解决售后问题的时候,要谦虚、和善;在营销服务的时候,要激情澎湃、充满感染力,促进用户下单,而这些还要根据实际场景灵活切换。
该负责人告诉我,团队为此投入了大量的精力,他们把时间花在商家的直播间里,持续观察直播的情况,从感性上了解声音的不同特性,从生成语音的算法上持续迭代,根据用户反馈持续创新,“最后,使得我们的语音真正做到商家非常满意,终端用户、购买者也确实被声音感染和打动了”。
“这体现在直播转化率等指标的提升,国台酒业的数字人采用了这个技术,发现在GMV、转化率上都有提升。其中,转化率最高的能达到40%,在碎片化时间里,我们投入(技术所产生)的ROI高达69%,说明这个技术确确实实体现在了实实在在的生产力、实实在在的GMV”。
当然,只有声音还是不够的,隐藏在背后的,还有针对对话内容的生成,言犀团队使用了基于知识融合的预训练语言模型和多模态可控对话文本生成模型,从而提升生成文本的专业度、丰富度。
“可以说,AIGC这个概念对我们一点儿也不陌生,我们早就应用起来了“,该负责人说:”比如伊利集团签约了明星代言人,我们则通过抽取声音特征完美复刻了她的语音,再结合生成式技术,变成营销亮点。比如,你可能接到一个电话,里面是她‘亲口’对你介绍伊利的商品,用户非常欢迎这样的技术。“
0330%的独有数据,意味着什么?在中国诸多的大模型玩家中,京东可以说是独一档。
一般来讲,大模型的分级,是按照通用大模型—垂类大模型—领域大模型来逐渐细分的,越到后面针对性越强、解决的问题更集中、具体,但通用性越差。
但言犀大模型并不是按这个标准来划分的。从体量来说,言犀的参数超过1000亿,达到了主流通用大模型的标准,但京东从未称之为通用大模型。京东认为,言犀定义是产业级大模型,即从京东所从事的真实场景如电商、物流、供应链、健康等中生长出来的大模型,这是一个与众不同的概念,但更准确。
一般来说,通用大模型是先有通用能力,再训练垂类能力,而京东与众不同,他们的产业级大模型,是自下而上,从真实业务中“自己长出来的”,即根植于真实世界的具体任务产生的数据集进行训练。
这就必须从更深一层次说起,大模型的能力,都是预训练数据“喂”出来的,但事实上,绝大多数大模型企业并没有真实产业基础,它们的训练数据集都是买来的,或者开源的通用数据集。
换句话说,如果没有企业选择为这些大模型企业打开大门,它们就永远拿不到真实世界的数据,它们的大模型能力就永远止步于实验室阶段。
然而京东没有这样的烦恼,因为作为一个庞大的新型实体企业,它有极好的数据优势。或者说,京东本身就是一个庞大的数据宝藏。
在这样的背景下,京东提出了“70%的数据来自于通用数据,30%的数据来自于京东独有的产业原生数据”的提法,其所具备的条件在国内也只有区区几个企业可堪对比。
而京东产业AI发展的理念,我们在前文中也多次谈及,那就是用”剥洋葱“式的方法,把实际问题拆解成一个个更小的单元,然后创造性的解决工程问题,创造性的应用于实践,从小变大,先扎根再生长。
这也是为什么我们预测,仅仅是AI赋能,就将对京东的“低价策略”,和低价策略背后的降本增效,起到至关重要的作用,因为他们找到了场景里那些普遍的痛点,找到了那个撬动降本增效的支点。
也许你会觉得, AI赋能很难量化。这也许的确存在,但并非无法统计。例如,我们说的获得吴文俊奖的“任务型对话”,就产生直接经济价值20亿元,并带来了3000亿元的潜在市场空间增量。而多模态大模型的产物——言犀虚拟主播也为4000家品牌创造了超10亿的GMV。
这个数字还在持续增加,自10月23日京东11.11开启以来,京东云智能客服已经承接了超10亿次消费者的应答,言犀虚拟主播也已带动商家成交额较去年11.11增长230%。
解决真实问题,降本增效服务于低价,只是战略。
我们更关心的,是京东的“在真实产业里生长AI”的格局。这体现了一种基于服务产业、创造社会价值的务实态度,也意味京东能够把AI能力和战略、战术能力很好的结合起来。
而这或许值得所有的电商企业和所有的大模型企业去思考。