来源:大厂风云
据传,百度文心大模型 4.0参数规模将大于市面上所有已经公开发布参数规模的大语言模型,预计将突破万亿级别。
大语言模型快速迭代的同时,距离收费还有多远?
从门户时代开始,互联网创业者们就习惯了资本驱动的商业模式,之后资本驱动逐渐转变为市场驱动,互联网公司逐渐有了自主造血的“根”,成功者如BAT成为新时代的代表,失败者则湮灭于历史,被逐渐淡忘。
当前国内的大模型参与者既有新一代创业者,也有科技巨头,前者依然是资本驱动,后者则是资本驱动与市场驱动的中间体“母业驱动”,其实依然是资本驱动,只不过出钱的不是外部资本,而是内部资本。
正如互联网的发展路径,大模型作为新兴技术,面向B端和C端的技术创新变现都是必经之路。
一方面,训练和运行大型深度学习模型需要大量的计算资源,包括强大的服务器、大规模的数据集和高效的算法。这些资源的成本是巨大的,需要由提供模型的公司或组织承担。如果不收费,这些成本可能无法覆盖,导致可持续性问题。
以百度的文心一言为例,文心4.0对标GPT4,能力(综合模型能力)将有明显提升,包括推理、逻辑等多方面性能大幅提升,同时文心4.0的参数量,训练所用数据量,推理成本等都将比3.5高一个数量级,推理成本预计是文心大模型3.5版本的8-10倍。
另一方面,大模型公司不是纯粹的科研机构,它们研发大模型的动力就是通过市场获利,支持大模型的资本也需要回报,如果大模型无法成功转变为市场驱动,那么它的资本驱动力也会逐渐消失,依然会出现可持续性问题。
收费势在必行,实际上,海外大模型已经走在了收费的路上。
继 ChatGPT 企业版、Claude2 专业版之后,全球顶级图像处理公司 Adobe 宣布其生成式 AI 产品 Firefly 于9 月 14 日正式推出商业版;9月21日,微软在秋季发布会上推出了全新的Copilot平台,打造“杀手级”应用。
海外大模型收费如火如荼,国内是否会坚持免费到几时?
笔者认为,影响国内大模型收费节点的主要因素有两个,一个是政策和商业环境,一个是产品成熟度。
在政策环境上,《生成式人工智能服务管理暂行办法》于 8 月 15 日正式实施,这是中国大模型公司通过备案的关键节点,备案后的大模型可直接面向社会公众提供服务,这为大模型的普及应用提供了加速度,直接面向个人消费者的产品会变得更成熟稳定。
从市场环境上看,中文大模型处于神仙打架的阶段,百度的文心一言、阿里的通义千问、腾讯的混元、科大讯飞的星火、华为的盘古、字节的豆包......各方你追我赶、暗暗较量,在这一阶段坚持免费,对于用户来说是一个很大的吸引力。
总的来说:从政策环境上看,大模型收费已经具备基础,但市场环境比政策环境更加复杂,未来很长一段时间的大模型可能会出现免费与收费双轨并行的局面。
民间有一句话“免费的永远是最贵的。”这句话虽然不完全适用于大模型,但起码提醒了我们:收费的才能变成更好的。
谁会打响收费第一枪?核心还是看谁的产品更加成熟,海外大模型能实现收费的一个原因也是产品相对更成熟。
这不能怪国内的大模型企业不努力,一方面海外大模型如ChatGPT的确有一定的先发优势;另一方面英语语法结构较为简单,这使得英语在一些自然语言任务上比中文更容易被处理和理解;而中文通常一个词汇可以表达多种含义,语言组成较为灵活,中文还有着深厚的文化内涵,具有丰富的语境意义,这极大增加了语言的歧义性和处理难度。
两种语言的特性意味着:中文大模型发展的难度更大,所消耗的内存和计算资源更多,所需要的成本更大。
相较于英文,中文大模型可能需要更多的中文语言数据来训练,这可能导致数据采集和处理成本上升。同时,中文文本的复杂性和多样性也可能需要更多的数据来获得高质量的模型。以上因素也增加了中文模型应用和维护的难度。对开发大模型的公司来说,做中文大模型由于需要额外的资源,或许要承担更大的成本。
也正是由于中文大模型的特殊性,互联网时代无往而不利的免费战法可能会在大模型身上失灵。
“羊毛出在狗身上,由猪买单。”这短短的几个字诠释了互联网巨头们流量变现的本质,但大模型的产品特性与传统互联网产品不同。大模型收费意味着需要厂商努力提供更有竞争力的产品。这对于本就竞争激烈的大模型行业来说是一个更大的刺激,会促使各家公司不断提升模型质量和性能,以争夺用户,率先收费的大模型极有可能出现强者更强的局面。
另一方面,大模型的工具属性更强,目标受众是企业、研究机构和专业用户,这些注定了大模型未来就像是设计师在PC上特需的昂贵显卡一样,会直接向使用者收费,而不是PC上靠广告赚钱的软件。用户的刚需是产品好不好,而不是免费。
综上,大模型必然、也必将面向它的直接使用者收费,至于谁敢打出国内收费的第一枪,让我们看看谁的产品更加成熟吧。
事做得不怎么样,就开始为收费造势了。