字节跳动放大招：三厘钱！

大模型行业迈向商业化的步伐不断提速，价格再次成为率先打破的门槛。

12月18日，在“火山引擎Force”大会上，字节跳动正式发布豆包视觉理解模型，为企业提供极具性价比的多模态大模型能力。

值得注意的是，在近期各家大厂纷纷加码视觉大模型的背景下，字节跳动再次率先把行业价格“打下来”。此次大会上，字节跳动方面宣布，豆包视觉理解模型每千tokens输入价格仅为3厘（0.003元），相较于市面同行价格下降85%，相当于，一元钱就可处理284张720P的图片。

“我们要爱具体的人，同样也要关注真实具体的商业需求。”大会上一位豆包项目产品负责人说。字节跳动方面表示，此次定价将有利于整个生态以更低成本推动AI技术普惠和应用发展。

豆包大模型迎来全面升级

继聊天大模型之后，视觉大模型成为今年以来各家大厂竞逐的热门赛道。

研究显示，人类接受的信息超过80%来自视觉。视觉理解将极大地拓展大模型的能力边界，同时也会降低人们与大模型交互的门槛，为大模型解锁更丰富的应用场景。

在此次“火山引擎Force”大会上，字节跳动宣布旗下豆包大模型迎来全面升级。其中，视觉相关的大模型成为焦点。此次大会上，豆包正式发布视觉理解模型。

据火山引擎总裁谭待介绍，豆包视觉理解模型不仅能精准识别视觉内容，还具备出色的理解和推理能力，可根据图像信息进行复杂的逻辑计算，完成分析图表、处理代码、解答学科问题等任务。此外，该模型还有着细腻的视觉描述和创作能力。

豆包战略研究负责人周昊表示：“豆包一直在努力，让用户的输入更快更方便。”为此，豆包产品非常注重多模态的输入和打磨，包括语音、视觉等能力，这些模型都已通过火山引擎开放给企业客户。记者注意到，此前，豆包视觉理解模型已经接入豆包App和PC端产品。

面向实际商业应用场景，此次豆包大模型有了多项值得关注的突破。

此次大会上，豆包3D生成模型首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用，可以高效完成智能训练、数据合成和数字资产制作，成为一套支持AIGC创作的物理世界仿真模拟器。

同时，豆包大模型多款产品也迎来重要更新：豆包通用模型pro已全面对齐GPT-4o，使用价格仅为后者的1/8；音乐模型从生成60秒的简单结构，升级到生成3分钟的完整作品；文生图模型2.1版本，更是在业界首次实现精准生成汉字和一句话P图的产品化能力，该模型已接入即梦AI和豆包App。

在视频创作领域，即梦Dreamina张楠表示，即梦希望成为“想象力世界”的相机，记录每个人的奇思妙想，帮助每个有想法的人轻松表达、自由创作。

大会正式宣告，2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版，豆包端到端实时语音模型也将很快上线，从而解锁多角色演绎、方言转换等新能力。

大模型应用加速落地

“豆包大模型虽然发布较晚，但一直在快速迭代进化，目前已成为国内最全面、技术最领先的大模型之一。”此次大会上，谭待如是说。

数据显示，截至12月中旬，豆包通用模型的日均tokens使用量已超过4万亿，较七个月前首次发布时增长了33倍。大模型应用正在向各行各业加速渗透。

据悉，豆包大模型已经与八成主流汽车品牌合作，并接入到多家手机、PC等智能终端，覆盖终端设备约3亿台，来自智能终端的豆包大模型调用量在半年时间内增长100倍。

与企业生产力相关的场景，豆包大模型也获得众多企业客户青睐。最近3个月，豆包大模型在信息处理场景的调用量增长39倍，客服与销售场景增长16倍，硬件终端场景增长13倍，AI工具场景增长9倍，学习教育等场景也有大幅增长。

谭待认为，豆包大模型市场份额的爆发，得益于火山引擎“更强模型、更低成本、更易落地”的发展理念，让AI成为每一家企业都能用得起、用得好的普惠科技。

值得注意的是，在公布豆包视觉理解模型超低定价的同时，火山引擎升级了火山方舟、扣子和HiAgent三款平台产品，帮助企业构建好自身的AI能力中心，高效开发AI应用。其中，火山方舟发布了大模型记忆方案，并推出prefixcache和sessioncacheAPI，降低延迟和成本。火山方舟还带来全域AI搜索，具备场景化搜索推荐一体化、企业私域信息整合等服务。

对于云计算与AI大模型的关系，字节跳动相关负责人表示，云原生是过去十年最重要的计算范式，大模型时代则推动着云计算的变革。火山引擎认为，下一个十年，计算范式应该从云原生进入到AI云原生的新时代。

此次大会上，基于AI云原生的理念，火山引擎推出了新一代计算、网络、存储和安全产品。

谭待说：“今年是大模型高速发展的一年。当你看到一列高速行驶的列车，最重要的事就是确保自己要登上这趟列车。通过AI云原生和豆包大模型家族，火山引擎希望帮助企业做好AI创新，驶向更美好的未来。”

世良情感网

上海证券报