百度官宣3月16日发布文心大模型4.5

TechWeb 2025-04-03 11:40:50

中美大模型争霸进入新周期!

昨日,美媒路透社爆料百度将在3月中下旬发布文心大模型4.5。

今天凌晨,OpenAI发布最新模型GPT-4.5。这款史上最贵模型让不少用户“望洋兴叹”。

紧接着在今天下午,百度重磅官宣:3月16日发布文心大模型4.5,具备原生多模态、深度思考等能力,并计划于6月正式开源!

继DeepSeek-R1后,百度文心大模型4.5备受国内大模型圈的期待,这期间,中美大模型竞争攻守之势已然发生转变。

OpenAI的这次发布略显仓促,OpenAI前员工安德烈·卡帕西提前体验了GPT-4.5。他认为,GPT-4.5主要提升在于非推理密集型任务上的改进,这些任务多与情商有关,而在数学、代码等领域,GPT-4.5并不拥有最强的能力。

GPT-4.5被仓促推出的背后,来自中国大模型竞争加剧的压力可能是重要原因。

今年春节期间DeepSeek凭借低成本、高性能的开源大模型爆火,引发大模型行业震动。国内大模型领域的重要力量,百度也宣布开源、免费。OpenAI CEO山姆·奥特曼直呼,在开源AI软件方面“OpenAI站在历史的错误一边”,焦虑感溢于言表。

以DeepSeek、百度文心为代表的中国大模型厂商,通过优化成本、提高效果,吹响了全面超越美国大模型的号角。

接连开源、免费,百度开放动作不断

根据百度官方介绍,即将于3月16日发布的文心大模型4.5是百度最强的下一代大模型,在基础模型能力上有大幅提升,且具备原生多模态、深度思考等能力。更重要的是,这款最强大模型计划于6月30日正式开源。

自春节以来,百度大模型策略可谓全面转向开放,接连宣布免费、开源。

百度智能云早在2月3日春节假期就宣布开放,DeepSeek-R1及DeepSeek-V3两款效果领先的大模型已上架至千帆ModelBuilder平台,随即,百度智能云正式推出千帆DeepSeek一体机,同时百度百舸基于昆仑芯P800,发布部署 “满血版DeepSeek R1+联网搜索” 服务。

大模型产品端,2月13日,文心一言在官网宣布将于4月1日0时起全面免费,所有PC端和App端用户均可体验文心系列最新模型,以及超长文档处理、专业检索增强、高级AI绘画、多语种对话等功能。

同时,文心大模型深度搜索功能于2月13日上线,具备更强大的思考规划和工具调用能力,可为用户提供专家级内容回复,并处理多场景任务,实现多模态输入与输出。这一功能在4月1日起也将免费供文心一言用户使用。

2月16日晚间,百度搜索宣布将全面接入DeepSeek和文心大模型最新的深度搜索功能,同日,百度文心智能体平台宣布接入DeepSeek。

2月18日,在百度2024年Q4及全年财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,文心大模型4.5将开源,开源4.5系列的决策源自于对技术领先地位的坚定信心,开源将进一步促进文心大模型的广泛应用,并在更多场景中扩大其影响力。

百度这一系列组合拳打下来,直接将大模型行业拉进入“免费+开源”的新阶段,无疑将助推大模型应用爆发,也让自己在这场以“应用落地”为主题的大模型的第二场竞赛中占据主动权。

成本更低、效果更好国产大模型赶超美国提速

事实上,如同李彦宏所言,开源,是对技术领先的坚定信心。这种领先,将在成本更低、效果更好两方面击穿美国大模型的优势。

OpenAI今天刚刚发布的GPT-4.5,是其史上参数规模最大的模型,其计算量是上一代的10倍。也是最贵的模型,GPT-4.5的API价格为每百万Tokens 75美元,相较GPT-4o上涨30倍。

性能上,尽管GPT4.5更具情商,但是GPT-4.5不具备推理能力,也不能完全替代GPT-4o。其创始人Sam Altman表示,GPT-4.5没有“碾压基准测试”。评估AI模型解决现实世界软件问题的能力的基准测试SWE-Bench Verified中,GPT-4.5能力超过GPT-4o,但是低于o1、o3-mini。

整体看来,GPT-4.5表现差强人意,高昂的费用也让用户直呼“用不起”。

国内大模型训练路线则完全不同。

DeepSeek就以低成本、高性能出圈。百度也一直在强调低成本的重要性。

在24年初的财报电话会上,李彦宏曾经透露,自发布以来,百度不断降低文心大模型的推理成本,已降低至一年前的1%。

不久前,李彦宏在迪拜AI峰会上表示,随着文心大模型的迭代升级,其训练和推理成本正在迅速下降。根据摩尔定律,每18个月,性能就会翻倍而价格减半。大型语言模型,12个月内推理成本基本上可以降低90%以上成本。

百度自研芯片昆仑芯能够在更少的计算资源下运行大规模模型这使得大模型的推理和训练所需的计算量减少,从而直接降低算力成本。近日,百度智能云成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。大规模集群通过任务并行调度、弹性算力管理等方式,提高计算资源利用率,避免算力闲置,提高单任务的计算效率,降低整体算力成本。

效果方面,DeepSeek-R1的深度推理让人惊艳,即将于3月16日发布的文心大模型4.5不仅在基础模型能力上有大幅提升,且具备原生多模态、深度思考等能力。

百度深耕大模型多年,文心大模型的RAG能力是目前国内最强的,去年百度推出了自研的iRAG等技术,大幅降低图片生成领域的幻觉。比如近期文心一言上线的“深度搜索”功能就在RAG能力上表现突出,尤其在专业领域问答幻觉率低。

上述这些表现,让我们可以合理预期文心大模型4.5在幻觉方面将降低到新水平。

一直以来,李彦宏都强调大模型的应用,基础模型只有在大规模解决现实问题时,才具备真实价值。因此,百度文心大模型持续追求更低成本、更好效果,不断降低大模型的应用普及落地门槛,要让人人都用得起,人人都用得上。

在这场以“应用落地”为主题的大模型第二场竞赛中,DeepSeek、百度等头部玩家率先开启了开源开放低成本新玩法,OpenAI也被迫加速了模型发布和开源的脚步,中美大模型间的较量仍将持续,但形势相比2年前,已经大不一样了。

0 阅读:15
TechWeb

TechWeb

专注于互联网消费领域,提供互联网产品等最新资讯。