创新工场董事长李开复预言,国内大模型市场最终将由DeepSeek、阿里巴巴和字节跳动三家巨头主导。
这一观点引发了广泛关注,背后究竟是何种逻辑?
让我们深入探讨大模型竞争的残酷现实,以及这三家公司脱颖而出的原因。
李开复的预言并非空穴来风。
他领导的零一万物已全面拥抱DeepSeek的大模型,放弃了自研万亿参数模型,转而专注于更务实、更具商业价值的小模型。
这一举动足以表明他对DeepSeek的信心。
此外,李开复一直支持开源和信息平权,这与DeepSeek和阿里的开源战略不谋而合。
回顾2023年的“百模大战”,不难发现,这场由资本狂热推动的竞争最终受制于技术的壁垒。
大模型训练需要耗费巨大的算力、电力和冷却水资源,以及高昂的芯片成本。
Meta的LLama3训练成本高达9240万美元,这对于中小厂商而言无疑是难以承受之重。
巨头之间的价格战更是雪上加霜。
2024年初夏开始的价格战,使得资源有限的中小厂商只能望洋兴叹,逐渐被淘汰出局。
DeepSeek凭借高效低成本的优势,以及在2025年初开源的策略,一举成为行业新标杆。
DeepSeek的开源模式引发了基座大模型的价值重估,并终结了“百模大战”。
许多AI厂商都难以回答一个问题:为什么要放弃低成本且开源的DeepSeek,而选择其他模型?
DeepSeek不仅实现了与OpenAI并跑,更扛起了开源模型的大旗,这是以往开源阵营的阿里Qwen和Meta LLama都未曾做到的事情。
阿里巴巴的通义千问Qwen模型虽然在普通用户中知名度不高,但在AI开发者社区却享有盛誉,被许多开发者称为“源神”。
最新的旗舰模型Qwen2.5-Max更是在Hugging Face上“屠榜”,展现了其强大的技术实力。
字节跳动虽然在技术上未必领先,但其拥有巨大的流量优势。
抖音日均使用时长超过150分钟,为豆包大模型提供了海量的用户基础。
字节跳动将抖音与豆包打通,并拒绝其他AI产品在抖音投放,这一战略举措确保了豆包的市场地位。
豆包在3月5日接入抖音后,迅速反超腾讯元宝,成为App Store国区免费下载榜冠军,印证了流量的重要性。
其他厂商的处境则不容乐观。
“AI六小虎”中,除了获得资方支持的智谱外,其他公司都已停止大模型的迭代。
百度文心一言和腾讯元宝接入DeepSeek的决策,也表明了他们对自研模型的疑虑。
李开复的选择并非偶然。
DeepSeek技术领先,阿里技术与资本兼备,字节跳动拥有取之不尽的流量,三家公司各具优势。
在“百模大战”逐渐落幕之际,他们成为了最终的赢家。
那么,在未来,这三家公司将如何继续发展,又将如何影响国内大模型市场的格局?
他们的竞争与合作,又将为AI行业带来哪些新的变革?