

文丨丁灵波
有国产源神、AI界“拼多多”之称的DeepSeek开源模型团队,继V3模型之后,再次抛出一款王炸模型R1让国内外开发者们兴奋不已。
2024年12月底,DeepSeek-V3上线后在AI圈刷了屏,引起全球开发者密切关注,当时V3性能足以叫板GPT-4o,但服务价格只要4o的十分之一,且整个训练仅花费557.6万美元,让业内叹为观止。

而最新发布的推理模型DeepSeek-R1,性能比肩OpenAI o1正式版,服务价格更是只有o1的3%左右,并且,DeepSeek将R1模型训练中的技术创新全部进行了公开,以期促进技术社区的充分交流与创新协作。
此举让不少国外网友感慨,一家中国公司正在用实际行动让OpenAI的初衷得以延续——真正开放、为所有人赋能的AI前沿研究,而商业化转型后的OpenAI却越来越有点“奸商”味道。

R1的新突破
DeepSeek同时祭出了好几款模型产品,除了开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型,通过DeepSeek-R1的输出,还蒸馏了6个“精简版”小模型,最小的版本可以在笔记本电脑上本地化运行,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。

值得关注的是,DeepSeek-R1展现出了自我验证、反思以及生成较长思维链等能力,这对AI研究界而言是一个里程碑,它用最少的标记数据显著提高了性能,通过公开研究证实了大语言模型(LLMs)的推理能力能够纯粹通过强化学习(RL)来激发,而无需监督微调(SFT)。
在数学、代码、自然语言推理等任务上,R1性能与OpenAI o1正式版不相上下,且代码库和模型权重遵循MIT许可协议,开发者们可自由提炼和商业化!

DeepSeek-R1的API访问定价为:0.14美元/百万输入令牌(缓存命中), 0.55美元/百万输入令牌(缓存未命中),每百万输出代币2.19美元。
这价格跟OpenAI产品比起来简直太良心,比GPT-4o和o1爆省90%-96%以上,以至于有网友担心这样的定价能不能维持其后续研发改进。


纯粹由RL驱动,完全没有SFT冷启动的方式,不禁让人想起了当年的AlphaZero和AlphaGo,从头开始掌握围棋、将棋和国际象棋,而无需先模仿学习人类大师级的动作数据,让AI大模型产生“顿悟时刻”出现自我反省和探索行为是R1带来的最重要的启发。

来自Google DeepMind的研究科学家Harris Chan还将DeepSeek-R1(Zero)的训练流程以及提炼更小模型的方法进行了可视化,预计2025年很可能成为LLM RL之年。

收获国内外网友好评
开源模型充满魅力,DeepSeek-R1的性能让外国网友感到难以置信:“一家中国初创企业的开源产品竟能击败AI领域的许多领跑者。”

上手的开发者们发现,DeepSeek R1 671B在2 M2 Ultras上运行的速度比读取速度更快,在家中消费硬件上的性能接近开源o1。

有网友整了一个非常酷的用例,基于DeepSeek R1-Zero生成代码制作数学动画视频,不到30秒钟就生成了勾股定理解释动画,9分钟一次性完成了量子电动力学概念的视觉化,没有任何错误,这样的开源应用势必让未来教育和知识传播越来越便捷。

有人在本地测试了DeepSeek R1的7B Qwen蒸馏版模型,表现同样惊喜,在M4上的Token输出速度已经超过阅读速度,问了一个经典小学生推理问题:“明天的前天,是昨天的后天么?”模型很坦诚地输出了十分有趣的思维过程,不过每次都正确。

在输出答案之前,DeepSeek R1会向开发者展示它的思考方式和过程,这点也备受欢迎,甚至会主动指出用户提问中的拼写错误,网友直呼amazing!不敢相信这款模型与o1同级却能如此便宜,甚至无需WiFi也能流畅运行。
也有人用DeepSeek R1代码生成器开发小游戏了,非常便捷:“你可以向各个方向360度发射导弹。一开始,敌人的速度很慢,但当你击败3个敌人时,它会逐渐加快。”

国外网友们对DeepSeek背后开发团队的行事风格表示钦佩:首席执行官没有大肆宣传,零“天哪,伙计们,我们改变了一切”,没有任何华丽的演示,没有夸张的承诺,没有暗示“内部正在实现AGI”,他们每次都是直接把实际产品抛出来,然后默默抢走了AI圈的风头,引领开源AGI革命。
业内人士认为,此次R1发布是一个足以改变游戏规则的事件,它表明在通用人工智能 (AGI) 竞赛中,低成本开放模型正在快速缩小与封闭商业模型的差距。

新一轮竞争更激烈
DeepSeek的开源价格战搅局,无疑把压力给到了OpenAI,毕竟吸引数百万开发人员在其开源模型的基础上进行构建、修改和改进,增长潜力是巨大的。
在一次接受The Information采访时,OpenAI全球事务副总裁Chris Lehane就特别指出DeepSeek的母公司是一个特别令人担忧的组织,DeepSeek提炼开源模型的出色表现意味着,非常有能力的推理器将继续广泛扩散,并可在本地硬件上运行,远离了自上而下的控制机制的监控。
OpenAI在上周的一份政策文件中还敦促美国政府强化支持美国人工智能的发展,以免中国模型在能力上超过它们,把市场蛋糕分割。

一位开发者在reddit社区留言表示,这对硅谷和美国来说非常糟糕,作为一名付费的ChatGPT会员,我想说的是:如果“中国”或任何其他人工智能模型能够为我提供廉价且出色的结果,同时功能丰富,那么我的钱就会流向那里。
在中国市场,DeepSeek和此前的AI模型“六小虎”包括智谱AI、月之暗面、百川智能、Minimax、阶跃星辰、零一万物等并列称为“七小强”,但随着许多竞争者内部暴露运营问题或创新乏力,DeepSeek正在逐渐成为这个创业赛道里的“最大黑马”。
而DeepSeek的低价高性能冲击策略在2025年可能会进一步改变国内外AI模型市场的竞争格局,迫使其他厂商重新审视定价策略,加快技术研发和产品升级以应对竞争节奏。

如果您有什么想说的,欢迎在评论区留言讨论!
投稿或寻求报道,欢迎私信“投稿”,添加编辑微信。
【2025免费新年礼】:了解最新科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会,领取100份AI科技商业研报合集,加群共同探讨与成长——
欢迎添加头部科技晶总微信Toptech007