DeepSeek低调发布V3新模型

科技一线人 2025-03-26 20:46:46

据闪德资讯获悉,近日,DeepSeek毫无预告的情况下,在Hugging Face上放出了最新的DeepSeek-V3-0324模型。

DeepSeek-V3-0324模型参数达685B,目前在官方网站、APP和小程序上已经可以体验,需关闭深度思考。

本次更新为小版本更新,并非此前呼声较高的DeepSeek-R2。

但依然有不少亮点,甚至在某些能力已经与Claude 3.7 Sonnet相当接近。

从网友反馈的实测效果来看,V3-0324有这些提升:

编码能力已经接近Claude3.7了,比之前的老版本v3能力要强;

提升幅度大约与Sonnet 3.5到Sonnet 3.6 一样,甚至还要大一点;

与R1相比,V3-0324在生成前端代码方面有了明显改进;

数学能力也有提升,能像推理模型一样能够解题。

DeepSeek-V3-0324依旧免费、开源,权重文件已火速上线HuggingFace,使用最宽松的MIT协议。

所有权重文件加起来占硬盘空间约688GB,与初代v3保持一致。

0 阅读:34
科技一线人

科技一线人

感谢大家的关注