据闪德资讯获悉,近日,DeepSeek毫无预告的情况下,在Hugging Face上放出了最新的DeepSeek-V3-0324模型。

DeepSeek-V3-0324模型参数达685B,目前在官方网站、APP和小程序上已经可以体验,需关闭深度思考。
本次更新为小版本更新,并非此前呼声较高的DeepSeek-R2。
但依然有不少亮点,甚至在某些能力已经与Claude 3.7 Sonnet相当接近。
从网友反馈的实测效果来看,V3-0324有这些提升:
编码能力已经接近Claude3.7了,比之前的老版本v3能力要强;
提升幅度大约与Sonnet 3.5到Sonnet 3.6 一样,甚至还要大一点;
与R1相比,V3-0324在生成前端代码方面有了明显改进;
数学能力也有提升,能像推理模型一样能够解题。
DeepSeek-V3-0324依旧免费、开源,权重文件已火速上线HuggingFace,使用最宽松的MIT协议。
所有权重文件加起来占硬盘空间约688GB,与初代v3保持一致。