英伟达发布旗舰模型Nemotron 3 英伟达这次是有点秀啊。新发布的Nemotron 3 Nano,只要24GB显存就能本地运行。它的核心架构很有意思,采用了Mamba和Transformer混合的MoE技术,虽然是300亿参数的底子,但实际干活时只激活36亿,主打一个“多快好省”。特别是在处理百万级超长文本和写代码方面,表现甚至压过了GPT-OSS。在巨头们开始搞闭源壁垒的时候,老黄直接把权重和数据全放出来了,这对开发者生态是巨大的利好。

英伟达发布旗舰模型Nemotron 3 英伟达这次是有点秀啊。新发布的Nemotron 3 Nano,只要24GB显存就能本地运行。它的核心架构很有意思,采用了Mamba和Transformer混合的MoE技术,虽然是300亿参数的底子,但实际干活时只激活36亿,主打一个“多快好省”。特别是在处理百万级超长文本和写代码方面,表现甚至压过了GPT-OSS。在巨头们开始搞闭源壁垒的时候,老黄直接把权重和数据全放出来了,这对开发者生态是巨大的利好。

猜你喜欢
【53评论】【48点赞】
【69评论】【44点赞】
【2评论】【8点赞】
【9评论】【20点赞】
作者最新文章
热门分类
科技TOP
科技最新文章