NVIDIA新开源的模型Nemotron3Nano,是个MoE模型,由2

蚁工厂 2025-12-16 08:58:09

NVIDIA 新开源的模型 Nemotron 3 Nano,是个MoE模型,由23个Mamba-2和MoE层以及6个注意力层组成。总参数30B,激活3B。跑分不错。使用Qwen做过微调,但不支持中文。

0 阅读:3
蚁工厂

蚁工厂

感谢大家的关注