DeepSeek R1开放一周年,又有新动作!新模型“MODEL1”在开源社区悄然现身,引发业界关注。2026年1月以来,DeepSeek动作不断,发布技术论文,还在GitHub更新FlashMLA代码。开发者发现,文件里数十处提到“MODEL1”,且与现有模型“V32”并列引用。 分析认为,“MODEL1”大概率是全新架构的AI模型。它核心优化聚焦三大方向:重构键值缓存存储逻辑,显存占用降40%,推理速度提1.8倍;加入稀疏FP8解码技术,信息损失率压到5%以下;适配英伟达最新GPU架构。看来,“MODEL1”未来可期!
