梁文锋又冲上热搜了! 梁文锋这次上热搜,直接给AI圈炸了锅,没有内讧没有翻车,竟是悄悄搞出了新的AI模型! 1月21日外媒率先曝光消息,在DeepSeek推理模型R1发布一周年的节点,新模型“MODEL1”的名称意外出现在开源社区的代码之中,这一时间点的重合绝非偶然,而是团队长期规划后的技术亮相。 DeepSeek的开源布局早已打破行业固有模式,不是简单的技术共享,而是通过开放降低行业门槛,吸引全球合作伙伴共同搭建生态。目前已有印尼教育机构、俄罗斯企业等主动寻求合作,借助其开源技术拓展应用场景。 这种模式也带动了国内众多企业跟进布局开源方向,让相关技术应用不再受限于少数巨头,逐步形成全球共创的产业氛围,技术层面的硬实力,让这份开源布局有了坚实支撑。 DeepSeek团队打造的工具在运行效率上大幅超越行业常用工具,其研发的R1模型研究论文还登上了《自然》杂志封面,成为首个经过全球同行评审的主流大语言模型,获得国际学术领域的正式认可。 梁文锋的技术积累为团队突破奠定了基础,他拥有浙江大学信息与通信工程专业硕士学位,早年深耕AI技术在金融领域的应用,还牵头打造了“萤火一号”“萤火二号”两款AI超级计算机,为模型研发提供了充足的算力支撑。 凭借这套技术体系,他带领团队研发的模型以相对较低的成本实现了与国际顶尖水平相当的性能,2025年12月更入选《自然》杂志年度十大科学人物榜单。此前曾有网友猜测,开源过程中可能存在的分歧会影响团队研发进度。 但MODEL1的悄然曝光,直接打破了这类疑虑,证明团队研发节奏未受任何干扰,反而持续推进技术迭代。目前已有消息称,DeepSeek计划在2026年2月中旬推出新一代旗舰模型,内部测试显示其部分能力已超越现有顶级模型,此次MODEL1的曝光或与该计划密切相关。 MODEL1并非概念性炒作,在GitHub平台的代码更新中,28处提及这一名称,且与已成熟的V3.2模型并列出现。从代码细节能看出,新模型在键值缓存布局、稀疏性处理、FP8数据格式解码等方面有针对性调整,大概率已接近完成阶段,正在进行最终测试验证。 这延续了梁文锋团队一贯的风格,不提前举办发布会造势,而是等到技术成熟后再自然曝光,与行业内部分重宣传轻落地的做法形成差异,R1模型的过往表现,早已印证了这种务实风格的价值。 这款模型推出后迅速跻身全球榜单前列,超越多个国外知名团队的成果,开源后甚至影响到国际科技巨头的股价波动,倒逼这些企业调整策略加入开源领域,在海外开源社区的周年回顾中,R1被评价为重塑全球开源生态的关键力量,中国相关模型的下载量也借此实现对美国的超越。 如今MODEL1的出现,进一步延续了这一发展轨迹,从技术积淀到生态构建,从低调研发到全球认可,这套发展路径正在为行业提供可参考的范式,也让全球AI领域的竞争格局迎来新的变化。
