3月11日,针对DeepSeek将在3月17日发布下一代R2模型的传闻,DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息。”
3月11日,据东方财经援引媒体报道,有市场消息称,DeepSeek下一代AI模型DeepSeek-R2或提前于下周一(3月17日)正式发布。
DeepSeek-R2在多个关键领域实现突破,包括更出色的编程能力、多语言推理能力,以及以更低的成本提供更高的准确性。专业人士认为,这些特性若得以兑现,可能使其在全球AI竞赛中占据显著优势。
公开资料显示,DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”,也是网上热议的“杭州六小龙”之一。
2024年底,DeepSeek发布了新一代大语言模型V3,同时宣布开源。测试结果显示,它的多项评测成绩超越了一些主流开源模型,并且还具有成本优势。
随后,在1月世界经济论坛2025年年会开幕当天,中国深度求索公司发布其最新开源模型R1,再次引发全球人工智能领域关注。据该公司介绍,R1模型在技术上实现了重要突破——用纯深度学习的方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩美国开放人工智能研究中心(OpenAI)的o1模型正式版,该模型同时延续了该公司高性价比的优势。据了解,深度求索公司R1模型训练成本仅为560万美元,远远低于美国开放人工智能研究中心、谷歌、“元”公司等美国科技巨头在人工智能技术上投入的数亿美元乃至数十亿美元。