从大力出奇迹到小力出奇迹为什么是DeepSeek？

在人工智能领域，一场激烈的竞争正在上演。去年12月，由国内大模型公司“深度求索”开发的DeepSeek应用推出的DeepSeek-V3在全球AI领域掀起了巨大的波澜，它以极低的训练成本，实现了与GPT-4o（就是念GPT4欧）等顶尖模型相媲美的性能，震惊了业界。时隔不到一个月，DeepSeek又一次震动全球AI圈。

随着DeepSeek推出新模型DeepSeek-R1，1月27日，Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。这一消息不仅在AI圈内引起了轩然大波，也让广大用户对这款新兴应用产生了浓厚兴趣。那么，DeepSeek究竟好在哪？为什么能以较低的成本取得“大力出奇迹”的效果？开源又是不是大模型未来的发展方向呢？

DeepSeek：性能卓越，用户体验佳

DeepSeek是一款由国内人工智能公司研发的大型语言模型，简单来说，它就像是一个聪明又懂你的助手。它拥有强大的自然语言处理能力，能够理解并回答你的问题，就像你和朋友聊天一样自然流畅。而且，DeepSeek不仅能聊天，还能帮你写代码、整理资料，甚至能帮你解决一些复杂的数学问题。它背后有着复杂的算法和大量的数据支持，就像是一个经验丰富的侦探，能从海量信息中挖掘出你想要的东西。

其实说到类似的大模型，大家第一印象可能是OpenAI开发的ChatGPT。回顾一下，从2024年9月OpenAI发布o1-preview到现在，仅仅过去了不到四个月，市场上媲美甚至超越其性能的推理模型就已遍地开花。然而之所以DeepSeek可以从这众多的模型之中异军突起，是因为它不仅率先实现了媲美OpenAI-o1模型的效果，更是将推理模型的成本压缩到了极低。

这次DeepSeek再次站在全世界的聚光灯下是因为，它推出的新模型DeepSeek-R1延续了其高性价比的优势，仅用十分之一的成本就达到了GPT-o1级别的表现。

从大力出奇迹到小力出奇迹

模型发布后，瞬间引发了海外AI圈众多科技大佬的讨论。例如，英伟达高级研究科学家JimFan就在个人社交平台上公开发表推文表示：“我们正身处这样一个历史时刻：一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理，但最有趣的结局往往最可能成真。”

1月26日，游戏科学创始人、CEO，《黑神话：悟空》制作人冯骥评价DeepSeek：可能是个国运级别的科技成果。

DeepSeek更持续引发业内震动，脸书母公司Meta已成立专门小组展开研究和学习。

北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟：DeepSeek最大的优势在于它算法的改进和优化，它在算力上得到了节省，在输入数据和语料库上，不像以前要求那么大的数据量和大的算力，这是它的优势。以前如果说OpenAI是“大力出奇迹”，那么DeepSeek就是“小力也可以出奇迹”——小的算力用新的方法也可以出奇迹。

都说“巧妇难为无米之炊”，数据、算力都是大模型的米，而算法就应该是那位巧妇。

刘伟：算法更应该是一个好的厨师，它（DeepSeek）是通过算法把饭做得更香，把这个菜做得更好，原料用得更少，就是数据语料用得更少，然后柴火用得更少，但是做得更好吃！

DeepSeek R1 API价格，图源：DeepSeek

DeepSeek R1模型与o1类推理模型输入输出价格对比，图源：DeepSeek

在南京大学人工智能学院教授俞扬看来，DeepSeek站在前人的基础上，在算法上进行了相应的优化使得训练成本得到大幅降低。

俞扬：OpenAI最初在做 ChatGPT的时候，用了强化学习的技术，但是强化学习的技术是很通用的强化学习的工具，那么这个工具它的要求非常多，所以会导致它的机器要用得很多。但是后来的研究者们就发现其实不需要这么复杂的算法，我们可以针对语言模型来设计出简单的算法出来，这样我们大概可以节省3/4的机器去训练强化学习的过程。在DeepSeek的公布的技术方案中，它的强化学习也使用了这种简化的方案，那么就使得从技术上面来说是可以有很多改进的地方。

开源：未来的发展方向？

此外，值得关注的是，DeepSeek采用了完全开源策略。

曾经OpenAI创立的初衷，也是作为一家非营利组织，希望“以最有可能造福全人类的方式推进数字智能发展，而不受产生财务回报需求的限制。”然而，OpenAI在GPT-3发布之后限制了对模型的访问权限，仅通过API提供服务，在GPT-4发布之后更是隐藏了其训练数据和模型权重、完全走向了“闭源”。

DeepSeek的完全开源策略不仅降低了用户的使用门槛，还促进了AI开发者社区的协作生态。通过开源，DeepSeek吸引了大量开发者和研究人员的关注，他们可以在GitHub等平台上自由获取和修改模型代码，共同推动AI技术的发展。英伟达AI科学家Jim Fan称赞DeepSeek是“真正开放的前沿研究，赋能所有人”。

国内的某大模型创业企业的CEO陈里奥告诉记者，开源的好处是显而易见的。这种开放式的创新模式可以激发更多的创意和灵感，推动AI技术的不断进步。

陈里奥：大模型目前还是属于技术早期，没有把它的一些我们很期待的一些历史使命给完成，目前还是在生文生图上比较多一些。高精准的这种逻辑计算、数学、编程类的，其实还没有完全在大模型层面完成。然后其实技术还是认为是在偏早期的阶段，那技术早期大家一起贡献这样才能快一些。

当然，开源也面临着一些挑战和问题。例如，如何保护知识产权、如何维护开源社区的秩序和稳定等。

俞扬：实际上开源只是一种商业模式，那么即使是开源的东西都是有版权的，所以实际上说开源和闭源之争，其实更多的是说这种商业模式之间，它的哪一种商业模式可能在这种特定的场景、特定的时代上面可能会更有效一些。

有人把DeepSeek的成功归功于这是一个关于中国技术理想主义的故事，也有不少外国人将之比喻为神秘的东方力量。但放在整个AI大模型的产业里看，或许DeepSeek的成功代表了大模型的一种全新发展方向。

刘伟：实际上现在大模型的发展正在发生一些变化，这个变化（是）关于它究竟是不是完全根据算力的大小来判定模型的好坏？现在这个DeepSeek它给大家一个启示，就是说我的算力虽然不高，但是我数据可能不是很多，但是我通过算法的优化可以做得更好一些，这的确也是开辟了这个（新）方向。

桑sang

2025-01-28 07:47

致敬科创人员！你们是中华民族复兴的伟大实践者、领跑者！[点赞][点赞]

要你命干啥

2025-01-28 12:12

做空美股，发展新质生产力，提升国人凝聚力，给春节带来一个大大的开心～[呲牙笑][呲牙笑][呲牙笑][呲牙笑][呲牙笑]。大国国运来了

软Alpha

2025-01-28 08:46

国产AI备受国内外关注这个影响力还是很牛的。但是我作为半个外行人不太理解，如果没有足够的数据支撑仅靠算法优化，可能还是无法达到人们对智能这个词的期望。不论如何还是希望继续加油，国产加油[比心][比心][比心]

歡

2025-01-28 07:56

最先进的美国英伟达显卡不卖中国，中国AI公司只能追求各方面都做到极致了！1981年，学校第二天春游，父母有事不在身边，9岁的我自己和面，洗出几根青菜炒熟做馅，煎了六个饼，作为第二天春游的午餐！同学们还纷纷拿自己买来的食品来换吃，吃了都说味道好！其实不论个人还是集体或国家遇到困难，既然无法回避，就不如去解决他！

犸狸犸狸Hoom

2025-01-28 12:31

官方参与送车步骤:第一步下载纳米AI,第二步输入邀请码442HN，获200纳米，再输360666，还有200纳米，第三步预约，第四步坐等正月十五开奖，先下载获奖概率大！

侧耳倾听

2025-01-28 09:22

看了这条信息我就安心了，前面美帝那边花样百出，好不热闹，看得我心惊肉跳，总担心我们是不是远远被甩掉了……这是未来科学技术至高点，我们一定要不断突破。为中国科学技术点赞[点赞][点赞][点赞]

2025-01-28 09:02

国泰民安！人才辈出！笑容甜美！大国风范！

icon

2025-01-28 11:34

给deepseek开发人员点赞👍！你们的成功再次证明了中国人不仅是勤劳善良的，而且是最聪明的！[呲牙笑]

一颗大橙子

从竞争来说，这就是Ai的上甘岭，使用代和量都差的装备可以搞出成本更低效果更好的效果，打破了惯有的装备优势论，绝对是利好出海的各位；确实可以促进信息技术的民主化，而不是垄断在Tier1国家。

灯！等灯等灯

2025-01-28 09:45

这就是中国智慧！一个大学，一百来个大学生，就搞定了

毛肚姑娘

2025-01-28 09:39

整个头条都在播到这则消息，真是体现国家后台的强大