DeepSeek只用了三十分之一的成本，超越了OpenAI最新的大模型

近段时间，杭州一家叫DeepSeek的公司所发布的语言大模型，名字也叫Deepseek，各方面，不论是国内或国外的测评，都认为它和OpenAI最新发布的大模型O1水平非常接近，甚至略有优势。

问题是，DeepSeek最新R1版本的训练费用，仅仅是O1的三十分之一。只花了人家三十分之一的钱，却做出了相同的效果。这让OpenAI那边的工程师非常尴尬，不知如何解释。

一年多前，OpenAI的Chatgpt问世的时候，我们这边还是什么都没有的。Chatgpt某种程度上拉开了这轮AI热潮的序幕，仿佛一夜之间，AI挤到了我们的跟前，会编代码会写PPT，大有一把抢走人类许多工作的架势。

没过多久，许多中国的企业也推出了自己的大模型，比如百度的文心一言，字节的豆包，腾讯的混元……不过开始推出的国产大模型，跟Chatgpt都是有差距的，当时也有不少嘲讽的声音。

美国那边sora的概念推出来的时候，嘲讽的声音就更响了，毕竟那边的AI都要能生成视频了，这边拼图还拼得歪歪扭扭。但后面这边追赶得很快，好几家公司很快也推出了能生成视频的AI。

这些追赶，都是在顶着美国限制或制裁之下完成的。在AI这个领域里，美国的算力优势很大。英伟达是美国的公司，美国的企业可以拿到足够数量的最先进的AI芯片，而中国的企业并不能够。国产的AI芯片，目前和英伟达的，也仍有差距。

可即使在这样的背景下，中美两国在AI之间的差距，看起来仍然可以追上、抹平，甚至超越。算力不足，算法来补，DeepSeek们目前采取的是这样的方案，也在一定程度上证明了，AI并不是任何时候都简单粗暴地依赖算力。

DeepSeek网页版和移动端都有，大家可以试着去调戏一下。

近段时间在科技领域的一系列追赶和超越，证明了中国是有创新和领跑能力的，并不只是擅长学习和复制而已。

这种争议或担忧一直是存在的，过去几十年我们的快速发展，确实存在一定的“后发优势”。路径别人已经走出来了，我们照着学一遍，比起自己去开拓来说，确实相对要简单得多。

但当我们把别人已经开拓的技术全部都掌握之后，“后发优势”就不复存在了，那时候我们是不是还能够持续发展？许多人认为不能够，认为中国不论是文化还是制度上，都是缺乏创新精神和能力的。李录的《文明、现代化、价值投资与中国》就提过这样的观点，他肯定中国过去几十年的发展是伟大的奇迹，但也认为今后能不能持续，是个很大的疑问。

如果不能够创新，那么发展的上限确实是被动的。但事实却是，创新的最关键因素，并不是神秘玄幻的创新精神，而是持续的实践与规模累积的自然结果。

创新看起来是天马行空的，好像只有那些脑洞大、性格活跃，观念开放的人才能够做到，美国那些嘻嘻哈哈，不愿老老实实行事的学生，好像天然更接近于创新。但事实上，对创新来说，脑洞大固然重要，但更重要的却是对一项工作及其相关的因素无限的熟悉，以及对效率的无限渴求。

无限熟悉全部路径的人，才更有可能开辟出新的连接。发明珍妮纺纱机的哈格里夫斯就是一名经验老到的普通织工而已，而第一个想到将所有电路刻在一块硅片上的杰克·基尔比，也是在半导体领域工作了十几年，对原有电晶体和各种材料的优缺点无限熟悉。

创新的本质就是熟能生巧，不能够凭空发生，它实际上是长期实践的结果，是实实在在的累积，而不是什么单纯的天赋。不存在哪一个国家和民族天然就会创新，或天生不能创新。

以中国现在的市场条件，制造业规模和能力，可太不缺实践了，创新这种东西，是一定会像雨后春笋一样自动到处冒出来的。上半场也许渐近尾声，但下半场，才刚刚开始。