近段时间,杭州一家叫DeepSeek的公司所发布的语言大模型,名字也叫Deepseek,各方面,不论是国内或国外的测评,都认为它和OpenAI最新发布的大模型O1水平非常接近,甚至略有优势。
问题是,DeepSeek最新R1版本的训练费用,仅仅是O1的三十分之一。只花了人家三十分之一的钱,却做出了相同的效果。这让OpenAI那边的工程师非常尴尬,不知如何解释。
一年多前,OpenAI的Chatgpt问世的时候,我们这边还是什么都没有的。Chatgpt某种程度上拉开了这轮AI热潮的序幕,仿佛一夜之间,AI挤到了我们的跟前,会编代码会写PPT,大有一把抢走人类许多工作的架势。
没过多久,许多中国的企业也推出了自己的大模型,比如百度的文心一言,字节的豆包,腾讯的混元……不过开始推出的国产大模型,跟Chatgpt都是有差距的,当时也有不少嘲讽的声音。
美国那边sora的概念推出来的时候,嘲讽的声音就更响了,毕竟那边的AI都要能生成视频了,这边拼图还拼得歪歪扭扭。但后面这边追赶得很快,好几家公司很快也推出了能生成视频的AI。
这些追赶,都是在顶着美国限制或制裁之下完成的。在AI这个领域里,美国的算力优势很大。英伟达是美国的公司,美国的企业可以拿到足够数量的最先进的AI芯片,而中国的企业并不能够。国产的AI芯片,目前和英伟达的,也仍有差距。
可即使在这样的背景下,中美两国在AI之间的差距,看起来仍然可以追上、抹平,甚至超越。算力不足,算法来补,DeepSeek们目前采取的是这样的方案,也在一定程度上证明了,AI并不是任何时候都简单粗暴地依赖算力。
DeepSeek网页版和移动端都有,大家可以试着去调戏一下。
近段时间在科技领域的一系列追赶和超越,证明了中国是有创新和领跑能力的,并不只是擅长学习和复制而已。
这种争议或担忧一直是存在的,过去几十年我们的快速发展,确实存在一定的“后发优势”。路径别人已经走出来了,我们照着学一遍,比起自己去开拓来说,确实相对要简单得多。
但当我们把别人已经开拓的技术全部都掌握之后,“后发优势”就不复存在了,那时候我们是不是还能够持续发展?许多人认为不能够,认为中国不论是文化还是制度上,都是缺乏创新精神和能力的。李录的《文明、现代化、价值投资与中国》就提过这样的观点,他肯定中国过去几十年的发展是伟大的奇迹,但也认为今后能不能持续,是个很大的疑问。
如果不能够创新,那么发展的上限确实是被动的。但事实却是,创新的最关键因素,并不是神秘玄幻的创新精神,而是持续的实践与规模累积的自然结果。
创新看起来是天马行空的,好像只有那些脑洞大、性格活跃,观念开放的人才能够做到,美国那些嘻嘻哈哈,不愿老老实实行事的学生,好像天然更接近于创新。但事实上,对创新来说,脑洞大固然重要,但更重要的却是对一项工作及其相关的因素无限的熟悉,以及对效率的无限渴求。
无限熟悉全部路径的人,才更有可能开辟出新的连接。发明珍妮纺纱机的哈格里夫斯就是一名经验老到的普通织工而已,而第一个想到将所有电路刻在一块硅片上的杰克·基尔比,也是在半导体领域工作了十几年,对原有电晶体和各种材料的优缺点无限熟悉。
创新的本质就是熟能生巧,不能够凭空发生,它实际上是长期实践的结果,是实实在在的累积,而不是什么单纯的天赋。不存在哪一个国家和民族天然就会创新,或天生不能创新。
以中国现在的市场条件,制造业规模和能力,可太不缺实践了,创新这种东西,是一定会像雨后春笋一样自动到处冒出来的。上半场也许渐近尾声,但下半场,才刚刚开始。