deep seek真正的意义我觉得不是说给美股干翻了,或者说是打了OpenAI的脸,都不是,我觉得它最大的意义有两点。
第一就是我们国内的工程水平,我们的科研能力,我们的AI进程一点也不比老美差。
我们不需要那么高端的芯片,不需要几个亿的训练成本,几百万就能搞出一个跟GPT4差不多,甚至逻辑推理能力要比GPT one还要强的东西。
而且这两天阿里巴巴的千问2.5也出来了,Kimi也出来了,更是在测评结果上超越了deep seek和GPT4。
这也就说明了国内的AI能力已经上来了,不能说超越,但起码能做到的我们也不相上下。而且想明白了,deep seek还只是一个量化公司的副产品,相当于是用炒股的钱随便就做了一个副业玩玩的,就做了一个世界顶尖的AI。
而且看看美国这边的AI公司呢,成千上万的人工智能专家研究了这么多年,也就这点进展了。这就再次说明了,我们虽然自主能力可能稍微差点意思,但是做工程降本增效率绝对是我们的专业。
当然,我觉得这还不是重点。Deep seek它最大的意义在于,它第一次让AI走进千家万户,这事儿成为了现实。
过去我们总会以为大模型这个东西特别高大上,训练成本昂贵,运行要求极高。我们基本上只能用大公司的产品。我如果想做点什么AI应用,我必须要考虑动辄可能每个token多少美元的输入输出成本。
现在好了,deep seek不仅是开源了,随便用,而且运行成本也被打到了骨折。有工程师就展示了用AMD处理器外加大量内存就能来运行完整的deep seek。甚至呢,它拥有本地轻量级的版本,你完全可以把它部署在你自己的电脑上来跑。
我看网上已经有计算的还在用了,就像是本地版的智能助手一样,帮你生成文本、回答问题、识别图像,跟你的相亲对象聊天,甚至断了网还能用。
这么一来呢,整个AI行业一定会迎来新一轮的洗牌。你甚至看到越来越多的小应用扎堆井喷式的出现,那这个领域就再也没有什么技术垄断了。以后非常有可能家家户户都能拥有自己的AI。
就像是原来最早计算机刚出现的时候了。甚至是一台计算机的I的占地167平方米,27吨重,能耗大概是150千瓦,和一个小型发电厂差不多。
而它的计算能力大概是现在随便一块智能手表的125亿分之一。什么概念呢?就是你把ENIAC计算一年的任务分配给Apple Watch,还有一分钟就能完成。
就是现在AI常常有可能发展的方向,效率更高,能耗更低,体积更小。但是我的想象力可能现在都描绘不出来,它未来发展的1%。
所以我觉得这也是deep seek还有它背后的团队最伟大的贡献。它让整个AI圈的人都开始重新思考,很多标准,很多方向可能就会因此改变。
就比如这两天被冲击的最惨的英伟达,号称人家CEO老黄已经开始着手研究新策略去适应这种变化了。
AMD的苏妈她更快一步宣布已经把deep seek v3集成到了他们的GPU上,还有很多的应用,就比如傻白之前推荐过的这个搜索工具Perplexity AI,人家已经在第一时间采用了deep seek的模型。
所以说deep seek它并不是什么昙花一现的打了一把老美的脸,而是第一次的把这种小而精的模型彻底的推向了全世界,让整个产业瞬间开启了加速键。
如果说ChatGPT第一次让人见识到了AI的巨大潜力,那deep seek的出现我觉得更像是给人类开启了一片星辰大海。
那未来呢,会有越来越多的创新和升级在这里发生。