2024年年底,中国一下子试飞了两款“六代机”,当时消息一经发布,就引发了广泛关注。
六代机,作为现代战机的顶级存在,除了中国外,全世界绝无仅有。即便是美国,还处于研发制造阶段。
正因如此,六代机的面世,直接让西方媒体沉默了,他们除了羡慕根本找不出抗衡的理由。
2025 年初,就在中国即将迎来新年之际,我国再次宣布发布了一款名为“DeepSeek”的AI模型,在全球范围内再次掀起波澜,并成为科技界瞩目的焦点。
美国主流媒体纷纷“周末加班、连夜报道”,其热度一度登顶全球,还被华尔街顶级风投A16Z的创始人Marc Andreessen比作“AI领域的斯普特尼克时刻”。
“DeepSeek”的优势DeepSeek 是一家成立于2023年的中国人工智能初创公司,由AI驱动量化对冲基金幻方量化的掌门人梁文锋创立。
该公司专注于开发高性能、低成本的AI模型,致力于推动AI技术的普惠化,让更多的企业和开发者能够以较低的成本使用强大的AI工具。
当前,DeepSeek的核心产品主要有DeepSeek-V3和DeepSeek-R1两款,这两款模型在性能和成本上都取得了显著突破。
据悉,DeepSeek产品一经发布,在全球就引发了广泛关注。
其核心在于应用颠覆性的技术路线和创新策略,在AI领域掀起了一场技术与商业的双重变革。
1、训练成本低
以DeepSeek R1模型为例:
这一模型不仅在数学、编程和推理等关键领域表现卓越,其在某些测试中甚至超越了当前国际主流的OpenAI最强模型o1。
同时,其训练成本极低,仅为OpenAI同类模型的极小部分。
据悉,DeepSeek R1的训练成本仅为557.6万美元,而OpenAI的GPT-4训练费用高达10亿美元。
正因如此,这种“物美价廉”的特性为全球中小企业带来了更多AI应用的可能性。
2、逻辑准确度高
DeepSeek R1的核心优势在于其独特的强化学习(Reinforcement Learning, RL)策略。
与传统依赖大量人工标注数据的监督微调(SFT)不同,DeepSeek R1完全依靠强化学习进行训练,无需监督微调。
这种方法在显著降低了对标注数据依赖的同时,更让模型能够在自我博弈中激发推理潜能。
如,在美国数学邀请赛(AIME)测试中,DeepSeek R1-Zero的准确率从15.6%跃升至71.0%,最终结合冷启动数据后达到79.8%,接近OpenAI o1的水平。
3、采用了GRPO算法框架
DeepSeek R1采用了创新的GRPO(Group Relative Policy Optimization)算法框架,进一步优化了强化学习的训练过程,降低了计算开销,提高了训练稳定性。
4、开源的策略
DeepSeek R1的开源策略是其成功的关键之一。
作为一款遵循MIT许可协议的模型,DeepSeek R1支持免费商用、任意修改和衍生开发。
这种开放性策略不仅为全球开发者提供了广阔的使用和创新空间,还形成了全球开发者协同创新的“开源飞轮”。
DeepSeek的开源策略不仅推动了AI技术的普惠化,还为全球开发者和企业提供了更多创新机会。
相比之下,OpenAI的“部分开源”模式不仅限制了社区的参与度,还在一定程度上形成了技术壁垒,不便于应用和推广。
DeepSeek背后的国运之战正是基于以上诸多优势,DeepSeek的成功发布,引发了全球科技巨头的高度重视。
Meta、Google和OpenAI等公司迅速行动,第一时间开始研究DeepSeek的技术路线和数据集来源。
Meta首席AI科学家Yann LeCun更是指出,DeepSeek的成功并非“中美竞争”的单一结果,而是开源模型对专有模型的一次全面胜利。
可以说,在西方科技界看来,DeepSeek无疑是成功的,也是颠覆性的。
其对西方科技界的震撼,正如外界所形容的那样,AI界的“斯普特尼克时刻”。
这一比喻源于1957年苏联发射“斯普特尼克1号”卫星时,西方因技术落后而引发的震惊与恐慌。
如今,DeepSeek R1的成功再次让硅谷感受到前所未有的压力。
在海外社交媒体上,DeepSeek R1成为了热门话题,许多用户将其视为“再见ChatGPT”的标志性时刻。
另外,据相关新闻显示,DeepSeek的崛起,还引起了美国高层的高度关注。
近日,美国高层宣布对DeepSeek展开“国家安全调查”,理由是担心DeepSeek的AI技术可能影响美国的数据安全和市场竞争力。
但其背后真正的原因并不是所谓的数据安全,而是:
1、DeepSeek技术已威胁到OpenAI(ChatGPT)的市场主导地位。
目前全球AI市场由美国科技公司垄断,DeepSeek的快速崛起,让美国企业面临竞争压力。
2、美国担心失去AI霸权
过去,美国利用AI技术在全球范围内掌握信息优势,DeepSeek的出现或将颠覆这一优势。
3、Google、Facebook、Microsoft 长期收集全球用户数据,但美国政府却选择忽视。
当中国科技公司崛起时,美国担心“纸包不住火”,自然有些着急了,甚至做出下三滥的手段。
正因如此,美国近期在技术领域对中国展开了一系列竞争行动。
包括特朗普宣称投资5000亿美元开启“星际之门”项目,以及OpenAI掌门人萨姆·奥尔特曼强调美国要保住全球领先优势。
这些举动都是想方设法,在通过技术封锁遏制中国在AI领域的进步。
但中国从未惧怕封锁,凭借自主创新能力不断突破。
中国在AI领域的关键突破在于纯国产算力,尽管与GPT-4仍有差距,但在多个维度已接近甚至超越。
截至2025年1月,中国算力总规模位居全球第二,拥有14个国家级超算中心、633个超大型和大型数据中心以及60个智算中心,为AI大模型研发提供了坚实基础。
中国在B端和C端应用领域处于全球领先地位,科大讯飞在通信、金融、能源、政务、医疗等多个行业中标项目数量和金额均位列第一。
DeepSeek的成功不仅是技术胜利,更是中国科技企业崛起的缩影。
中国正通过自主可控的算力和庞大市场需求,构建独立的科技生态,逐渐改变全球AI格局。
读者们,关于“DeepSeek对全球科技的影响力”,大家怎么看?如果喜欢本文章,请分享收藏哦~
参考资料:
DeepSeek“横空出世”,成功的关键源于这两点 正观新闻 2025-01-27
“大模型性价比之王”刷屏 DeepSeek打破算力需求“怪圈”? 中国经营报 2024-12-30