当年卫星让美国慌了,如今DeepSeek让硅谷怕了!中国AI让世界惊呼

是百科密码 2025-01-31 20:08:22

1957年,苏联成功发射了第一颗人造卫星,彻底震惊了自诩科技巨无霸的美国,为了重回科技巅峰,美国不惜展开同苏联的科技竞赛。

没得想到几十年后,类似的情景在AI领域重现,我国大型语言模型DeepSeek,在短短5天内超越了ChatGPT,训练成本更只用了557.6万美元,硅谷的大佬们再也坐不住了!

国外科技巨头开始加班了

2025年开年,我国自主研发的大型语言模型DeepSeek就引发了全球科技风暴!性能不仅在在某些方面超越了OpenAI的ChatGPT,训练成本更是低到令人咋舌。

《金融时报》率先以中国DeepSeek正在挑战美国AI巨头为题,详细报道了DeepSeek的出色表现。

DeepSeek的表现也确实惊人,不仅登顶中国区App Store免费榜,还在美国区下载榜上超越了ChatGPT,成功创造了历史。

美国主流媒体上关于DeepSeek的讨论迅速升温,为了抢上这一波热度,各大主流媒体拼了命的在周末加班加点。

更有好事的媒体将DeepSeek的成功,与1957年苏联发射斯普特尼克1号卫星的历史性时刻相提并论。从这个角度也能看出来,西方对我国科技超越的恐惧和重视。

外行看热闹,不管媒体和网友们怎样盛赞DeepSeek的成功,至少美国的科技巨头们是真的坐不住了,Meta成立了四个研究小组,指定要研究出DeepSeek如何降低训练成本、优化模型效率以及其可能使用的数据集来源。

就连微软CEO纳德拉,都在达沃斯论坛上公开为DeepSeek站台,认为它的新模型极具突破性,纳德拉也呼吁美国的同行必须要认真对待中国在AI领域的发展。

AI算力怪圈:DeepSeek怎么就跳出来了?

在这些年的人工智能领域大战中,其实一直都是换汤不换药的竞争,各大公司拼了命的在卷算力,手握算力硬件的英伟达因此成了最大的赢家。

在之前所有人的认知中,算力就是制约模型发展的重要因素,训练大型语言模型就是个烧钱的买卖,OpenAI为了训练GPT-4其花费都成本高达10亿美元。

高昂的成本也让AI行业成了贵族企业,不光剔除了预算不够充足的中小企业,就连科技巨头也都倍感压力,所在在AI快速发展的这几年,模型的研发一直都是资本密集型产业,技术突破也因此受到了限制。

但DeepSeek却是一匹不走寻常路的黑马,团队通过技术路线的颠覆性创新,大幅降低了训练成本,DeepSeek-V3模型这一模型在仅使用2048块H800 GPU的情况下,就完成了6710亿参数模型的训练,全部的成本算下来也不过557.6万美元,连GPT-4训练的零头都不到!

既然DeepSeek如此厉害,那整个模型成功的关键到底在哪呢?

DeepSeek团队采用了强化学习策略,这一策略最早其实是在围棋和自动驾驶领域应用的,但用在大模型上还尚属首次。在强化学习之后,DeepSeek生成内容的靠谱程度提高到了全新的高度,在生成的过程中可以从海量数据中学习逻辑与因果关系,让AI也有了类似人类逻辑思考的思考式推理。

也正是这个特点让DeepSeek在数学、编程和推理这些方面的表现十分优秀。

而且DeepSeek还是个全面开源的模型,之前不管是ChatGpt还是Calud都将自己的代码和思考过程严格保密,但DeepSeek却支持免费商用、任意修改和衍生开发。

如此开放的策略直接让DeepSeek成了真香,为全球开发者提供了广泛的使用和创新空间,也让DeepSeek在海外科技圈迅速走红。不少海外科技大佬将其视为AI界的搅局者,认为这将重塑现有AI技术的生态体系。

业内专家对此给予了高度评价,北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟表示:DeepSeek最大的优势就是在于它对算法的改进和优化,打破了AI自从诞生以来一直陷入的算力内卷怪圈。

不光节省了算力,还告诉世界哪怕没有最为先进的芯片,我们也可以通过算法达到和超越通过庞大算力堆砌出来的技术壁垒,这才是DeepSeek最厉害的地方。

南京大学人工智能学院教授俞扬也指出:DeepSeek站在前人的基础上,在算法上进行了相应的优化让训练成本得到大幅降低。

OpenAI最初在做ChatGPT的时候,用了强化学习的技术,但是强化学习的技术,是很通用的强化学习的工具,对于工具的要求非常多,所以会导致它的机器要用得很多。

但是后来的研究者就发现,其实不需要这么复杂的算法,可以针对语言模型来设计出简单的算法出来,这样大概可以节省3/4的机器。

在DeepSeek的公布的技术方案中,它的强化学习也使用了这种简化的方案,那让从技术上面来说是可以有很多改进的地方。

DeepSeek的成功不仅在于其技术的突破,更在于其开放的生态。DeepSeek通过开源吸引了大量开发者和研究人员的关注。

他们可以在GitHub等平台上自由获取和修改模型代码,共同推动AI技术的发展。英伟达AI科学家Jim Fan称赞DeepSeek是真正开放的前沿研究,赋能所有人。

DeepSeek背后的国运之战

DeepSeek的爆火,又将中美在人工智能领域的竞争放在了台面上,这场技术上的角力根本就不是单纯的商业竞争,而是国家之间未来科技实力比拼的目的地。

这些年美国想方设法在科技领域卡我们的脖子,不管是芯片等硬件方面的制裁,还是其他软件方面的限制,最终的目的都在指向AI技术这个当今时代最大的封控。

特朗普更是毫不讳言的直接宣布,投资5000亿美元开启星际之门项目。为的就是同我国在这方面进行技术竞赛,妄想重新恢复美苏时代星球大战计划的荣光。

OpenAI的掌门人萨姆·奥尔特曼也不遮不掩,公开撰文表示美国必须赶在中国加速追赶之前,保住其在全球的领先优势,这些举动都是冲着我们来的,意图通过技术封锁和限制遏制我国在AI领域的进步。

斗了这么多年,美国现在还是没能摸清我们的底气,中国从来就不惧怕封锁和制裁,按毛主席的话说,有本事再封锁我们几十年,我们自己什么都能造得出来。

科大讯飞董事长刘庆峰就说得非常清楚,我们未来AI大模型的攻坚方向绝不是同美国比拼算力,我们根本就没有必要把自己的大楼建在美国打下的沙滩上。

所以我们国产大模型想要逆势突破的关键就在于纯国产算力,虽然现在在很多层面上或许还同GPT4.0有差距,但我们已经在多个维度上实现了接近甚至超越。

这也是最近DeepSeek之所以能引起万千瞩目的关键所在,虽然美国占据了技术先手,但我们庞大的市场需求,却是推进本土AI技术自主创新的最优方向。

截止到今年1月,我国算力总规模位列全球第二,累计建成国家级超算中心14个,全国在用超大型和大型数据中心达633个、智算中心达60个,这为AI大模型的研发和应用提供了强大的基础设施支持。

而且我们的强项一向都是在B端和C端的全面应用,美国虽然在研发层面比我们领先,但在应用领域我们才是全球当之无愧的老大。

科大讯飞现在就已经在通信、金融、能源、政务、医疗等多个行业的中标项目数量和金额,均位列第一,展现了国产大模型的强大竞争力和应用前景。

DeepSeek的成功和我国在AI领域的自主创新,让美国科技公司感到前所未有的压力,有的外国媒体把事情看得很准,DeepSeek的成功真的不只是一个单纯的技术胜利,更应该把它看成是中国科技企业在全球竞争中逐渐崛起的一个缩影。

过去美国科技巨头凭借其强大的算力和技术优势,牢牢占据着全球AI领域的领先地位。随着我国在技术研发、算力建设和市场应用上的不断突破,这种格局正在发生改变。

我国不仅在AI技术上逐渐赶超,更通过自主可控的算力和庞大的市场需求,形成了一个相对独立的科技生态。

结尾

在科技竞争愈发激烈的今天,DeepSeek的横空出世不仅是一次技术的突破,更是一场国运的较量。

它又一次告诉我们,面对技术封锁和外部压力,唯有自主创新才能掌握未来。我国科技企业正在用实际行动证明,我们可以依靠自己的力量,在世界科技舞台上占据一席之地。

0 阅读:13
是百科密码

是百科密码

欢迎关注!