美方攻击国产大语言模型Deepseek的情况分析

前沿深度解码 2025-02-01 10:52:41

2025年1月,幻方发布了国产大语言模型Deepseek,标志着中国在人工智能领域的又一突破。消息一出,美国股市出现大幅下跌。在“断人财路”与“战略竞争”的双重压力下,美国正采取相关措施进行破坏。

在技术上,美方正在对Deepseek进行直接的网络攻击,攻击来源主要是美国。Deepseek方面捕获到47次针对模型微调接口的对抗样本注入攻击;检测到针对分布式计算节点的"光缆侧信道攻击",攻击方通过解析机房光纤振动频率反推GPU集群通信模式;发现3起利用预训练模型权重文件进行的隐写攻击。在开源供应链方面,开源社区依赖库投毒事件激增,攻击者伪造17个与Deepseek技术栈高度相似的PyPI/NPM包,其中5个包包含针对国产AI芯片的指令集漏洞利用代码;攻击者正在构建与Deepseek内部代码风格高度相似的虚假Git仓库,试图诱导开发人员误克隆。攻击者使用了包括"模型嫁接攻击""影子模型劫持"以及“量子神经网络”相关的新型攻击手段,说明攻击者能支配极其先进的工具。

在认知领域上,塑造此次我国技术创新依赖的是对西方先进技术的剽窃,以及对先进算力芯片的大规模使用。海外人工智能企业家在接受采访时表示,Deepseek训练时使用了超过五万块A100算力芯片,暗示该产品并不存在真正的低成本优势,也不存在对国产供应链的依赖;与此同时,美国总统特朗普的AI顾问表示,Deepseek的创新基于对OpenAI产品的违规“蒸馏”,这可能为下一步的制裁做铺垫。

在政策领域上,西方集团限制了Deepseek的市场准入,并试图进一步限制我获取高性能算力的机会。美国开始直接指责DeepSeek危害美国国家安全,美国海军首先要求其人员不使用Deepseek,目前美国国会办公室也做此要求。1月29日,出于隐私问题,在意大利的苹果和谷歌应用商店中已无法下载DeepSeek的应用。爱尔兰数据保护委员会要求DeepSeek公司就其人工智能大模型如何使用用户数据提交报告。英国政府正在研究其对国家安全的影响,澳大利亚政府官员对使用Deepseek做出警告。而韩国监管机构要求DeepSeek 对个人数据的使用做出解释。美国国会议员也表示,需要进一步加强对我国的高性能算力芯片的封锁。

尽管Deepseek的成功为我们展示了用算法进步抵消硬件制约,可以在算力受限情况下形成技术突破,但是另一方面大模型的算力需求越小,总体时长总算力需求也就越大。模型需求的市场规模迅速扩大的同时,也对我国科技产业的进一步发展提出了新的挑战。

一是未来的中美战略竞争结果取决于人工智能与产业端和应用端的结合,而非形成赚取超额利润的人工智能产业泡沫。此次Deepseek造成美股震荡充分说明了这一点。而从美国对乌援助的成果来看,很明显其AI产业尚未对其战略竞争能力形成明显提升。二是抓住模型算力需求变小带来的市场机遇,低算力需求使得大量的场景应用成为可能。我国科技产业应当抓住这一战略机遇,为我所用。三是迅速缩短和西方发达国家的算力差距,摩尔定律放缓为我国的追赶创造了窗口期,应当抓住机会将算法优势转化为算力进步,从而彻底击碎美国对我科技封锁。

7 阅读:815
前沿深度解码

前沿深度解码

欢迎大家关注我,给我点赞!