DeepSeek发布开源周首个成果可优化英伟达GPU效率

新京报 2025-02-24 14:44:59

新京报贝壳财经讯（记者罗亦丹）北京时间2月24日上午，DeepSeek发布了其“开源周”的第一项成果：FlashMLA（直译为快速多头潜在注意力机制）的代码。

据了解，MLA（多头潜在注意力机制）正是DeepSeek降低大模型成本使用的关键技术之一，其可以显著减少大模型训练和推理过程中的内存占用，而FlashMLA则是针对HopperGPU（一种英伟达GPU架构）开发的高效MLA解码内核，其针对可变长度序列进行了优化，目前已投入了生产，其可以使得H800达到3000GB/s内存，实现580TFLOPS（每秒浮点运算次数）计算性能。

贝壳财经记者注意到，根据此前DeepSeek发布V3大模型时公开的技术文档，该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称，FlashMLA能在不损失模型性能的前提下，将缓存体积压缩至原来的1/4，从而大幅降低显存需求。例如，原始需要存储的100GB中间结果，压缩后仅需25GB，通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及，AI推理有望进入千元级硬件跑百亿模型的时代。

12 阅读：2638

评论列表

温习

11

2025-02-24 16:58

deepseek传统意义上来说，他不是ai服务的运营商，而是ai技术的开发商，所以大家不要把访问慢，无响应都怪ds

鹿蜀

6

2025-02-24 16:40

那些喷子说ds蒸馏闭源openai的可以闭嘴了

晨枫画艺

2

2025-02-24 17:05

直接开挂？

九七中毒患者

九七中毒患者

2

2025-02-24 18:16

所有的技术都是资本市场炒作的需要！

Lightning

Lightning

2

2025-02-24 16:45

别吹了，体验别出现无响应再说吧

向日葵和憨八嘎

向日葵和憨八嘎

2

2025-02-24 18:33

[点赞]openai没机会了

昝大钱

昝大钱

2

2025-02-24 19:11

DeesPeek的推出，如同惊雷！比珍珠港事件更具杀伤力！

北人

2

2025-02-24 17:59

我记得英伟达不是断供了吗[笑着哭]那不成废码了吗

九九799

九九799

2

2025-02-24 17:33

我只想说: nice ! [点赞]

史提芬周

2

2025-02-24 22:13

想搞闭源圈钱的大头已经绝望了[笑着哭]

hp

1

2025-02-24 16:58

这回是想把英伟达锤死[呲牙笑]，高端GPU不是那么必要了

布木

1

2025-02-24 17:05

Deepseek让英伟达很难受，美国靠堆GPU太高AI门槛的金融泡沫被戳破。

新京报2003年11月11日创刊，是集“报、刊、网、端、微、屏”传播于一体、媒体融合转型下的现代综合性主流传媒机构。

作者最新文章

1

家里有老人小孩宠物的真的要把#滴露家的#衣物喷雾备上#香氛喷雾#居家好物

2

全国政协委员靳东谈《哪吒2》：票房创纪录对于中国电影行业是强心针

3

全国政协委员冯远征谈“流量演员”如何发展：拼饭圈走不长久

4

全国政协委员张凯丽谈女演员年龄困境：成名不必过早演技更重要

5

全国政协委员周鸿祎：人工智能渗透率急剧提升要重视安全问题

6

全国政协委员刘国梁谈体育去“饭圈化”：拟出台文明观赛倡议书

7

3月4日，全国政协委员甄子丹接受新京报记者采访。对于《哪吒2》大火，他表示，这是一个非常伟大的成就，能够在世界上得到那么好的票房，身为中国电影人非常自豪。在谈到《哪吒2》会给电影人带来哪些启发和期待时，他说，希望也通过自己的电影，让大家看到我们美好的山河，让观众多来中国。

8

#早餐包子馒头吃腻了！！一定要试试这个玉米火腿烧麦，玉米的清香……火腿的浓郁，太好吃太美味了！#早餐吃什么#烧麦#妈呀太香了#速食美食

9

越南进口~NFC非浓缩还原！巨巨巨好喝……#山竹汁#口感特别好#仙女都在喝什么#鲜榨果汁#我超好喝

10

【让“破烂儿”动听，拟音师借《哪吒》大热出圈】《哪吒之魔童闹海》登顶全球动画电影票房榜，让无数影迷为之振奋。最近，@拟音师王磊在社交平台分享了一段给《#哪吒》配音的视频，引发广泛关注，也让#拟音师这一职业走进大众视野。他利用日常收集的废旧物品和材料，通过巧妙操作、创意组合，为影视作品还原和创造出丰富的音效，那一气呵成的动作让网友直呼“太牛了”。前几天，@城市体验官CEO找到这位“声音魔术师”，在他的工作室里完成了一次“拟音挑战”。

科技TOP

1

中方警告无效,DeepSeek被封禁,出手的不是美国,马斯克拒绝收购

2

又一黑马诞生!年入6126亿远超腾讯小米,这个浙江人藏得太深了

3

华为新机正式公布!4月发布,网友:手里的华为mate70突然不香了

4

天玑9300+处理器+6400mAh大电池,它是2000以内性能最强的手机!

5

仅2634元!骁龙8至尊版+6500mAh,新机已开售

6

年后换机别乱买,这三款骁龙8Gen3手机最值得入手,已降至冰点价

7

罗福莉:一个95后天才少女如何从小镇女孩到AI女王

8

6.3英寸+7000mAh,我心动了

9

vivo“续航王”售价创新低,6500mAh+80W,堪称同价位“新卷王”

10

荣耀Magic8曝光:新形态影像+24GB运存,满分答卷

科技最新文章

1

美国施压,高通不会为华为Mate70定制4G版的骁龙8Elite

2

vivoS21Pro亮相:满分四摄+6050mAh,真的会谢

3

DeepSeek预测:未来十年不仅工资高,而且很难失业的12个职业!

4

刘强东拿下小米汽车大单

5

华为刚刚宣布:3月3日,新机再次开售!

6

IQOO新机:Z10Turbo入网,7500mAh+90W快充,双料冠军

7

怪不得魅族现在越来越少人使用了,魅族21PRO真的太难用了

8

vivo“续航王”售价创新低,6500mAh+80W,堪称同价位“新卷王”

9

7600mAh+90W+天玑8400,这新机真猛!

10

DeepSeek公布成本、收入和利润率!最高可日赚346万

热门分类

军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球健康房产家居星座旅游健身时尚科学探索职场育儿股票教育影视情感热点推荐热榜中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期青骄第二课堂少年风超级父母麻辣老师街拍恋爱攻略婚姻情趣正能量