最高日赚346万元!DeepSeek商业模式受质疑,官方回应

TechWeb 2025-03-02 10:30:56

【TechWeb】3月1日,DeepSeek在开源周最后一天抛出压轴成果——V3/R1推理系统理论日利润高达47.5万美元(约合346万元人民币)。这一惊人数字引发人们对于AI模型商业化的讨论。

最高日赚346万元

昨日,DeepSeek官方发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。

DeepSeek统计了2月27日24点到2月28日24点,最近的24小时里DeepSeek V3 和 R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定GPU租赁成本为2美元/小时,DeepSeek每日总成本为8.7万美元(折合人民币约63万元)。

如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为56.2万美元(折合人民币约409万元),成本利润率高达545%。这意味着,理论上,DeepSeek每日净赚47.5万美元,约合人民币346万元。

商业模式受质疑,潞晨科技暂停DeepSeek API服务

就在DeepSeek披露大规模部署成本和收益之后,潞晨科技突然宣布:暂停DeepSeek API服务。

潞晨科技官方公众号发文称,“潞晨云将在一周后停止提供DeepSeek API服务,请尽快用完您的余额。如果没用完,我们全额退款。”

公开资料显示,潞晨科技是一家致力于“解放AI生产力”的全球性企业,核心产品包括大模型训练推理系统Colossal-AI和视频大模型Open-Sora,此前业务也涉及卖DeepSeek API。

2月4日,潞晨科技宣布携手华为昇腾,联合发布基于昇腾算力的DeepSeek-R1系列推理API,及云镜像服务。

但在2月9日,潞晨科技CEO尤洋发文指出,“MaaS (Model as a Service)在中国短时间内可能是最差的商业模式。阿里云/百度云/腾讯云等相互内卷低价和免费,满血版的DeepSeek R1每百万token官方也只能收到16元……如果满血版的DeepSeek R1每日输出1000亿token,那么每月的机器成本是4.5亿,亏损4亿!用户越多,亏损越多。”

在DeepSeek首次公开披露自己的成本利润率等关键信息之后,尤洋发文提到,DeepSeek这篇文章中的数据对计算MaaS成本没有任何参考价值。文章中把DeepSeek网页、APP和MaaS API的token数加在一起计算,意味着对成本的摊薄。

尤洋表示,DeepSeek的MaaS要想有一个这么高满负荷的状态,必须要让自己的APP和网页始终超负荷运转。MaaS是ToB的,是服务APP,最大的问题是机器利用率的不确定性以及自己没有模型壁垒而承受的低毛利负毛利价格战。

据第一财经报道,尤洋认为,OpenAI收高额月费才是唯一可持续的商业模式。目前,DeepSeek采用开源免费+分层B端收费模式,通过开放核心技术吸引开发者共建生态,核心盈利来源于企业定制化服务以及母公司的资金支持,而OpenAI基本坚持闭源+订阅制分层收费,通过ChatGPT Plus等订阅服务(200美元/月)和API调用收费实现盈利,开源了一些早期模型比如GPT2。

日前,OpenAI发布GPT-4.5大模型,API价格为每百万Tokens 75美元,相比DeepSeek的正常价格,GPT-4.5输入价格达到280倍。如果以DeepSeek前几天发布的API淡季折扣价计算,GPT-4.5输入价格(缓存命中)是其1000多倍。

DeepSeek回应

对于盈利问题,DeepSeek其实多次说过自家的API不赔本。

去年5月,时任DeepSeek员工的罗福莉在知乎透露,“大家不用担心模型断更,也不用担心API涨价(目前就是大规模服务的价格,不亏本,利润率超50%)。

DeepSeek CEO梁文锋也曾在接受媒体采访时表示,“我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。”

在最新的《DeepSeek-V3/R1推理系统概览》文章中,DeepSeek披露理论上一天的总收入为56.2万美元,成本利润率高达545%。“当然实际上没有这么多收入,因为 V3 的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。”

而DeepSeek能做到这一利润率,部分原因是团队将优化做到极致,实现了对GPU的最大限度使用。DeepSeek在文章一开头就写道:“DeepSeek-V3 / R1推理系统的优化目标是:更大的吞吐,更低的延迟。”

为此DeepSeek的方案是使用大规模跨节点专家并行(Expert Parallelism /EP),EP提高了GPU矩阵乘法的效率,提高吞吐。此外,EP使得专家分散在不同的GPU上,每个GPU只需要计算很少的专家(因此更少的访存需求),从而降低延迟。

硅基流动创始人袁进辉对此评论称,“DeepSeek 官方披露大规模部署成本和收益,又一次颠覆了很多人认知。现在很多供应商做不到这个水平,主要是V3/R1架构和其它主流模型差别太大了,由大量小Expert(专家)组成,导致瞄准其它主流模型结构开发的系统都不再有效,必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。”

最新消息显示,今日早间,尤洋删除了其质疑DeepSeek的相关内容,并在微博和知乎上发文道歉,称“本人昨天情绪太冲动,说了一些让人误解deepseek infrastructure团队的话。deepseek infrastructure团队技术一流并给开源社区做出巨大贡献。本人诚挚道歉,已经删除不当表述,感谢大家提醒!”

-1 阅读:259

评论列表

用户11xxx35

用户11xxx35

4
2025-03-03 23:41

相信尤洋说的,现在不赚钱,能下场的只能是大佬级别。问题是初期阶段是培育用户过程,用户还不会用,没有受益,也不可能接受高价。这种投入国家要考虑介入,避免初期投资过大,后期垄断高价。