整个春节假期,我眼睁睁看着 DeepSeek 从“全民狂欢”变成“全民卡顿”——官网十问九崩,还有谁没被“服务器正忙,请稍后重试”的提示,搞崩溃过。

开工后短短几天,我又眼睁睁看着 DeepSeek 从“云厂商撒币内卷”烧成“算力芯片适配闪电战”,从“产品经理 PPT 画饼”燎成“三百六十行生产力真香”。
仅 20 天,从“全民狂欢”卷到“全民重构业务流水线”。
我每天一打开电脑和手机,不是聊 Deepseek 的,就是测 Deepseek 的,或者开发 Deepseek 的。
甚至可以这么说,大家都 All in DeepSeek 了。这是继两年前的 ChatGPT 时刻后,第二次出现现象级 AI 大潮,也被称为 DeepSeek 时刻。
Deepseek 官网懂得都懂,现在已经不能充值了,就算有余额,API 也是调不通不可用的状态。

接入 Deepseek 的平台厂商也是蹭蹭蹭地往外冒,官宣上线看得我目不暇接,保守估计得有上百家。平台们百万千万的 token 免费送,拉新返 Token,各种卷价格和卷限额。
一边是程序员们加班加点地适配模型,键盘都敲冒烟了;一边是广大用户使用过程各种卡顿,在各个平台间反复横跳和重试,还要睁大眼睛甄别是不是满血版 671B。
我给大家算笔账:R1 一次推理平均消耗 4K tokens,送的 1000 万 tokens 只够调用 2500 次。假设你的业务每小时需要处理 5000 次请求,这点额度只够撑半个小时。更扎心的是,很多平台对免费额度限速——高峰时段排队 2 小时,生成结果 5 秒崩。
是不是突然就觉得一千万也不香了。

这几天我们一直在各种平台体验 DeepSeek,想帮大家多找一些靠谱的上车姿势。 今天被family群小伙伴安利了讯飞。

上线 DeepSeek R1 不稀奇,这玩意儿给卷到推理免费可还行?而且他们平台上竟然支持精调。目前为止,是国内首家支持DeepSeek模型精调服务。
我去讯飞星辰官网看了下——

首页就能看到 DeepSeek-R1 和 Deepseek-V3,鼠标放在模型卡片上还能看到“精调”、“API 调用”、“体验”和“一键部署”四个选项。
先上手体验一下——
提示词:土豆英文单词里有几个 o
,时长00:36
比较有意思的是,我发现讯飞这个不是一个字一个字的吐,而是一句话一句话的吐。这个速度横向来看,已经属于挺能打的了。
除了满血版 V3 和 R1,讯飞这次一口气儿推出 5 个尺寸的蒸馏版 R1 模型,一口气儿把 deepseek 全家桶上了。
DeepSeek-R1-Distill-Qwen-1.5BDeepSeek-R1-Distill-Qwen-7BDeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Qwen-14BDeepSeek-R1-Distill-Qwen-32B这里我在它的网站上点 API 调用,创建一个 test 应用简单测一下,就来到这个页面——

比较有意思的是上图中的红圈——
这里剩余 token 数显示是 ∞,没错,就是那个数学符号“无穷大”。
免费还不限量,这相当于给每个开发者一张无限额度的黑卡啊。

不过,真正让我觉得讯飞这波操作有意思的,是精调功能。
我觉得讯飞做这个功能是对的,如果说能让每个人用上 DeepSeek 是第一步需求,那精调就是之后的第二步需求了。
毕竟,要让基础模型充分适配业务场景,学习个性化知识和能力,精调依然是解决该问题来说非常重要的范式。
简单提一下精调流程——
点新建模型,就会弹出精调配置页面,base 模型有 1.5B、7B、8B 三种参数量可选。

训练方法、学习率、epoch 这些都可以按需配置。

如果你要微调满血版也支持,但得先和官方申请,填一下申请单。上面 4 个选项里有一个“精调”,入口就在这。

虽然微调不是免费的,但也能理解,毕竟现在各家企业厂商都在算力慌,推理都顾及不暇。
但是完全不耽误你可以先用满血版跑通业务逻辑,真有定制需求再启动精调。借着这一个月白嫖时机,跑通流水线,验证垂直业务场景下业务,岂不妙哉。

我是觉得,在绝大多数接入方都只提供标准 API 调用、一键部署的时候,提前卡位模型定制能力的玩家,已经在酝酿下一波技术差了。
据我所知,到目前讯飞是第一家且唯一一家支持微调的厂商。
普遍对讯飞的印象,可能还是“国家队”、“语音技术大佬”这些标签,我今天全面体验了下他们产品,能感受到在 AI 生态建设的努力,讯飞开放平台已经发布了 806 项 AI 技术和方案,积累了大量行业 Know-How,还有很多标杆应用。
结合 Deepseek,一些组合玩法便可以诞生了。
比如做 PPT 这件事儿——
第一步:用 DeepSeek 生成调研文本;
提示词:帮我生成一份人形机器人深度研究报告
,时长01:03
第二步:粘贴到讯飞智文里,点击一键生成。
,时长00:30
再比如——
用 DeepSeek+讯飞绘镜一键生成元宵视频,先用 DeepSeek R1 生成脚本,粘贴到绘镜里,一路点点点,非常简单就完成一条短视频制作。
,时长00:13
另外,讯飞星火智能体平台也已经全面接入 DeepSeek 了,自己开发的智能体可以调用 R1 和 V3 进行对话。

这里顺便贴一下这几个产品的链接——
智文:https://zhiwen.xfyun.cn/绘镜:https://typemovie.art/#/dashboard星火智能体:https://xinghuo.xfyun.cn/星辰Maas平台:https://training.xfyun.cn/modelSquare
还有用 DeepSeek+ 讯飞绘文做小红书,星火智能体平台和企业私域知识库使用 R1 和 V3对话,推理和生成的能力大大提升。这里就不一一列举了,这个玩法上限取决于使用者的脑洞和需求洞察能力。
最后,多啰嗦几句。
我觉得,DeepSeek 生态爆发至今,最危险的错觉就是认为“模型能力过剩”。现实恰恰相反:当所有企业都能调用同一套 API、部署同一套底层模型时,业务护城河则更多来自对垂直场景的毫米级雕刻。
讯飞这招“不限量免费 + 精调工具链”的组合拳,本质上是在算力红海中划出一条新赛道——这里不拼谁薅的羊毛多,而是提前一步布局,为“AI 雕刻家”提前铺路,帮助其更快的在 DeepSeek 生态中雕刻出业务壁垒。
或许这才是 AI 普惠最该有的样子:
让技术回归工具本质,把创新交给真实需求。