DeepSeek还没有出现“杀手级应用”
哀上李金锐
2025-03-07 17:19:29
自 2025 年初发布以来,DeepSeek 凭借开源、低成本和高性能的特点,迅速成为全球 AI 领域的焦点。
它的核心定位是通用型基础大模型,运用创新的混合专家架构(MoE)、FP8 混合精度训练等技术,在数学推理、代码生成、多模态处理等任务中表现出色。
不过,有专家指出,DeepSeek 还没有催生出真正的 “杀手级应用”,它的价值更多体现在为行业提供底层技术支持,而不是直接创造出某一颠覆性的应用场景。
当前,DeepSeek 的落地应用呈现出 “多点开花但分散化” 的特点
政务与公共服务:DeepSeek 将 12345 热线工单分派的准确率提高到了 95%,辅助公文生成的效率提升了 90%。但这些只是对现有流程进行智能化改造,并没有重构服务模式。
制造业与农业:富士康利用 DeepSeek 实现了机器人协同调度,提升了产能;在河南农业场景中,DeepSeek 实现了 40% 的节水效果。这些应用更像是效率工具,依赖行业原有的数据和需求。
金融与法律:江苏银行借助 DeepSeek,信贷审核效率提高了 20%;湛江司法局能用它自动生成行政复议书。不过,这些仍属于传统业务的 AI 辅助,并没有催生出像 “智能投顾” 这样的新业态。
这些案例都印证了 DeepSeek 作为 “技术基座” 的定位。它通过降低 AI 部署成本(比如企业版 API 费用仅为 ChatGPT 的 1/26),推动了行业的渐进式创新,但目前还没有突破 “工具替代” 的局限。
虽然 DeepSeek 缺乏杀手级应用,但其价值不容小觑
降低门槛:它的训练成本仅 557 万美元,还能用 “低端 GPU” 突破算力限制,打破了美国 AI 依赖高端硬件和大量资本投入的垄断局面,让中小企业和研究机构也能平等参与 AI 领域的竞争。
推动国产化:通过知识蒸馏技术,DeepSeek 把 R1 模型的能力下沉到端侧,华为昇腾、黑芝麻芯片等国产硬件已经实现了本地化部署,促进了从芯片到应用的全国产化 AI 链条的形成。
提供新思路:它的纯强化学习训练路径(比如 R1-Zero 模型),为 AI 自主推理能力的发展提供了新的思路,可能会影响未来模型的发展方向。
DeepSeek 若想从 “基础模型” 阶段更进一步,需要解决两大矛盾
场景深度与通用性的平衡:目前的行业应用大多基于 RAG(检索增强生成)等浅层适配,对垂直领域缺乏深度重构。比如在医疗领域,虽然 DeepSeek 能辅助诊断,但还没有像 AlphaFold 那样,给蛋白质研究带来颠覆性的变革。
用户体验与商业模式的突破:尽管 DeepSeek 的日活用户超过 3000 万,但其 C 端产品还只是比 ChatGPT 更智能一些。真正的杀手级应用应该像 iPhone 重新定义智能手机一样,创造出用户原本没意识到的需求,比如通过多模态交互,重构教育、社交或创作场景。
未来,DeepSeek 可能在这些方向取得突破
端侧 AI 与硬件深度融合:像星纪魅族 Flyme 系统直接集成 DeepSeek,实现无感调用;如果自动驾驶端到端方案能达到特斯拉 FSD 的水平,或许能成为现象级产品。
AI 原生工作流诞生:在核电工程管理、BIM 智能设计等领域,如果能将 DeepSeek 与行业专业知识深度结合,可能会催生出 “AI + 产业” 的新形态。
DeepSeek 的崛起,标志着中国 AI 技术路径走向成熟,它的历史意义可能不逊色于 “两弹一星”。杀手级应用的缺失并非失败,而是技术传播过程中的必经阶段。就像互联网早期只有电子邮件和门户网站一样,AI 的 “Windows 时刻” 或许正在当前分散的行业渗透中孕育。当技术基础足够扎实、生态参与者足够多样时,颠覆性创新自然会到来。
0
阅读:3