大厂AI专家解读deepseek
全产业
2025-02-02 06:00:34
DeepSeek R1 在未进行市场推广的情况下,登顶中美 App Store 总榜第一,超越 ChatGPT,展现了强大的口碑效应和市场影响力。
DeepSeek V3 对标 GPT-4,R1 对标 GPT-4.0 的 O1,在数学、代码、通识、日常问答等领域表现出色,具备 COT(Chain of Thought)自思考能力 和 完善的推理能力。
预训练成本与市场误解:DeepSeek 的训练成本并非远低于 GPT-4,其预训练效率提升约 20%-30%,主要得益于 计算效率优化,绕过 CUDA,直接进行底层编程,而非部分自媒体所称的数百倍提升。
数据训练优化:DeepSeek 通过强化学习替代传统标注数据,降低了训练成本,但其在专业领域知识的自推理能力仍存在局限,需要进一步优化。
开源对市场的影响:
降低国内企业进入大模型领域的门槛,加速大厂技术进展。
迫使大厂调整商业模式,可能导致 API 价格下降,利润空间收缩。
促进 B 端企业采用 DeepSeek 进行业务创新,推动 AI 落地应用发展。
推理效率提升:DeepSeek 的预推理技术优化了推理速度,一个 token 响应时间可达 15 毫秒,显著提高了推理效率,尤其在电商推荐等领域表现突出。
国内市场格局变化:
大型互联网公司(如字节、百度、腾讯等)可能基于 DeepSeek 调整 AI 战略,探索新的商业模式。
传统行业企业(如汽车、制造业、电商等)或加快自研大模型的步伐,减少对国外大模型的依赖。
创业型 AI 企业可能围绕 DeepSeek 生态,提供 AI 解决方案和服务,加速行业 AI 化。
Q&A 重点讨论
1. DeepSeek R1 的发布对中美市场的影响?国内头部大厂如何评价其成本和 AI 市场影响?
DeepSeek R1 的成功 反映出国内大模型技术已具备全球竞争力,并可能重塑 AI 市场格局。
中台在 AI 落地中的作用:在大厂内部,中台负责 AI 能力评估、资源分配、并发能力管理等,需要确保 AI 业务应用的可行性和商业化路径。
B 端市场趋势:
目前国内 AI API 供应主要由创业公司(“六小虎”“六小龙”)和大厂(BAT、字节等)主导。
B 端应用相对 C 端滞后一个技术阶段,需在 C 端验证成功后再推广至 B 端。
DeepSeek 开源可能加速 B 端大模型应用推广,但对技术服务商和大厂 API 业务形成冲击。
2. DeepSeek 的技术突破及市场误解
预训练效率:DeepSeek V3 使用 14 万亿 tokens,约为 GPT-4 的 2/3,训练时间 52 天,使用 2000 多块 H800,相比 GPT-4(1 万块 A100,20 天训练)提升约 20%-30%,远非自媒体所称的数百倍提升。
计算效率优化:
DeepSeek 采用 C++ 和汇编级优化,绕过 CUDA,直接进行底层 P 层编程,实现更高效的计算。
由于该优化 未完全开源,其他企业无法直接复用这一技术优势。
数据训练方式:
通过强化学习替代人工标注数据,减少训练成本。
但在 数学、教育等专业领域,仍需额外数据标注和精调,以适配考试大纲等要求。
3. DeepSeek 开源对国内大厂的影响
(1)对大厂 AI 业务的冲击
闭源大模型策略受挑战:
百度等企业强调 闭源 API 盈利模式,DeepSeek 开源可能导致大厂 API 价格下降,盈利模式调整。
大厂可能需要 重新定义 B 端 AI 业务策略,提供更具竞争力的 API 服务或定制化 AI 解决方案。
C 端 AI 应用加速变革:
过去一年,京东等电商平台 AI 功能逐渐减少,DeepSeek 可能 重塑电商推荐、内容创作等 AI 业务。
C 端 APP 可能涌现基于 DeepSeek 的 AI 赋能服务,如地方团购、智能客服、个性化推荐等。
(2)技术路径与组织架构调整
部分大厂可能调整资源分配,投入 DeepSeek 相关技术优化,以提升 AI 业务竞争力。
短期内,DeepSeek 可能成为国内 AI 企业的标准选项,形成类似于 Llama、Mistral 在国外 AI 生态中的影响力。
未来半年内,国内 AI 创业公司可能基于 DeepSeek 进行快速应用创新,催生新一批 AI 技术服务商。
4. DeepSeek 的技术未来及发展方向
COT(Chain of Thought)技术的重要性:
OpenAI 的 COT 并未完全开源,国内部分大厂如通义千问在 COT 方面也未公开详细实现。DeepSeek 的开源可能 加速国内自推理技术发展,提升大模型的逻辑推理能力。
未来 AI 发展方向:
目前大模型仍处于 枚举阶段,即基于已有数据进行最优解推理。
下一阶段 AI 发展方向是 自规划能力,即能主动构建实验、设计方案,如解答数学、物理实验题目。
DeepSeek 的自推理能力仍有较大优化空间,但已为国内 AI 发展提供了重要技术突破。
DeepSeek 的发布标志着国内大模型技术取得重要进展,可能加速 AI 行业的市场变革。
大厂面临商业模式和技术路线调整压力,需重新评估闭源 API 的盈利能力,并可能转向 DeepSeek 生态进行二次开发。
国内 AI 创业环境将迎来新一轮增长,DeepSeek 降低了大模型应用门槛,可能催生一批基于大模型的新兴企业。
技术突破方面,DeepSeek 在计算效率、数据训练方式上具有独特优势,但在 专业领域知识、COT 推理能力等方面仍有提升空间。
0
阅读:11