大厂AI专家解读deepseek

全产业 2025-02-02 06:00:34
DeepSeek R1 在未进行市场推广的情况下,登顶中美 App Store 总榜第一,超越 ChatGPT,展现了强大的口碑效应和市场影响力。 DeepSeek V3 对标 GPT-4,R1 对标 GPT-4.0 的 O1,在数学、代码、通识、日常问答等领域表现出色,具备 COT(Chain of Thought)自思考能力 和 完善的推理能力。 预训练成本与市场误解:DeepSeek 的训练成本并非远低于 GPT-4,其预训练效率提升约 20%-30%,主要得益于 计算效率优化,绕过 CUDA,直接进行底层编程,而非部分自媒体所称的数百倍提升。 数据训练优化:DeepSeek 通过强化学习替代传统标注数据,降低了训练成本,但其在专业领域知识的自推理能力仍存在局限,需要进一步优化。 开源对市场的影响: 降低国内企业进入大模型领域的门槛,加速大厂技术进展。 迫使大厂调整商业模式,可能导致 API 价格下降,利润空间收缩。 促进 B 端企业采用 DeepSeek 进行业务创新,推动 AI 落地应用发展。 推理效率提升:DeepSeek 的预推理技术优化了推理速度,一个 token 响应时间可达 15 毫秒,显著提高了推理效率,尤其在电商推荐等领域表现突出。 国内市场格局变化: 大型互联网公司(如字节、百度、腾讯等)可能基于 DeepSeek 调整 AI 战略,探索新的商业模式。 传统行业企业(如汽车、制造业、电商等)或加快自研大模型的步伐,减少对国外大模型的依赖。 创业型 AI 企业可能围绕 DeepSeek 生态,提供 AI 解决方案和服务,加速行业 AI 化。 Q&A 重点讨论 1. DeepSeek R1 的发布对中美市场的影响?国内头部大厂如何评价其成本和 AI 市场影响? DeepSeek R1 的成功 反映出国内大模型技术已具备全球竞争力,并可能重塑 AI 市场格局。 中台在 AI 落地中的作用:在大厂内部,中台负责 AI 能力评估、资源分配、并发能力管理等,需要确保 AI 业务应用的可行性和商业化路径。 B 端市场趋势: 目前国内 AI API 供应主要由创业公司(“六小虎”“六小龙”)和大厂(BAT、字节等)主导。 B 端应用相对 C 端滞后一个技术阶段,需在 C 端验证成功后再推广至 B 端。 DeepSeek 开源可能加速 B 端大模型应用推广,但对技术服务商和大厂 API 业务形成冲击。 2. DeepSeek 的技术突破及市场误解 预训练效率:DeepSeek V3 使用 14 万亿 tokens,约为 GPT-4 的 2/3,训练时间 52 天,使用 2000 多块 H800,相比 GPT-4(1 万块 A100,20 天训练)提升约 20%-30%,远非自媒体所称的数百倍提升。 计算效率优化: DeepSeek 采用 C++ 和汇编级优化,绕过 CUDA,直接进行底层 P 层编程,实现更高效的计算。 由于该优化 未完全开源,其他企业无法直接复用这一技术优势。 数据训练方式: 通过强化学习替代人工标注数据,减少训练成本。 但在 数学、教育等专业领域,仍需额外数据标注和精调,以适配考试大纲等要求。 3. DeepSeek 开源对国内大厂的影响 (1)对大厂 AI 业务的冲击 闭源大模型策略受挑战: 百度等企业强调 闭源 API 盈利模式,DeepSeek 开源可能导致大厂 API 价格下降,盈利模式调整。 大厂可能需要 重新定义 B 端 AI 业务策略,提供更具竞争力的 API 服务或定制化 AI 解决方案。 C 端 AI 应用加速变革: 过去一年,京东等电商平台 AI 功能逐渐减少,DeepSeek 可能 重塑电商推荐、内容创作等 AI 业务。 C 端 APP 可能涌现基于 DeepSeek 的 AI 赋能服务,如地方团购、智能客服、个性化推荐等。 (2)技术路径与组织架构调整 部分大厂可能调整资源分配,投入 DeepSeek 相关技术优化,以提升 AI 业务竞争力。 短期内,DeepSeek 可能成为国内 AI 企业的标准选项,形成类似于 Llama、Mistral 在国外 AI 生态中的影响力。 未来半年内,国内 AI 创业公司可能基于 DeepSeek 进行快速应用创新,催生新一批 AI 技术服务商。 4. DeepSeek 的技术未来及发展方向 COT(Chain of Thought)技术的重要性: OpenAI 的 COT 并未完全开源,国内部分大厂如通义千问在 COT 方面也未公开详细实现。DeepSeek 的开源可能 加速国内自推理技术发展,提升大模型的逻辑推理能力。 未来 AI 发展方向: 目前大模型仍处于 枚举阶段,即基于已有数据进行最优解推理。 下一阶段 AI 发展方向是 自规划能力,即能主动构建实验、设计方案,如解答数学、物理实验题目。 DeepSeek 的自推理能力仍有较大优化空间,但已为国内 AI 发展提供了重要技术突破。 DeepSeek 的发布标志着国内大模型技术取得重要进展,可能加速 AI 行业的市场变革。 大厂面临商业模式和技术路线调整压力,需重新评估闭源 API 的盈利能力,并可能转向 DeepSeek 生态进行二次开发。 国内 AI 创业环境将迎来新一轮增长,DeepSeek 降低了大模型应用门槛,可能催生一批基于大模型的新兴企业。 技术突破方面,DeepSeek 在计算效率、数据训练方式上具有独特优势,但在 专业领域知识、COT 推理能力等方面仍有提升空间。
0 阅读:11
全产业

全产业

感谢大家的关注