大厂AI专家解读deepseek - 财经资讯(世良情感网)

DeepSeek R1 在未进行市场推广的情况下，登顶中美 App Store 总榜第一，超越 ChatGPT，展现了强大的口碑效应和市场影响力。 DeepSeek V3 对标 GPT-4，R1 对标 GPT-4.0 的 O1，在数学、代码、通识、日常问答等领域表现出色，具备 COT（Chain of Thought）自思考能力和完善的推理能力。预训练成本与市场误解：DeepSeek 的训练成本并非远低于 GPT-4，其预训练效率提升约 20%-30%，主要得益于计算效率优化，绕过 CUDA，直接进行底层编程，而非部分自媒体所称的数百倍提升。数据训练优化：DeepSeek 通过强化学习替代传统标注数据，降低了训练成本，但其在专业领域知识的自推理能力仍存在局限，需要进一步优化。开源对市场的影响：降低国内企业进入大模型领域的门槛，加速大厂技术进展。迫使大厂调整商业模式，可能导致 API 价格下降，利润空间收缩。促进 B 端企业采用 DeepSeek 进行业务创新，推动 AI 落地应用发展。推理效率提升：DeepSeek 的预推理技术优化了推理速度，一个 token 响应时间可达 15 毫秒，显著提高了推理效率，尤其在电商推荐等领域表现突出。国内市场格局变化：大型互联网公司（如字节、百度、腾讯等）可能基于 DeepSeek 调整 AI 战略，探索新的商业模式。传统行业企业（如汽车、制造业、电商等）或加快自研大模型的步伐，减少对国外大模型的依赖。创业型 AI 企业可能围绕 DeepSeek 生态，提供 AI 解决方案和服务，加速行业 AI 化。 Q&A 重点讨论 1. DeepSeek R1 的发布对中美市场的影响？国内头部大厂如何评价其成本和 AI 市场影响？ DeepSeek R1 的成功反映出国内大模型技术已具备全球竞争力，并可能重塑 AI 市场格局。中台在 AI 落地中的作用：在大厂内部，中台负责 AI 能力评估、资源分配、并发能力管理等，需要确保 AI 业务应用的可行性和商业化路径。 B 端市场趋势：目前国内 AI API 供应主要由创业公司（“六小虎”“六小龙”）和大厂（BAT、字节等）主导。 B 端应用相对 C 端滞后一个技术阶段，需在 C 端验证成功后再推广至 B 端。 DeepSeek 开源可能加速 B 端大模型应用推广，但对技术服务商和大厂 API 业务形成冲击。 2. DeepSeek 的技术突破及市场误解预训练效率：DeepSeek V3 使用 14 万亿 tokens，约为 GPT-4 的 2/3，训练时间 52 天，使用 2000 多块 H800，相比 GPT-4（1 万块 A100，20 天训练）提升约 20%-30%，远非自媒体所称的数百倍提升。计算效率优化： DeepSeek 采用 C++ 和汇编级优化，绕过 CUDA，直接进行底层 P 层编程，实现更高效的计算。由于该优化未完全开源，其他企业无法直接复用这一技术优势。数据训练方式：通过强化学习替代人工标注数据，减少训练成本。但在数学、教育等专业领域，仍需额外数据标注和精调，以适配考试大纲等要求。 3. DeepSeek 开源对国内大厂的影响（1）对大厂 AI 业务的冲击闭源大模型策略受挑战：百度等企业强调闭源 API 盈利模式，DeepSeek 开源可能导致大厂 API 价格下降，盈利模式调整。大厂可能需要重新定义 B 端 AI 业务策略，提供更具竞争力的 API 服务或定制化 AI 解决方案。 C 端 AI 应用加速变革：过去一年，京东等电商平台 AI 功能逐渐减少，DeepSeek 可能重塑电商推荐、内容创作等 AI 业务。 C 端 APP 可能涌现基于 DeepSeek 的 AI 赋能服务，如地方团购、智能客服、个性化推荐等。（2）技术路径与组织架构调整部分大厂可能调整资源分配，投入 DeepSeek 相关技术优化，以提升 AI 业务竞争力。短期内，DeepSeek 可能成为国内 AI 企业的标准选项，形成类似于 Llama、Mistral 在国外 AI 生态中的影响力。未来半年内，国内 AI 创业公司可能基于 DeepSeek 进行快速应用创新，催生新一批 AI 技术服务商。 4. DeepSeek 的技术未来及发展方向 COT（Chain of Thought）技术的重要性： OpenAI 的 COT 并未完全开源，国内部分大厂如通义千问在 COT 方面也未公开详细实现。DeepSeek 的开源可能加速国内自推理技术发展，提升大模型的逻辑推理能力。未来 AI 发展方向：目前大模型仍处于枚举阶段，即基于已有数据进行最优解推理。下一阶段 AI 发展方向是自规划能力，即能主动构建实验、设计方案，如解答数学、物理实验题目。 DeepSeek 的自推理能力仍有较大优化空间，但已为国内 AI 发展提供了重要技术突破。 DeepSeek 的发布标志着国内大模型技术取得重要进展，可能加速 AI 行业的市场变革。大厂面临商业模式和技术路线调整压力，需重新评估闭源 API 的盈利能力，并可能转向 DeepSeek 生态进行二次开发。国内 AI 创业环境将迎来新一轮增长，DeepSeek 降低了大模型应用门槛，可能催生一批基于大模型的新兴企业。技术突破方面，DeepSeek 在计算效率、数据训练方式上具有独特优势，但在专业领域知识、COT 推理能力等方面仍有提升空间。