微软宣布优化DeepSeek-R1模型，Copilot+PC实现本地化AI推理

IT之家 2025-01-30 12:51:31

IT之家1月30日消息，人工智能正加速向着边缘计算领域发展，Copilot+PC在其中扮演着重要角色。随着DeepSeekR1出现，微软也意识到了这一模型可能会带来了一系列变革。

微软今日发文，宣布推出针对NPU优化的DeepSeek-R1（IT之家注：已在AzureAIFoundry和GitHub上提供），首批将面向搭载高通骁龙X芯片的Copilot+PC推出，随后是英特尔酷睿Ultra200V等平台。

微软表示，首个版本DeepSeek-R1-Distill-Qwen-1.5B将在AIToolkit中提供，7B和14B版本也将很快推出，从而帮助开发者充分利用Copilot+PC中强大的NPU配置。

微软表示，Copilot+PC上的NPU开启了一种新的范式。在这种范式下，生成式AI不仅可以在被调用时执行，还可以支持半连续运行的服务。这使开发者能够利用AI推理引擎来构建主动和持续的体验。微软表示：

通过我们在PhiSilica上的工作，我们实现了高效的推理——在首次生成token的时间和吞吐率方面表现出色，同时对电池续航和PC资源消耗的影响降至最低。针对NPU优化的DeepSeek模型借鉴了该项目的多项关键经验和技术，包括如何分离模型的各个部分以实现性能与效率的最佳平衡、低比特率量化以及将Transformer映射到NPU。此外，我们还利用WindowsCopilotRuntime（WCR）通过ONNXQDQ格式在多样化的Windows生态系统中实现扩展。

微软表示，要想在Copilot+PC上体验DeepSeek只需下载AIToolkitVSCode扩展即可；以ONNXQDQ格式优化的DeepSeek模型将很快出现在AIToolkit的模型目录中（直接从AzureAIFoundry中拉取）。