2月6日晚间,华为中国官方微博发文称,华为DCSAI全栈解决方案中的重要产品—ModelEngineAI平台,全面支持DeepSeek大模型R1&V3和蒸馏系列模型的本地部署与优化,加速客户AI应用快速落地。
华为称,ModelEngine作为大模型训练、推理和应用开发的AI平台,提供从数据预处理到模型训练、优化及部署的一站式服务。此次ModelEngine基于昇腾AI芯片,通过推理框架优化和MoE存算协同,提供动态换入换出和全局统一缓存,实现推理高并发和低时延,用户通过ModelEngine体验DeepSeek更加快速高效的推理能力。
ModelEngine全面支持DeepSeek系列模型R1&V3671B以及蒸馏系列模型,开发者可通过ModelEngine实现“一键部署”,省去硬件选型、兼容性验证和环境配置等繁琐步骤,大幅降低企业AI应用门槛。此外,ModelEngine通过其高度的开放性和模块化设计,极大地缩短了DeepSeek的本地部署时间。
ModelEngine提供负载均衡、模型安全接入、多用户配额管理等高阶特性,支持大规模生产环境下的稳定运行。某证券公司引入DCSAI全栈解决方案后,运维成本降低42%。
值得注意的是,2月4日晚间,华为计算微信公众号发文表示,DeepSeek-R1系列模型的开源,因其出色的性能和低廉的开发成本,已引发全球的热切讨论和关注。潞晨科技携手昇腾,联合发布基于昇腾算力的DeepSeek-R1系列推理API,及云镜像服务。
华为计算称,在本次发布中,潞晨以自研国产推理引擎为技术底座,成功实现了昇腾算力与DeepSeek-R1系列模型的推理适配优化,性能表现与使用高端GPU持平,为开发者提供高效、灵活、稳定的AI推理服务,助力企业实现降本增效,加速智能业务基于中国软硬件体系快速部署落地。
据华为云官方微信公众号2月1日消息,DeepSeek-R1开源后引发全球用户和开发者关注。经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。
该服务具备以下特点:
1、得益于自研推理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型可获得持平全球高端GPU部署模型的效果。
2、提供稳定的、生产级服务能力,让模型能够在⼤规模生产环境中稳定运行,并满足业务商⽤部署需求。华为云昇腾云服务可以提供澎湃、弹性、充足的算力。
另据国家超算互联网平台消息,目前DeepSeek-R1、V3、Coder等系列模型已上线该平台。用户无需下载到本地部署,即可在线完成DeepSeek系列模型的推理、部署及定制化训练与开发。
据深圳商报,为促进超算算力一体化运营,打造国家算力底座,科技部于2023年启动了国家超算互联网部署工作,2024年4月平台正式上线。截至目前,已有数百家应用、数据、模型等服务商入驻。
此次上线的模型涵盖了1.5B到14B的蒸馏模型,以及7B到32B的DeepSeekChatbot可视化界面,近期还会陆续上线32B、70B等更多版本。
超算互联网官微2月4日晚间发布文章称,DeepSeek-R1因其游刃有余的用户需求响应能力,尤其是其独特的“深度思考(DeepThink)”模式及卓越的推理能力,在这个春天绝响全球。为了让更多领域的用户切实便捷地进行体验,超算互联网平台第一时间上线了DeepSeekChatbot可视化界面功能。
据证券时报,DeepSeek的热度居高不下。此前,英伟达、微软、亚马逊等AI巨头纷纷宣布,已接入DeepSeek。
国内几大云服务平台——华为云、腾讯云、阿里云、百度智能云、京东云、字节跳动旗下火山引擎等,也相继宣布接入DeepSeek系列模型,部分平台推出了超低价格方案及限时免费服务。
国内三大运营商旗下的联通云、天翼云、移动云等平台也宣布接入DeepSeek模型。
1月24日,著名投资公司A16z的创始人马克·安德森发文称,Deepseek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一,而且还是开源的,它是给世界的一份礼物。最具煽动性的评价来自ScaleAI创始人亚历山大·王。他说:过去十年来,美国可能一直在AI竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。
DeepSeek日前发布其最新开源模型DeepSeek-R1,用较低的成本达到了接近于OpenAI开发的GPT-o1的性能。这一进展破解了全球人工智能产业长期以来“堆算力”的路径依赖,其影响还波及了资本市场。
国际投行摩根士丹利表示,“更大(的模型)不再等于更聪明”,DeepSeek通过显著提高数据质量和改进模型架构,展示了一条与之前大模型不同的高效训练途径。摩根士丹利说,DeepSeek的模型现在低成本优势突出,与国际知名大模型相比,其成本大约低了一个数量级。
国泰君安指出,DeepSeek-R1以MITLicense完全开源模型权重,并允许商用模型蒸馏,为开发者提供了二次创新的自由空间。这一策略推动中国首次在通用大模型开源领域占据技术制高点,增强全球AI话语权。同时,开源生态可能加速行业技术路线趋同,通用大模型因同质化加剧竞争,只有拥有真正领先技术的企业才能在这种趋势中留存。因此,此次国产开源模型的突破有望重塑全球AIGC技术路线及产业格局。
每日经济新闻综合证券时报、深圳商报、华为中国官方微博、公开资料