华为存储携手中科弘云发布AI推理加速方案破解长序列推理难题 为破解上述困境,华为数据存储与中科弘云发挥双方技术优势,强强联合推出AI推理加速联合解决方案。 该方案深度融合华为OceanStor A系列存储产品、华为UCM推理记忆数据管理技术以及中科弘云HyperCN平台能力,通过KV Cache多级缓存管理、秒级算力调度、分钟级大模型推理部署及全流程AI工具链,把智能算力精准输送至业务一线,为企业业务赋能。 该联合方案的核心优势如下: l 异构管理:支持平台、计算与存储的协同联动,适配英伟达、寒武纪等多元AI算力,兼容MindSpore/vLLM/SGLang等主流框架,并通过Kubernetes与华为OceanStor A系列存储实现无缝对接。 l 算力调度:对算力资源进行细粒度切分与池化处理,按需灵活调度,实现资源利用率最大化;具备集群作业调度、运维监控、故障恢复等功能,支持分钟级任务恢复与系统健康监测。 l 推理加速:依托UCM将KV Cache持久化至华为OceanStor A系列存储,实现推理记忆全量保存,减少重复计算;融合Prefix Cache、GSA稀疏加速等算法,有效降低首Token时延(TTFT),让长序列推理吞吐与体验得到倍数级提升。 l 端到端AI工具链:覆盖数据管理标注、算法开发、大小模型训练推理、智能体开发全流程,支持传统机器学习与深度学习开发,实现AI资产的统一建设与集中管理。








