国产算力崛起:昇腾一骑绝尘,群雄争锋

薪科技快评 2024-04-10 19:08:34
国内算力:昇腾一马当先,各家竞相发展

昇腾智算领航,国内市占率高达79%!目前已大规模部署于华为云和全国28个城市的智能算力中心,赋能各行业智慧升级。

AI算力行业浪潮汹涌,势不可挡。相比于拥有千亿参数的GPT-3.5,GPT-4参数规模达万亿。国内大模型厂商若欲追赶,需全面提升技术实力,迈上新台阶。

1. 昇腾计算产业链

华为推出两款 AI 芯片产品:310 和 910B。910B 主打训练,具备 FP32 和 FP16 双精度算力,满足大模型训练需求。单卡和单服务器性能媲美 A800/A100,提供强大的 AI 计算能力。

昇腾计算产业依托昇腾AI芯片和基础软件,构建全栈AI计算基础设施、行业应用和服务,提供一站式AI解决方案。其核心模块包括昇腾AI芯片、硬件平台、CANN框架、计算框架、应用使能、工具链、运维工具,覆盖产业链全景,赋能各行业智能化转型。

华为昇腾AI计算架构

华为昇腾AI计算架构提供全面赋能AI开发的平台:

- 异构计算架构CANN:支持多种计算节点协同处理,提升计算效率。

- 调试调优工具和开发工具链MindStudio:简化开发流程,提升开发效率。

- AI计算框架MindSpore:处于行业领先梯队,支持多种计算场景。

- 昇腾应用使能MindX:支持ModelArts和HiAI等应用使能服务,快速部署AI模型和应用。

行业应用赋能各行各业,提供智能解决方案。从互联网推荐到自然语言处理,再到语音识别和机器人技术,行业应用覆盖广泛场景,助力企业提升效率和竞争力。

华为云盘古大模型 3.0,依托于鲲鹏、昇腾算力平台和先进架构,为企业提供:

* 100 亿至 1000 亿参数的系列化基础大模型

* 基于全场景 AI 框架 MindSpore 和开发生产线 ModelArts 构建 AI 应用解决方案

* 异构计算架构 CANN 赋能高效计算加速

盘古大模型专注行业赋能,打造金融、政务等领域大模型能力集,融合行业专业知识与大模型技术,突破行业壁垒,助力千行百业转型升级,成为行业专家助手。

1.1. 昇腾服务器

华为昇腾和鲲鹏服务器使用相同的生产线,减少了复杂性。合作伙伴只需从华为直接采购 AI 服务器或芯片板卡,即可打造服务器。

1.2. 昇腾一体机

AI 训推一体机:赋能 AI 能力自建

AI 训推一体机融合大模型等软件与 AI 服务器,为缺乏 AI 自建能力的客户提供一体化解决方案。

针对 ISV,华为提供昇腾整机,集成 AI 模型和软件,直接交付终端用户。该解决方案简化 AI 部署流程,降低开发成本,助力客户构建 AI 能力。

2. 海光信息

DCU 推动 DCU 批量出货,开启第二增长曲线。

基于 GPGPU 架构,DCU 兼容 "类 CUDA" 环境,适用于高性能计算和 AI 领域。

深算二号已发布,在数据、AI 和商业计算中实现商用,性能较前代提升 100%,支持全精度浮点和整型数据计算。

海光 DCU 性能媲美国际高端处理器。采用 7nm FinFET 工艺,深算一号能充分发挥并行计算优势。与其国际领先竞品 A100 和 MI100 对比,深算一号在典型应用中达到同期水平,高效开发高能效应用。

海光 DCU 协处理器与 AMD ROCm GPU 计算生态无缝兼容。ROCm 与 CUDA 相似,使 CUDA 用户轻松迁移,降低成本。通过兼容主流商业计算和 AI 软件,海光 DCU 协处理器为用户提供了丰富的生态支持。

海光 DCU 性价比高于海外竞品,占据国内领先地位。凭借优异的性能和生态支持,海光 DCU 成为国产 AI 加速器中佼佼者,实现了全精度支持,确立了大规模销售的市场优势。

3. 寒武纪

寒武纪,成立于 2016 年,专注于人工智能芯片研发。其核心产品包括云端芯片、边缘芯片、IP授权和软件。寒武纪致力于打造人工智能领域的核心处理器芯片,推动人工智能技术发展。

寒武纪思元(MLU)系列智能加速卡完美适配百川智能大模型(Baichuan2系列),包括53B、13B和7B。MLU系列产品性能与国际主流产品媲美,为大模型训练和推理提供强劲动力。

2024 年 1 月 22 日,寒武纪与智象未来合作,推出融合寒武纪思元云端智能加速卡和智象多模态大模型的产品。适配后,性能和图像质量堪比国际主流产品,在业内树立新标杆,为人工智能应用提供强大的基础。

4. 景嘉微

2024 年 3 月 12 日,景宏系列智算产品强势问世。包含高性能模块和整机,专攻 AI 训练、推理和科学计算。即将面向市场,为人工智能和科学研究领域提供强劲动力。

景宏系列为 AI 训练、推理和科学计算而打造的智算产品。支持混合精度计算,从 INT8 至 FP64,并采用多卡互联技术扩展算力。该系列兼容主流 CPU、操作系统和服务器供应商,适配各类计算生态、深度学习框架和模型库,显著缩短用户适配和验证时间。

-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

1 阅读:9

薪科技快评

简介:薪科技评说,发现技术的点滴,记录科学的飞跃!