《未来呼啸而来》中提出:未来的创新将不是单向式、重度垂直的。若干个重要领域的创新需求之间,会突然产生“叠加效应”,新的技术将以“叠加式创新”的方式,呼啸而来,改变我们的生活。
AI和大模型,正是这种带来巨大改变的指数级技术,同时也引发计算产业发生了翻天覆地的变化。
在2023年之前,通用计算产业一直处于波澜不惊的“慢速”创新节奏当中,以通用芯片迭代为主导的挤牙膏式的升级,每年仅能为计算产业带来大概10%的增量。而被大模型引爆的智算产业,两年内的需求几乎已经翻了一番。
新华三集团高级副总裁、云与计算存储产品线总裁徐润安表示,“智算时代最大的变化就是百花齐放,在基础设施层面,CPU和GPU都在发生裂变,从计算到存储新一轮的技术革新,带来了百花齐放的状态。”
可以想象,百花齐放的技术架构革新,带了更大的复杂性和不确定性,这会让“变化”来得更剧烈,但同时也孕育着新机会。
在变化中不断“进化”,这是新华三在智算时代,给出的答案。
01
时代之变
要做到在变化中进化,首先要抓住行业发展的大势。这也是在10月24日,新华三的智算新品以“乘势·进化·臻于智境”为题进行发布的意义所在。
当前最大的“势”,无疑是大模型技术引发的AI“风暴”。在应用端,人脸识别、自然语言、智能推荐等AI应用已经成为现实;在企业端,越来越多的企业将AI视为数智化转型的下一站,利用AI助力决策、重塑商业模式与生态系统、重建客户体验的例子比比皆是。
在应用全面AI化的背景下,则是AI算力的激增。IDC的数据显示:全球算力需求将以每年50%的速度增长,而AI应用驱动算力需求增长速度更快,预计到2030年,AI算力需求将比当前呈现上百倍的增长。同时,智能算力已经开始渗透到百行百业的方方面面。
徐润安表示,“智算需求的指数级增长,在潜移默化的影响着我们的生活。比如在广告业,AI互动的触达率比人工提高了80%;在高校,AI技术几乎成为所有科研项目必备的选项,未来AI应用会越来越广泛,反过来又会推动智算需求的增加。”
新华三集团高级副总裁云与计算存储产品线总裁徐润安
智算应势而起,形成了一个与通用算力截然不同的赛道,异构算力是智算时代最典型的特征,这就是所谓的百花齐放的基础设施架构。
异构算力通常由CPU、GPU、FPGA、ASIC等不同的算力处理体系组成,这些不同类型的处理器各自具有独特的优势,能够满足不同场景中的应用需求。通过将它们组合在一起,可以实现计算资源的优化分配和高效利用,进而实现计算效力最大化。换言之,要发挥智算的最大价值,就必然要走通异构算力体系的路。
面对百花齐放的“时代之变”,徐润安坦言,最大的挑战就是要构建开放的平台,能够适应和兼容各种技术体系。同时还要通过智算平台,能够把这些技术传递给上层应用,赋能百行百业。“这既是新华三云与计算存储产品线的使命,也是我们要乘势、进化到达的一个更高境界。”徐润安说。
02
主动进化
达尔文在《进化论》中提到的:“自然选择是进化的动力。”新华三智算产品的进化,当然也是为了撬动客户的选择而来的。
新华三集团云与计算存储产品线副总裁刘宏程说:“我们预计,智算行业未来5年都会保持30%以上的增长率,训练的需求还远未到峰值,同时随着推理场景的逐步打开,需求仍会进一步释放。”
新华三集团云与计算存储产品线副总裁刘宏程
在此过程中,智算基础设施的发展脉络必然会沿着一条“可进化”的主线演进,开放、灵活、多元注定是客户选择智算产品的主要方向。
因此,新华三全新发布的H3C UniServer G7系列服务器,主打的就是多元异构的算力平台。它采用了先进的模块化设计,CPU/GPU/存储等子系统均可随需升级,以应对不同行业客户,在各种复杂计算场景下的多元化需求。
新华三多元异构算力平台——H3C UniServer G7系列
刘宏程表示,“当然伴随智算技术的革新,功耗过高导致的绿色节能瓶颈问题也非常明显,新华三服务器也做了一套集成式的冷板散热方案,把功耗降到最低。”践行ALL in GREEN战略,新华三G7产品家族也在液冷技术上多维进化,助力可持续发展目标。
刘宏程也提出,“智算带来的是从底层基础设施,到中间软件管理支撑的全方位变革。”这意味着要真正实现“内生智能”,硬件与软件不应该是割裂的。所以,新华三也推出了自研数据中心操作系统磐宁OS。通过高可靠、强性能、易维护的优势,可以满足云计算、数据库、大数据、人工智能等业务要求,目前已广泛应用于金融、政企、运营商等行业中。
在多元算力的丰富性上,新华三秉持训练和推理“两手都要硬”。比如AI算力旗舰 H3C UniServer R5500 G7支持万亿参数大模型训练,已覆盖超过15种主流开源大模型的训练;而AI训推一体引擎 H3C UniServer R5300 G7可同时搭载8块双宽GPU或16块单宽GPU,拥有广泛的模型兼容性,兼容超过200个主流AI模型。
我们谈AI基础设施,其实并不是泛指算力基础设施,还应该包含存储基础设施,这其实也是客户需要扭转的认知。
新华三集团副总裁、存储产品线总经理兼首席产品经理关天舒说,“存储是最底层的数据底座,既决定了智算系统的整体效能,更是确保客户数据安全性的‘重镇’。传统意义上客户选择存储阵列无论从对非结构化数据支持,还是扩展性上都不适合智算的要求,这需要结合客户的场景,结合算力和存储做全方位验证,给客户一个交钥匙工程。”
新华三集团副总裁存储产品线总经理兼首席产品经理关天舒
事实上,新华三早在三年前就认识到AI发展的趋势,同步规划了下一代存储软件平台的研发和设计,集结了近千名的研发人员,经历了三年的技术攻关,才让新一代AI数据存储平台H3C UniStor Polaris X20000得以问世。
下一代AI数据存储平台 H3C UniStor Polaris X20000系列
据了解,Polaris X20000系列通过系统、体验、价值三方面重构。比如通过存储软件栈全面重构,可以满足智算应用海量小文件高性能并发和百TB级带宽需求;面向AI智算多样性数据处理,在AI大模型训练全流程中数据免搬迁并性能无损;同时,智算存储平台的可靠性从“数据级可靠”提升至“服务级可靠”,全方位满足智算场景客户的需求。
“从新华三的角度,在做好存储不变的稳定性和性价比的同时,我们更要看到客户真正的需求,把客户要的东西做好,来改变存储产品的形态,这是新华三在未来几年,持续不断去努力的方向。”关天舒说。
被动的改变叫颠覆,主动的改变才叫进化,新华三显然很好的诠释了进化的意义。
03
乘势而上
我们说,百花齐放的异构算力体系,是当下最大的挑战。
在异构算力体系建设过程中,涉及大量计算单元内部的信息交互,也形成了庞大的生态系统,除了多种类型的专用芯片之外,各种形态的交换机、光模块/线缆等连接介质,以及各服务提供商交付的算力运营、算力调度、算法交易平台相互交织,为算力体系的构建带来了巨大的复杂性。
“特别是要做好GPU之间的互通,没有开放标准的网络是无法做到的,同时各个厂商GPU的混合调度,没有好的AI服务器硬件框架和算力调度平台,也是无法实现的。”新华三集团云与计算存储产品线、云与大数据产品线首席产品经理王锋说。
新华三集团云与计算存储产品线云与大数据产品线首席产品经理王锋
这就是新华三之所以提出“算力×联接”概念的原因。通过算力方案与联接方案做最佳的调优和配合,通过端网协同、网算一体等技术带来智算效率的大幅提升,两者的深度融合带来的不是简单的叠加效果,而是倍增的效益。
换言之,“算力×联接”解决的不单纯是计算或联接的问题,而是通过计算和联接协调统一,让智算的价值最大化,而这也正是傲飞算力平台存在的价值。如今,傲飞算力平台也迎来升级,全面提升有效性、可靠性、稳定性及易用性,以高性能算力基础设施为依托,助力行业客户像用电一样,更普惠、更便捷的使用算力,加速AGI落地。
王锋表示,“傲飞算力平台是把新华三将‘算力×联接’的乘数效应发挥到极致的核心。我们也希望算力能够像水一样随取随用,希望每个人和企业都能在日常工作中就近获取低时延的高效算力。”
供给侧理论告诉我们,经济的平稳发展取决于经济中需求和供给的相对平衡。在百行百业智能化转型的背景下,AI应用的多姿多彩,市场规模的不断扩大,带来了对智算的巨大需求。
算力供给的程度,无疑决定了迈向智能化时代的速度,新华三智算战略及产品体系的不断进化,正是推动智算时代进步的底层逻辑。