为云而生,AWS云原生自研芯片Graviton2来了

智能进化论 2021-02-21 22:15:12

2021年2月2日,亚马逊公司公布了截至2020年12月31日的第四季度财务业绩。其中,亚马逊云服务(AWS)2020年全年收入达454亿美元,同比增长了30%。亚马逊当天还宣布,杰夫·贝索斯将于2021年第3季度过渡到董事会执行主席一职,AWS CEO Andy Jassy届时将出任亚马逊首席执行官。

AWS在如此规模下还能实现年增长近100亿美元,离不开高速度和高质量的创新。在2020年的re:Invent大会,AWS共发布了180项新服务和新功能。在云计算的基础领域,算力方面的创新也一直没有停止过。

1月28日,AWS第二代基于Arm架构的处理器AWS Graviton2首次落地中国区域,这是AWS自研的、原生为云而设计开发的芯片。同时落地的还有由 AWS Graviton2 处理器提供支持的 Amazon Elastic Compute Cloud (Amazon EC2) M6g、C6g 和 R6g 实例。

近日,AWS大中华区云服务产品管理总经理顾凡与AWS大中华区产品部计算与存储总监周舸共同向国内媒体分享了Graviton2落地中国背后,AWS在弹性计算服务(EC2)方面的创新与思考。

AWS大中华区云服务产品管理总经理 顾凡

AWS自研ARM芯片目的何在?

Graviton2最早在2019年底的re:Invent大会上发布。Graviton2基于 64位Arm Neoverse N1微架构设计,是ARM第一款数据中心定位的CPU架构。与第一代 AWS Graviton 处理器相比,AWS Graviton2性能达到前者 7 倍、计算核心数量达到 4 倍、缓存达到 2 倍、内存速度达到 5 倍。与同配置x86实例相比,Amazon EC2 M6g、C6g 和 R6g 实例的性价比提高了40%。

由于在性能和功能方面的重大飞跃,Graviton2极大扩展了ARM处理器在企业级应用的场景。除了ARM一直很擅长的Web应用、游戏等场景,包括开源数据库、高性能计算HPC、电子设计自动化EDA等十分考验性能的场景也能广泛适用。而且,这些场景已经被很多AWS企业客户成功验证。

“Graviton2打破了大家对于原来ARM处理器在企业级应用范围的认知。这传达了一个观点,很明显从技术上、性能上、生态系统上,ARM处理器都更加成熟更加就绪了。接下来,大家会看到更多企业级客户真正把它用起来。”AWS大中华区云服务产品管理总经理顾凡表示。

那么,AWS为什么要自研ARM芯片?

简单说,为了给客户更丰富的选择。顾凡表示,AWS设计处理器的动力源自两点:

首先,“量体裁衣”,把更丰富的产品的选择权交给客户,为客户不断变化的工作负载提供更好的云服务。“要在芯片市场、CPU市场里取得很大的市场份额,那不是我们的目标。”

其次,为客户不断优化云服务的性价比。AWS会帮客户去寻找需要性价比优化的领域,自研芯片是一种很好的解决方案。

近400种实例背后的三大驱动

本次,一起落地中国的还有基于Graviton2的三个实例:通用型实例M6g,计算优化型实例C6g,以及内存优化型实例R6g。实例是AWS提出的一个云计算基本概念,它是指在一段时间内分配的一组计算资源。用通俗的叫法,实例也被称作云服务器、虚拟服务器、云主机、虚拟机等等。

目前,AWS提供近400种EC2(亚马逊弹性计算云Amazon Elastic Compute Cloud)实例类型,其业务相当于传统上一家提供400种服务器型号的中大型服务器厂商。通过组合不同的处理器品牌及型号、内存容量大小、存储带宽和网络带宽的选项,AWS为全球几百万用户提供灵活多样的选择。

据介绍,AWS之前以能够比其它云服务商提供更丰富的实例类型,是基于三个关键因素:

一、跟半导体厂商的全面合作

在CPU处理器方面,AWS与英特尔已经是长达合作14年的战略伙伴。期间,AWS跟英特尔推出了很多定制的实例,比如支持100Gbps网络带宽的C5n实例、支持最大24TB的史上最大的SAP认证内存实例等。近两年,AMD在服务器芯片异军突起,AWS实例对AMD两代EPYC处理器 Naples和Rome都有很好的支持。

“我们在过去两年,加强了跟AMD合作,让客户x86的选择变得更多。我们跟英特尔定制出了更多的新机型,都是围绕着Intel的新的架构做的。” AWS大中华区产品部计算与存储总监周舸表示。

在加速芯片方面,AWS全面支持包括英伟达A100、赛灵思FPGA和英特尔Gaudi在内的加速芯片。

二、AWS Nitro系统

目前,近400种EC2实例都以AWS Nitro系统为基础平台。AWS Nitro是业界领先的云服务器虚拟化引擎,其最大创新是将网络、存储、管理、安全和监控的功能从服务器解耦,由一个新的硬件Nitro卡处理。这样就实现了虚拟化管理程序占用物理服务器的系统资源通常不到1%的理想状态,将99%以上的物理服务器性能都交给客户。而传统物理服务器中,Hypervisor通常会占用大约30%的系统资源。

Nitro系统的另一大优势是安全。Nitro系统设计了一个专门的安全区域,用于临时存储实例中的个人身份信息、医疗保健、金融和知识产权数据等敏感数据。该安全区域没有持久性存储,没有管理员和操作员访问权限,只能被EC2实例本地访问,禁止包括亚马逊员工在内的所有管理员访问,极大减少了漏洞风险。

三、自研处理器

目前,AWS自研处理器已经涉及CPU和加速芯片领域。Graviton系列服务器芯片为用户提供更多选择。同时,AWS自研了面向机器学习推理和训练的加速芯片AWS Inferentia和AWS Trainium。

云原生时代,ARM的潜力

AWS自研的Graviton系列芯片是基于ARM架构,很容易让人想到ARM与x86的发展态势。但顾凡表示,ARM和x86不是简单的此消彼长,AWS自研芯片的初衷还是为了“量体裁衣”,尤其是帮客户应对云原生带来的挑战。

“现代化应用和工作负载,尤其是以容器和无服务为首的全新应用,对于云计算厂商的需求是全方位的,需要我们从各个角度去创新。Graviton2就是响应云原生这个趋势,从处理器设计角度的一种响应。”顾凡表示。

“从架构设计上,与x86不同的是,Graviton2每一个核只跑一个线程,只完成一个任务,而且每个核有自己独享的L1和L2的缓存,互相不干扰。能够最大程度的去适应云原生环境中需要平行扩展的微服务化应用,这是Graviton2最关键的特点。”周舸介绍。

目前,一些出海的中国企业已经率先享受了Graviton 2实例带来的降本增效。涂鸦智能是一家全球化的AI+IoT企业,遍布全球的海量智能物联设备让涂鸦智能对云服务的要求非常高。据悉,涂鸦智能每天处理的设备请求次数高达840亿次,请求高峰达150万次/秒,同时云端服务器的响应时间要小于10毫秒/次。

涂鸦智能首席架构师陈亚焱表示,“通过使用AWS Graviton2实例来处理我们在MQTT(消息队列遥测传输协议) 网关服务的协议解析和长连接状态,涂鸦智能的CPU性能提升100%,服务器单价降低了20%,整体的性价比提升了2.5倍。目前,我们已经将公司40%的实例切换到了Graviton2架构上。”

北京大觥科技有限公司是一家专注AI影像处理领域科研和应用的公司。因为性价比的明显提升,大觥科技将核心业务从C5直接升级到了C6g实例。根据测算数据,同样处理250万张图片,大觥科技使用C6g实例与使用当前C5实例相比,成本节省近40%。

顾凡表示,虽然目前Graviton2实例的主力客户还是互联网企业,但随着Graviton2在中国区域的落地,会有越来越多的中国企业级客户案例出现。

“目前云占整个IT份额的4%,还有很多业务都在逐步往云的环境中去转换。ARM同样也是一个演进的过程。一旦传统企业的应用改造走向微服务化,就会更容易理解在Graviton2这样的架构的实例上能给企业带来哪些帮助。比如,如果EDA的软件厂商都敢于用Graviton2去支持芯片设计的工作,这就是个转折点。”

本文为「智能进化论」原创作品。

0 阅读:9

智能进化论

简介:专注AI产业趋势、场景应用的商业评论。