为云而生，AWS云原生自研芯片Graviton2来了

2021年2月2日，亚马逊公司公布了截至2020年12月31日的第四季度财务业绩。其中，亚马逊云服务（AWS）2020年全年收入达454亿美元，同比增长了30%。亚马逊当天还宣布，杰夫·贝索斯将于2021年第3季度过渡到董事会执行主席一职，AWS CEO Andy Jassy届时将出任亚马逊首席执行官。

AWS在如此规模下还能实现年增长近100亿美元，离不开高速度和高质量的创新。在2020年的re:Invent大会，AWS共发布了180项新服务和新功能。在云计算的基础领域，算力方面的创新也一直没有停止过。

1月28日，AWS第二代基于Arm架构的处理器AWS Graviton2首次落地中国区域，这是AWS自研的、原生为云而设计开发的芯片。同时落地的还有由 AWS Graviton2 处理器提供支持的 Amazon Elastic Compute Cloud （Amazon EC2） M6g、C6g 和 R6g 实例。

近日，AWS大中华区云服务产品管理总经理顾凡与AWS大中华区产品部计算与存储总监周舸共同向国内媒体分享了Graviton2落地中国背后，AWS在弹性计算服务（EC2）方面的创新与思考。

AWS大中华区云服务产品管理总经理顾凡

AWS自研ARM芯片目的何在？

Graviton2最早在2019年底的re:Invent大会上发布。Graviton2基于 64位Arm Neoverse N1微架构设计，是ARM第一款数据中心定位的CPU架构。与第一代 AWS Graviton 处理器相比，AWS Graviton2性能达到前者 7 倍、计算核心数量达到 4 倍、缓存达到 2 倍、内存速度达到 5 倍。与同配置x86实例相比，Amazon EC2 M6g、C6g 和 R6g 实例的性价比提高了40%。

由于在性能和功能方面的重大飞跃，Graviton2极大扩展了ARM处理器在企业级应用的场景。除了ARM一直很擅长的Web应用、游戏等场景，包括开源数据库、高性能计算HPC、电子设计自动化EDA等十分考验性能的场景也能广泛适用。而且，这些场景已经被很多AWS企业客户成功验证。

“Graviton2打破了大家对于原来ARM处理器在企业级应用范围的认知。这传达了一个观点，很明显从技术上、性能上、生态系统上，ARM处理器都更加成熟更加就绪了。接下来，大家会看到更多企业级客户真正把它用起来。”AWS大中华区云服务产品管理总经理顾凡表示。

那么，AWS为什么要自研ARM芯片？

简单说，为了给客户更丰富的选择。顾凡表示，AWS设计处理器的动力源自两点：

首先，“量体裁衣”，把更丰富的产品的选择权交给客户，为客户不断变化的工作负载提供更好的云服务。“要在芯片市场、CPU市场里取得很大的市场份额，那不是我们的目标。”

其次，为客户不断优化云服务的性价比。AWS会帮客户去寻找需要性价比优化的领域，自研芯片是一种很好的解决方案。

近400种实例背后的三大驱动

本次，一起落地中国的还有基于Graviton2的三个实例：通用型实例M6g，计算优化型实例C6g，以及内存优化型实例R6g。实例是AWS提出的一个云计算基本概念，它是指在一段时间内分配的一组计算资源。用通俗的叫法，实例也被称作云服务器、虚拟服务器、云主机、虚拟机等等。

目前，AWS提供近400种EC2（亚马逊弹性计算云Amazon Elastic Compute Cloud）实例类型，其业务相当于传统上一家提供400种服务器型号的中大型服务器厂商。通过组合不同的处理器品牌及型号、内存容量大小、存储带宽和网络带宽的选项，AWS为全球几百万用户提供灵活多样的选择。

据介绍，AWS之前以能够比其它云服务商提供更丰富的实例类型，是基于三个关键因素：

一、跟半导体厂商的全面合作

在CPU处理器方面，AWS与英特尔已经是长达合作14年的战略伙伴。期间，AWS跟英特尔推出了很多定制的实例，比如支持100Gbps网络带宽的C5n实例、支持最大24TB的史上最大的SAP认证内存实例等。近两年，AMD在服务器芯片异军突起，AWS实例对AMD两代EPYC处理器 Naples和Rome都有很好的支持。

“我们在过去两年，加强了跟AMD合作，让客户x86的选择变得更多。我们跟英特尔定制出了更多的新机型，都是围绕着Intel的新的架构做的。” AWS大中华区产品部计算与存储总监周舸表示。

在加速芯片方面，AWS全面支持包括英伟达A100、赛灵思FPGA和英特尔Gaudi在内的加速芯片。

二、AWS Nitro系统

目前，近400种EC2实例都以AWS Nitro系统为基础平台。AWS Nitro是业界领先的云服务器虚拟化引擎，其最大创新是将网络、存储、管理、安全和监控的功能从服务器解耦，由一个新的硬件Nitro卡处理。这样就实现了虚拟化管理程序占用物理服务器的系统资源通常不到1％的理想状态，将99%以上的物理服务器性能都交给客户。而传统物理服务器中，Hypervisor通常会占用大约30%的系统资源。

Nitro系统的另一大优势是安全。Nitro系统设计了一个专门的安全区域，用于临时存储实例中的个人身份信息、医疗保健、金融和知识产权数据等敏感数据。该安全区域没有持久性存储，没有管理员和操作员访问权限，只能被EC2实例本地访问，禁止包括亚马逊员工在内的所有管理员访问，极大减少了漏洞风险。

三、自研处理器

目前，AWS自研处理器已经涉及CPU和加速芯片领域。Graviton系列服务器芯片为用户提供更多选择。同时，AWS自研了面向机器学习推理和训练的加速芯片AWS Inferentia和AWS Trainium。

云原生时代，ARM的潜力

AWS自研的Graviton系列芯片是基于ARM架构，很容易让人想到ARM与x86的发展态势。但顾凡表示，ARM和x86不是简单的此消彼长，AWS自研芯片的初衷还是为了“量体裁衣”，尤其是帮客户应对云原生带来的挑战。

“现代化应用和工作负载，尤其是以容器和无服务为首的全新应用，对于云计算厂商的需求是全方位的，需要我们从各个角度去创新。Graviton2就是响应云原生这个趋势，从处理器设计角度的一种响应。”顾凡表示。

“从架构设计上，与x86不同的是，Graviton2每一个核只跑一个线程，只完成一个任务，而且每个核有自己独享的L1和L2的缓存，互相不干扰。能够最大程度的去适应云原生环境中需要平行扩展的微服务化应用，这是Graviton2最关键的特点。”周舸介绍。

目前，一些出海的中国企业已经率先享受了Graviton 2实例带来的降本增效。涂鸦智能是一家全球化的AI+IoT企业，遍布全球的海量智能物联设备让涂鸦智能对云服务的要求非常高。据悉，涂鸦智能每天处理的设备请求次数高达840亿次，请求高峰达150万次/秒，同时云端服务器的响应时间要小于10毫秒/次。

涂鸦智能首席架构师陈亚焱表示，“通过使用AWS Graviton2实例来处理我们在MQTT(消息队列遥测传输协议) 网关服务的协议解析和长连接状态，涂鸦智能的CPU性能提升100%，服务器单价降低了20%，整体的性价比提升了2.5倍。目前，我们已经将公司40%的实例切换到了Graviton2架构上。”

北京大觥科技有限公司是一家专注AI影像处理领域科研和应用的公司。因为性价比的明显提升，大觥科技将核心业务从C5直接升级到了C6g实例。根据测算数据，同样处理250万张图片，大觥科技使用C6g实例与使用当前C5实例相比，成本节省近40%。

顾凡表示，虽然目前Graviton2实例的主力客户还是互联网企业，但随着Graviton2在中国区域的落地，会有越来越多的中国企业级客户案例出现。

“目前云占整个IT份额的4%，还有很多业务都在逐步往云的环境中去转换。ARM同样也是一个演进的过程。一旦传统企业的应用改造走向微服务化，就会更容易理解在Graviton2这样的架构的实例上能给企业带来哪些帮助。比如，如果EDA的软件厂商都敢于用Graviton2去支持芯片设计的工作，这就是个转折点。”

本文为「智能进化论」原创作品。

世良情感网

为云而生，AWS云原生自研芯片Graviton2来了

智能进化论