2020云盘点:七个公有云厂商相继出现故障或宕机

阿明观察 2021-02-08 12:51:55

在2020年中,据不完全统计:微软商业云服务、Google云、华为云、Adobe Creative Cloud、IBM Cloud、苹果iCloud和亚马逊云AWS共计七个公有云服务提供商相继出现故障或宕机情况。

年度热点话题03

七个公有云厂商相继出现故障或宕机,

“世上没有不宕机的云”

公有云服务平台出现这样那样的问题,再次对公有云服务带来了考验。从另一个侧面也说明,在解决问题的过程中,也再一次提升了公有云服务的品质。屡败屡战,坚韧不拨,这也是公有云从十年前到今天,逐渐壮大,成为百行百业最强音的发展之道。

这其实对于云服务平台而言,这里指公有云服务,每年都会遭遇这样那样的故障,这些故障有的是人为原因,有的是机器故障,有的是软件bug……等等原因汇总的结果,就是相关云平台上的客户遭殃。或丢失数据,或停止服务,或影响创新。业内人士戏言:“世上没有不宕机的云。”

如果想在这个事情上获得解决办法,业内人士指出,唯有灾备。但是对于一个公有云平台而言,一旦部署完备的灾备,那么每隔一段时间就需要流程化的演练,就像军事演习一样。这样才可以未雨绸缪,在遭遇问题的时候,得到业务与数据的快速恢复。

然而,即便真的部署了完备的灾备中心与之云服务匹配,这还不够。因为虽然系统和软件可以实现自动化实现更好的智能监测报警之类,可是对于灾备来说,还需要在演练的同时,保持良好的灾备策略包括自动化的策略与人工监督的策略。

毕竟最终的实现,还是需要人为来确定,特别是针对报警情况,如果人为不做硬件更新、不做bug的优化、不做多副本的快照等等,只是靠日志,不能真正实现所有故障情况下的备份恢复。

可见灾备对于公有云厂商来说,看似简单的靠公有云分布式的架构,异地中心的灾备,或者多副本的保障,但更多的考虑却需要一个全面的策略,包括自动化智能机制和人工监督的科学流程。

根据来自各大媒体网站公开信息,七个公有云服务提供商2020年出现故障或宕机情况统计如下,如果漏掉或有出入的信息,大家可以在文末留言评论。

2020年3月3日,微软位于美国东部的数据中心发生了服务中断,持续六小时,导致美国北部的客户无法使用Azure云服务。

2020年3月16日,微软Teams平台涌入了大量新用户,导致该服务在欧洲地区出现了持续2个小时的宕机。

2020年3月24日-26日,微软Azure Pipelines发生故障,严重影响DevOps团队使用的持续交付服务,软件开发人员受到的影响特别大。

2020年3月26日,Google多个云服务出现无法访问的问题。Google用户称遇到了Google 500错误代码(因内部错误导致请求失败)和502错误代码(网关出现故障)。Google将这次故障归咎于“基础设施组件”问题。

2020年4月8日,Google Cloud身份和访问管理(IAM)API出现故障。这次故障从美国东部时间上午10:35开始,持续了不到90分钟,导致多个Google服务中断,包括App Engine、Cloud Functions、BigQuery及其核心Compute Engine IaaS。

2020年4月10日,华为云出现大面积宕机,华为云登录、管理后台无法访问,部分公司业务无法正常维持。本次宕机持续约三小时。

2020年4月21日-23日,微软旗下GitHub发生了多次宕机。4月21日,多个GitHub服务出现访问异常,持续了一个半小时。4月22日,服务再次出现中断,持续时间至少两小时。4月23日,多个GitHub服务也遇到了各种问题的影响,持续了近三小时。

2020年5月28日,Adobe Creative Cloud发生宕机一整天的时间,故障波及包括Photoshop、InDesign和Premier Pro等备受欢迎的产品。

2020年6月9日,IBM Cloud遭遇了重大宕机故障,平台上托管的多项服务也因此中断,其中就包括知名科技新闻聚合网站 Techmeme。本次宕机事件从下午2点30分左右开始,并快速蔓延至全球,在下午6:30之后报告称一系列问题已经得以解决。本次宕机持续约四小时。

2020年8月6日,苹果公司的系统状态(System Status)页面显示,部分用户无法使用其某些服务,苹果游戏中心、iCloud服务遭遇最新故障。

2020年8月14日,来自华为消息称,华为云香港机房制冷设备出现异常。工程师已经定位了潜在原因,并及时处理恢复。

2020年9月29日,Microsoft Office 365办公软件和Azure云产品出现故障,导致部分用户服务中断数小时,故障涉及Outlook电邮服务和Teams办公协作工具的部分用户。

2020年10月8日,微软公有云美国区域的Azure服务出现了约一个小时的问题。微软在其状态页面上写道,北美区域访问微软或Azure服务(包括Azure政务服务)可能遭遇问题,正在调查。

2020年11月25日,亚马逊公有云服务Amazon Web Services(AWS)遭遇了持续数小时的故障,导致部分网站和服务系统崩溃,影响Adobe、Roku等服务。随后亚马逊AWS在其官方的服务健康报告页面也更新了最新状态,称美国US-EAST-1地区的Kinesis Data Streams API出现故障,导致客户无法写入和读出发布至Kinesis streams的数据,并影响更新网站页面的能力,已着手紧急修复。

2020年12月15日,Google服务器突然遭遇全球大面积故障。在宕机的45分钟内,谷歌旗下的多项服务无法访问,包括Gmail邮箱,谷歌日历、视频网站YouTube等热门应用均受到严重影响,而这已经是谷歌全年第四次宕机。(by Aming)

每 一 年 啊,都需要捋一下,总结总结,砥砺奋进再出发。2020,这一年,更值得回头看看……

不过,要看懂某一年的云计算发展情况,在全球云观察看来,需要基于一个更长的时间维度,再结合本年度的情况,这样的回顾盘点才更有参考意义。

《这就是2020:全球云计算十一大年度话题盘点》也就如此照办了。

- END-

欢迎文末留言评论!

欢迎文末评论补充!文章来源:Aming,全球云观察,著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。本文和作者回复仅代表个人观点,不构成任何投资建议。

都看到这里了,加个关注吧!

【阿明】:科技评论专栏作家、科技媒体从业24年、新闻评论年产出上百万字,用数据说话,带你看懂科技公司

0 阅读:9

阿明观察

简介:带你读懂科技上市公司,用数据说话,成就不凡。