亚马逊AWS今天再次遭遇故障,这起事件影响了众多在线服务,包括 Twitch、Zoom、PSN、Xbox Live、Doordash、Quickbooks Online和Hulu等。
据AWS的状态页面显示,这起故障始于太平洋标准时间上午7点43分左右,影响了US-WEST-1和US-WEST-2这两个区域。
据报道 ,这起事件已造成了严重的互联网连接问题,导致一大批在线平台和网站随之瘫痪。
AWS的工程师们正在努力搞清楚这次故障背后的根本原因,并表示他们已经采取措施,以恢复互联网连接。
AWS状态页面显示:“我们已查明了通向US-WEST-2区域的互联网连接出问题的根本原因,并已采取措施以恢复连接。”
“在过去的几分钟里,我们看到互联网连接有了一定的改善,但继续努力实现全面恢复。”
受这次AWS故障影响的在线服务
而仅仅一周前,另一次大规模的AWS故障影响了US-EAST-1区域,该区域为美国东北部地区的人员和公司企业提供连接。
因此,通过Netflix、Roku和Amazon Prime 提供的流媒体服务立即受到了影响。Ring设备也随之瘫痪,无法访问,据用户声称他们再也无法连接到自己的摄像头。
亚马逊送货员工们也表示,他们无法访问内部应用程序,而扫描包裹、访问送货路线或查看任何即将到来的时间表都需要使用这些应用程序。
正如AWS后来解释的那样,这起事件是“为托管在主AWS网络中的其中一项AWS服务自动扩展容量的活动”引起的,这“导致连接活动大量激增,从而使内部网络与主AWS网络之间的网络设备不堪重负”。
这些故障并不是独特的事件,因为自2011年以来此前已发生过多起另外的类似事件,包括2020年11月影响了US-EAST-1区域的大规模故障事件。
当时,在亚马逊用于实时处理流数据的Kinesis服务开始遇到问题后,数量众多的网站和在线平台纷纷瘫痪。
而在之前一年的2019 年9月,AWS在北弗吉尼亚州的US-EAST-1数据中心遭遇了断电,因而导致没有可用备份来恢复文件的所有亚马逊客户的数据丢失。
太平洋标准时间上午8点10分:AWS表示影响US-WEST-1和US-WEST-2这两个区域的故障背后的问题已得到解决。
我们已经解决了影响通向US-WEST-1区域的互联网连接的问题。该区域内部的连接并未受到该事件的影响。问题已得到解决,服务运行正常。
太平洋标准时间中午12点14分:上午7点14分到7点59分之间,客户们遇到了网络数据包丢失增加的情况,这影响了通向一部分互联网目的地的连接。AWS区域内部的流量、AWS区域之间的流量以及通向互联网上其他目的地的流量则并未受到影响。这个问题是由AWS主干网(AWS Backbone)的一部分与一小批互联网服务提供商之间的网络拥塞引起的,网络拥塞是由AWS流量工程触发的,这是为了应对我们网络外面的拥塞而执行的。该流量工程错误地将比预期更多的流量转移到了AWS主干网的一部分,结果影响了通向一部分互联网目的地的连接。问题已得到解决,我们预计不会再次发生。
相关阅读 ·
AWS 瘫痪:互联网“半壁江山”出现了网页打开缓慢或故障