AWS 进出附加 EBS 卷的 IO 被卡住,出现性能下降

主要的AWS EC2区域出现性能下降后,Signal随之瘫痪,Xero和Nest则变得有点不稳定。

AWS周日晚上过得并不轻松,其主要的US-EAST-1区域的EC2实例出现了异常。

在太平洋夏令时20点11分,AWS状态页面宣布该平台的主要可用区出现了性能下降的问题。

30分钟后发布的通知声称:“由于进出附加EBS卷的IO被卡住,受影响的可用区内使用EBS卷的现有EC2实例也出现了性能下降。”

“由于卷性能下降,受影响的可用区内刚启动的EC2实例可能无法启动。”

在太平洋夏令时21点47分,AWS表示故障出在Amazon Elastic Block Store(亚马逊弹性块存储)出现了过载,客户应“故障切换”到另一个可用区。

22点16分发布的最新通知声称:“我们继续在确定导致US-EAST-1区域的单个可用区(USE1-AZ2)中一些EBS卷性能下降的这个问题的根本原因方面取得进展。我们已进行了几处变更,以解决负责与EBS服务协调主机的子系统内资源争用加剧的现象。”

“虽然这些变更带来了一些改善,但我们尚未看到受影响的EBS卷完全恢复如初。”

AWS遇到问题的同时,其他网站也出现了性能问题。

消息传递服务Signal发推文道:“坚持住,伙计们!由于托管服务故障影响了我们的部分服务,Signal目前宕机。我们正在努力恢复正常。”

Nest表示,其用户在登录时遇到了问题,但局势已得到了控制。

AWS故障更新: