“瞬态电压”导致网络设备重启:谷歌云新区域瘫痪

australia-southeast2云区域上线近一个月就遭遇了重大故障。

7月25日,谷歌云推出了一个新区域,大肆宣传位于墨尔本的australia-southeast2这个新数据中心将如何加速澳大利亚的数字化转型,并以多种方式让世界变得更美好。

8月24日,该区域遭遇了严重故障。当地时间下午晚些时候,该区域的用户无法在谷歌云引擎(Google Cloud Engine)中创建新的虚拟机。负载均衡系统无法正常使用,云存储也是如此。总共13项服务遇到了问题。

大概一个小时后情况有所改善,一些服务恢复正常,但受影响的服务数量增加至17项。

等到所有服务恢复正常,受影响的服务数量又增加了一项,谷歌针对这次事件的最终分析提到了23项服务受影响。

分析结果表明,虽然这次事件的潜在影响持续了40分钟,但服务在之后的几个小时内仍然难以使用。

谷歌表示,这次事件的根源是“公共IP流量连接”失败,初步分析原因是“网络设备的馈电线遭遇瞬态电压,导致设备重启”。

“瞬态电压”是一种现象,指短时间内出现异常高的能量尖峰,有时归因于雷击等事件。

建立数据中心是为了遭到此类事件后存活下来,或者至少理应如此。然而,在开张营业一个月内,australia-southeast2就不幸中招。

谷歌没有说明重启的网络设备是属于自己还是属于供应商。不管怎样,这是表明云绝非万无一失的另一个教训。