云计算宕机时我们该何去何从

导语:市面上主流的云服务提供商都强调自己服务具有高可靠性,然而商业宣传总是美好的,但企业有自己的一套替补方案不失为一个好主意。

如果你觉得最近云服务出现问题的消息不断传出,那么恭喜你还没有被云计算冲昏头脑。上个月很多用户都受到了云服务宕机的波及。类似的宕机事件以后可能会频繁发生,那我们不如先来看看最近的宕机事件以避免它发生在自己头上。

亚马逊AWS

9月20日亚马逊AWS宕机,影响了相当多的网站和应用长达五个小时的时间。最先出问题的是亚马逊DynamoDB服务,它随即又影响了亚马逊的其他服务,所以波及到了很多著名站点。

亚马逊花了两个小时找出问题所在,然后又花了三个小时进行修复。在这五个小时中,Netflix、Medium、Buffer、Reddit、Pcket、Product Hunt、SocialFlow、GroupMe和Viber等知名网站应用均受到了严重的影响,服务彻底终止或服务水平急剧降低。此外这次事件还影响到了亚马逊Echo上的语音服务Alexa助手。

Skype

紧接着一天后的9月21日,三亿的Skype用户发现他们无法登陆或者无法进行呼叫。虽然此次Skype宕机并没有影响到商业版和网页版,但宕机时间长达十五个小时。笔者作为一个专栏作家和网络直播嘉宾也受到了此次事件的影响。

Twitter

Twitter同微博一样,逐渐成为了人们获取突发消息的来源。在9月初,Twitter宕机了约一个小时,但通过第三方应用来使用Twitter的用户却并未受到影响。

富士通

8月22日位于硅谷的富士通数据中心因变压器故障影响供电,所以多种SaaS和公有云服务均暂时下线。受数据中心供电故障波及的用户有的花了五天才恢复正常。

Nest

谷歌旗下的智能家居公司Nest所提供的智能恒温器和摄像头的云服务在9月7日宕机约三小时。这是Nest一周之内第二次出现宕机事件。

现在有很多人使用云摄像头来作为安防手段,因此这次宕机时间也引发了云摄像头作为安防手段是否可靠的讨论。

云计算正日益融入我们的生活,可能有时候我们都意识不到自己正在使用云服务。正因为如此云计算宕机的影响才更严重。我想,最近一个月发生的这些宕机事件给我们的启示有三点:

  1. 云计算不是万灵丹,我们不过是租别人的计算机而已。因此自己数据中心可能出现的问题就算是转向了云计算也依然存在。
  2. 云计算极大简化了用户对资源的操作,但这有好也有坏。有不知多少人为了你能正常使用操碎了心,但出了问题的时候你作为用户完全什么也做不了。
  3. 企业有自己的替代方案很重要。可以是另一家云服务提供商,也可以是自己后备的数据中心。对于普通用户来说可能就是Skype和Twitter的替代产品了。

真心希望上个月发生的这些宕机事件只是个巧合罢了。

原文链接:What to Do When the Cloud Comes Crashing Down(译者/刘旭坤 审校/李子健 责编/仲浩)