细数2012年云计算9大知名宕机事件

程序员文章站 2022-07-08 18:18:15

　　尽管投入各种高新复杂技术，尽管投入海量巨资，云计算还是显得有些脆弱，在过去的几年里不乏动辄就宕机数小时的事件，甚至有的长达一天或数天，并导致数据丢失。　　微软Azure...

　　尽管投入各种高新复杂技术，尽管投入海量巨资，云计算还是显得有些脆弱，在过去的几年里不乏动辄就宕机数小时的事件，甚至有的长达一天或数天，并导致数据丢失。

　　微软Azure

　　2012年，云服务的中断屡屡让提供商们尴尬不已，Thinkstrategies创始人Jeff Kaplan给了一些关于云计算的永不过时的简单建议。

　　以下是本年度云服务宕机事件一览：

　　2月28日，由于“闰年bug”导致微软Azure在全球范围内大面积服务中断，中断时间超过24小时。

　　微软表示该软件BUG是由于闰年时间计算不正确导致。

　　这一事件激起了许多用户的强烈反应，许多人要求微软为此做出更合理详细的解释。

细数2012年云计算9大知名宕机事件

　　亚马逊AWS

　　6月15日，亚马逊北维吉尼亚的数据中心遭遇停电，由此导致亚马逊网络服务AWS中断约6个小时，影响波及亚马逊弹性计算EC2、亚马逊关系数据库服务以及亚马逊弹性魔豆AWS Elastic Beanstalk。

　　北维吉尼亚数据中心是亚马逊使用最久的数据中心，在2011年以及今年10月都曾发生过宕机事故，导致用户信心流失不少。

　　对于亚马逊的有些合作伙伴来说，这种状况往往会拖后腿。

　　“我很喜欢亚马逊，但是宕机的时候也真是无能为力，尽管我也知道传统IT数据中心也会遇到这种情况”，Stratalux公司CEO Jeremy说。中断事故导致了他的一位客户服务中断了1个小时。

　　微软Windows Azure再次宕机

　　7月26日，Azure故障，导致西欧用户受影响。微软对故障的解释是“由于错误配置了网络设备导致了西欧区域的服务网络中断”。

　　此次中断持续2.5小时。微软表示此次事故中并无用户数据丢失。

细数2012年云计算9大知名宕机事件

　　Google Talk

　　在微软Azure宕机的同一天，Google Gmail用户使用的Gtalk中断了近5小时。

　　Gtalk服务的控制面板页为用户提供了因服务中断所导致的升级。Google对此也做出了道歉“请相信google是极度重视系统可靠性的，我们会更加注意提升我们系统的性能”。

细数2012年云计算9大知名宕机事件

　　GoDaddy

　　9月11日，网络托管和电子邮件服务提供商GoDaddy遭遇6小时服务中断，原因是网络故障，起先怀疑是著名黑客组织Anonymous所为，但该组织予以了否认。

　　该公司称中断的原因是由于内部网络故障导致路由表错误。

　　在10月上旬，GoDaddy宣布他们计划关闭其云服务业务，其SMB将会整合到其他服务里。

　　又是亚马逊AWS

　　10月22日，位于北维吉尼亚的亚马逊网络服务AWS又挂了，影响了包括Reddit、Pinterest等知名大网站。

　　中断影响了弹性魔豆服务，其后是弹性魔豆服务的控制台，关系数据库服务，弹性缓存，弹性计算云EC2，以及云搜索。

　　这次事故让很多人认为，亚马逊是应该升级其北维尼吉亚数据中心的基础设施了。

细数2012年云计算9大知名宕机事件

　　Google App Engine

　　GAE是用于开发和托管WEB应用程序的平台，数据中心由google管理，中断时间是10月26日，持续4小时，因为突然变得反应缓慢，而且出错。受此影响，50%的GAE请求均失败。

　　google表示没有数据丢失，应用程序行为也有备份可以还原。为表歉意，google宣布11月份用户可以

　　google表示他们正在加强其网络服务以应对网络延迟问题，“我们已经增强了流量路由能力，并调整了配置，这些将会有效防止此类问题再次发生”。

　　在google服务故障的当天，Dropbox和Tumblr也发生了服务中断。不过并未找到三者之间存在的关系。

细数2012年云计算9大知名宕机事件

　　Tumblr

　　GAE中断的当天，著名微博客平台和社交网站Tumblr也发生故障。几小时后修复，该公司也称将会发布详细的事故报告。

　　但此后他们尚未做出进一步的解释。

细数2012年云计算9大知名宕机事件

　　Dropbox

　　10月26日，在线存储公司Dropbox也发生服务中断。

　　当时网站显示错误信息“抱歉，网站出问题了，不过请勿担心，数据都很安全，我们也在尽快修复。”

　　此后他们也并未做出进一步的解释。