细数2012年云计算9大知名宕机事件
尽管投入各种高新复杂技术,尽管投入海量巨资,云计算还是显得有些脆弱,在过去的几年里不乏动辄就宕机数小时的事件,甚至有的长达一天或数天,并导致数据丢失。
微软Azure
2012年,云服务的中断屡屡让提供商们尴尬不已,Thinkstrategies创始人Jeff Kaplan给了一些关于云计算的永不过时的简单建议。
以下是本年度云服务宕机事件一览:
2月28日,由于“闰年bug”导致微软Azure在全球范围内大面积服务中断,中断时间超过24小时。
微软表示该软件BUG是由于闰年时间计算不正确导致。
这一事件激起了许多用户的强烈反应,许多人要求微软为此做出更合理详细的解释。
亚马逊AWS
6月15日,亚马逊北维吉尼亚的数据中心遭遇停电,由此导致亚马逊网络服务AWS中断约6个小时,影响波及亚马逊弹性计算EC2、亚马逊关系数据库服务以及亚马逊弹性魔豆AWS Elastic Beanstalk。
北维吉尼亚数据中心是亚马逊使用最久的数据中心,在2011年以及今年10月都曾发生过宕机事故,导致用户信心流失不少。
对于亚马逊的有些合作伙伴来说,这种状况往往会拖后腿。
“我很喜欢亚马逊,但是宕机的时候也真是无能为力,尽管我也知道传统IT数据中心也会遇到这种情况”,Stratalux公司CEO Jeremy说。中断事故导致了他的一位客户服务中断了1个小时。
微软Windows Azure再次宕机
7月26日,Azure故障,导致西欧用户受影响。微软对故障的解释是“由于错误配置了网络设备导致了西欧区域的服务网络中断”。
此次中断持续2.5小时。微软表示此次事故中并无用户数据丢失。
Google Talk
在微软Azure宕机的同一天,Google Gmail用户使用的Gtalk中断了近5小时。
Gtalk服务的控制面板页为用户提供了因服务中断所导致的升级。Google对此也做出了道歉“请相信google是极度重视系统可靠性的,我们会更加注意提升我们系统的性能”。
GoDaddy
9月11日,网络托管和电子邮件服务提供商GoDaddy遭遇6小时服务中断,原因是网络故障,起先怀疑是著名黑客组织Anonymous所为,但该组织予以了否认。
该公司称中断的原因是由于内部网络故障导致路由表错误。
在10月上旬,GoDaddy宣布他们计划关闭其云服务业务,其SMB将会整合到其他服务里。
又是亚马逊AWS
10月22日,位于北维吉尼亚的亚马逊网络服务AWS又挂了,影响了包括Reddit、Pinterest等知名大网站。
中断影响了弹性魔豆服务,其后是弹性魔豆服务的控制台,关系数据库服务,弹性缓存,弹性计算云EC2,以及云搜索。
这次事故让很多人认为,亚马逊是应该升级其北维尼吉亚数据中心的基础设施了。
Google App Engine
GAE是用于开发和托管WEB应用程序的平台,数据中心由google管理,中断时间是10月26日,持续4小时,因为突然变得反应缓慢,而且出错。受此影响,50%的GAE请求均失败。
google表示没有数据丢失,应用程序行为也有备份可以还原。为表歉意,google宣布11月份用户可以
google表示他们正在加强其网络服务以应对网络延迟问题,“我们已经增强了流量路由能力,并调整了配置,这些将会有效防止此类问题再次发生”。
在google服务故障的当天,Dropbox和Tumblr也发生了服务中断。不过并未找到三者之间存在的关系。
Tumblr
GAE中断的当天,著名微博客平台和社交网站Tumblr也发生故障。几小时后修复,该公司也称将会发布详细的事故报告。
但此后他们尚未做出进一步的解释。
Dropbox
10月26日,在线存储公司Dropbox也发生服务中断。
当时网站显示错误信息“抱歉,网站出问题了,不过请勿担心,数据都很安全,我们也在尽快修复。”
此后他们也并未做出进一步的解释。
下一篇: 国内服务器虚拟化厂商何去何从?