/ 中存储网

2015年目前为止的十大云计算故障事件

2015-08-07 19:49:18 来源:ZDNet

乌云来袭

随着云技术逐渐成熟,云提供商也日益成熟,在大多数情况下,云的整体正常运行时间和稳定性也在提高。

提供商们不断向他们的SLA数字后面添加9,企业正积极对内部部署的基础设施实施虚拟化,创建动态的私有云,用以快速扩展到公共基础设施。

虽然云故障不像过去几年那么特别普遍了,但它给企业客户带来的伤害却比以前更大了。

迁移到云基础设施的关键任务工作负载数量激增,这进一步加大了短时间服务中断所导致的损害。每次故障,不管如何迅速补救,都会对技术信誉造成一定影响,阻碍客户更广泛的采用。

Verizon云,1月10日和11日

k5

云服务提供商最担心的就是长时间中断,而Verizon却让客户倍感震惊:使云服务在整个周末离线长达40小时,以实施一个全面的系统维护项目。

然而具有讽刺意味的是,这次对云基础设施进行升级的原因之一,是为了防止未来发生服务中断。

虽然很多客户对于他们的提供商故意切断云服务感到气恼,但也有一些人安慰自己,他们知道Verizon花费这40个小时用于增加无缝升级能力,这样未来在不中断的情况下就可以在实时系统上进行更新,甚至是不需要重启服务器。

Google Compute Engine,2月18日和19日

6

就在午夜之前谷歌IaaS产品的多个区域出现了故障。在大约1个小时的中断之后,在第二天凌晨1点针对大多数受影响客户的服务恢复正常。

一些连接问题持续了大约3个小时,在这期间大约40分钟时间内,由Google Compute Engine虚拟机发送出站的数据包不翼而飞。

谷歌表示,这个问题是“不可接受的”,并向受影响的客户道了歉。

AOL Mail,2月19日

2

当AOL的电子邮件服务从美国东部时间凌晨4点开始出现大范围故障的时候,显然很多人受到了实际上的影响。

这次故障是从英国开始蔓延至美国的,导致很多AOL用户无法登录进入他们的帐户。

Google Compute Engine,3月9日

6

另一个让谷歌IaaS云瘫痪的网络错误,是三周之前由出站流量中断所导致的。

这次故障的原因是一个错误的配置包以谷歌没有预料到的方式给一些服务器造成了影响。服务中断是从美国太平洋标准时间早上10点左右开始,持续了大约45分钟。

苹果iCloud,3月11日

8

这次故障导致全球有数百万人在长达12个小时内无法购买数字音乐、书籍或者应用。所幸的是,他们大多数人没有受到太大影响。

苹果在其道歉中将这次服务中断归咎于一次内部的DNS错误,使得iTunes和苹果商店服务瘫痪。一些iCloud电子邮件帐户也受到短暂影响。

微软Azure,3月16日

83

微软有两项Azure公有云服务中断了2个多小时,美国中部客户受到影响,微软称这次故障是“网络基础设施的问题”。

这次故障从美国中部时间下午1点开始,影响到微软Azure虚拟机(基础设施即服务)和Azure云服务(平台即服务)产品的客户,微软在其Azure状态网页上面报告了这次故障。

微软称这次故障是“部分服务中断”,并表示到美国中部时间下午3:19这项服务已经完全恢复到可用状态。

微软Azure,3月17日

h83

微软的公有云还没有坚持下24个小时,就发生了第二次故障,虚拟机、网站和其他云服务瘫痪数天时间,这一次影响到了客户更为密集的美国东海岸。

微软在其Azure状态页面上报告了这次从美国东部夏季时间下午1:30开始的故障。微软作为全球第二大公有云服务提供商,向客户通知称这次服务故障的根源是存储发生了问题。

星巴克,4月24日

aM802

当然,星巴克并不是一家云提供商,但却是云服务的早期采用者,星巴克将自己的CRM系统与POS机产生的客户数据进行了连接。

看起来对于云基础设施的依赖性已相当深入,一次故障在某种程度上让北美数千个星巴克门店收款机无法使用。当昏昏沉沉的客户希望从无处不在的星巴克那里买一杯傍晚的咖啡时,他们却一无所获。

客户数小时无法购买咖啡,一些门店早早就关门了,其他很多门店开始发放免费饮料。

星巴克很快就报告称没有故障了——这只是一次由系统日常刷新引发的中断。

苹果iCloud,5月20日

58

包括电子邮件在内的11项苹果服务遭遇了7个小时的中断。一些完全瘫痪了,其他一些只是运行地非常非常缓慢。

中断的服务包括iCloud Drive、Photos、Documents、Find My iPhone、Back to My Mac、iCloud Backup、iCloud Keychain、iCloud Mail、iMovie Theater以及iWork for iCloud Beta。

根据iCloud的系统状态页面显示,全球5亿iCloud客户中有大约40%受到了影响。

微软Exchange,7月15日

700

虽然这个Office 365托管的电子邮件故障似乎涉及范围并不大,但是也让微软在全球合作伙伴大会上倍感尴尬,云的稳定性正是这次大会的一个主题。

很多参加这次在佛罗里达州奥兰多举行的合作伙伴大会的微软合作伙伴都无法发送和接收电子邮件。