/ 中存储网

艺龙网宕机事件,存储故障20小时损失或超百万

2011-07-13 16:11:56 来源:太平洋电脑网

艺龙网宕机事件:

7月12日上午消息,因遭遇存储故障,从昨日下午2时起,提供在线服务的旅游网站艺龙开始无法访问,截至目前已经过去了20个小时。艺龙CEO崔广福通过新浪微博表示,艺龙工程师和EMC存储工程师正在紧张抢修中,预计今天上午能够恢复正常。截止今天中午12点30分,打开艺龙首页,显示的仍然是下面的页面:

 1

今日上午7:54,崔广福通过微博对外证实,艺龙网站的无法访问,是由于存储系统出现故障,导致全部服务中断,因此让访问艺龙的数十万用户失望而归。 

EMC存储设备故障:

中存储网从崔广福的微博中发现这次故障是由于其EMC存储设备故障引起。

“不能向客户和合作伙伴提供服务让我们心急如焚,我向所有受到影响的客户和合作伙伴郑重道歉!艺龙的工程师和EMC存储设备工程师已经连续奋战18个小时。”崔广福说。

1

受到存储系统故障的影响,艺龙网站、呼叫中心均已暂停服务。

截至发稿时,艺龙服务依然没有恢复。其主页依然显示“我们的系统正在升级中……”崔广福表示,“曙光已经出现,乐观估计服务有望在今天上午恢复”。

从崔广福的新浪微薄里我们得到的信息是,艺龙宕机是由于存储引起的,并且引起了网友的热议:

1

艺龙宕机损失有多大?

2011年第一季度主要业绩:

艺龙第一季度净营收(计入营业税和附加税)为人民币1.25亿元(折合1,900万美元),与去年同期的人民币1.01亿元(折合1,480万美元)相比,同比增长23%;(由此中存储网估计此次宕机损失为100万人民币左右)

对于艺龙来说,IT设备中断后,需要20几个小时才能恢复基本运营。每一小时带来的损失都是巨大的,而作为网站的核心存储,我们不知网站是否做好了充足的冗余备份业务,为什么一个存储系统的故障会导致网站与呼叫中心系统的长时间停运?艺龙有冗余体系吗?多点容错和灾备体系没有起作用吗? 一直以来,企业很少或根本没有考虑制定业务持续性计划的需要。一些企业由于业务的性质,可能针对特定的情景,编制了局部的灾难恢复计划。但即使有计划,也往往不一定对计划定期更新、演练,因此可以说没有得到真正的实施。

事故和灾难的发生是不可避免的。灾难一方面考验企业的风险管理能力,另一方面却给企业提供超越竞争对手的契机。因此,企业应该去对自身响应事故的能力做一个客观的评价,逐步建立一个可持续维护的业务持续性计划。艺龙此次的宕机在业内已经造成了不小的影响,相信灾备对于企业的重要性也是不言而喻的。

延伸阅读:互联网巨头们都在用什么样的存储系统?

上边我们看到了,艺龙在用EMC的产品;

新浪在用NetAPP存储:新浪采用NetApp存储打造超级门户网站

淘宝网,2006年前一直用NetAPP产品,现在淘宝网采用自主研发的TFS集群文件系统来解决海量小图片的读取和访问问题

H3C存储系统助力"搜狐博客2007声色版"

搜狐网采用初志CZSS集群存储应对访问压力

你知道更多互联网公司的存储应用案例?赶紧来中存储网提交,分享吧