/ 中存储网

从是方电讯机房起火 看数据中心安全管控

2013-04-15 09:30:00 来源:太平洋电脑网

据台湾媒体称:台北市数字通国际网络公司25日中午因机房内机电设施起火,整栋楼断电救火。导致同楼的大型网络交换中心、企业主机托管服务商“是方电讯”受到波及。最后造成台湾全岛网络瘫痪,甚至台湾多数电信运营商海外光缆出现问题,Yahoo、台湾高铁、微软公司MSN、中华电信、远传、台湾大宽频、威宝电信等都受其影响,许多知名网站也因此停运。当地民众更明显感受到网络连接异常缓慢,连3G网络都受到影响。

大楼起火,全台湾断网

是方电讯成立于1991年,是台湾地区中华电信旗下的子公司。主要从事二类电信事业、数据处理,070网络电话经营。合作伙伴包括新加坡的台湾新电讯、MCI世界通讯、中华电、速博与亚太固网等,上百家企业将网络主机放在是方机房委托其管理,连台湾麦当劳全台外送专线也因此停摆,台湾高铁也因此无法在线订票付款,并连带影响上百万消费者上网联机,此事件为当地历来人为原因导致规模最大的电信故障。受损严重,具体损失总额尚未统计出。

游戏、网络服务全中断

源起地下室UPS起火

25日早上台北市消防局接获报案后,消防人员10分钟即赶到现场。火灾发生地点是位于内湖区阳光街的丽源大楼,起火地点是位于地下2楼的UPS不间断电源和电池存放室,电池设备里的化学成分导致现场大量烟雾和闷烧情况。地下二层除了UPS后备电源设备之外,还有发电机等其他配套设施。

消防人员先使用二氧化碳对设备进行灭火,再用消防车拉水线进入起火地点洒水、降温,等待火源扑灭后,再进行排烟等后续消防流程。为了安全灭火,台北市消防局停止了整栋大楼电力供应。因此从25日中午开始,丽源大楼内的所有IT服务全部停机,各大网络服务跟着被中止。虽然起火点是地下室,大楼内的机房设备都没有遭到损害,但因为停电网络服务仍无法运转。

台湾网络带宽分配图

损失惨重

根据今年1月TWNIC公布的台湾网际网络连线频宽图,是方电讯的海底光缆交换中心掌握全台9成对外海底光缆网络服务,岛内各家ISP电信运营商,包括中华电信、远传、台湾大哥大、台湾固网、威宝电信等,甚至是Google自建的网底光海缆,都集中通过是方电讯的网络交换中心来进行DNS路由。海缆交换机停止服务,就等于台湾连外网络被关闭。

殃及池鱼

是方电讯总部大楼除了是海底光缆网络的交换中心,它同时还提供IDC机房出租、主机代管、VPN等网络服务,因而很多把服务器放在其中的用户如Yahoo、台湾高铁、微软公司MSN等公司的网站直接就无法访问。从TWNIC台湾网络连线图上看,台湾地区主要4座网络交换中心其中一座(TPIX)就位于是方电讯总部大楼,所幸它的数据流量仅占全部的5%,所以岛内的网络服务还不至于全部停摆。但由于威宝电信、台湾大哥大等的电话路由和机房设备也由是方电讯代管,因此也影响了部分手机3G网络服务。

灾备很重要

火灾抢救及时第二天凌晨大楼就恢复供电,不过很多客户反映直到第二日下午所有服务才恢复正常,此时断网事件已持续影响已近1天的时间。有业内人士透露,早上大楼电源重新供应后,是方电讯并没有第一时间立即开启所有设备恢复网络。因为担心如果一次开启所有设备,会因为设备太多瞬间电压过大而造成机器损坏,所以采用了分区域重启的方式。为此直到第二天下午才迟迟恢复全部服务

ISP灾备措施受质疑

正常情况下,任何一个大型网络中心机房都会有冗灾备份的基本措施。最经典的案例就是GOOGLE的机房,它在全世界各地有多处机房。任何一处完全损坏,都不会影响到它的服务。这次火灾事件影响如此严重,就在于ISP运营商没有做好DNS路由备份。当一个路由机房发生问题时,快速调整路由表把网络路径转移到其他备份机房,就能解决网络不通的问题。

经验教训

一般来说,中心机房的硬件设备主要由UPS电源、空调与加湿器、防雷、防火墙、服务器、磁盘阵列等设备组成,而机房安全管理包括设备安全管理、数据安全与备份两大块。 从设备安全管理上来讲,非人为因素管控包括温湿度管控、雷电预防、静电预防、水鼠虫尘等预防等,例如机房温度一般应保持在20℃±2℃,湿度应保持在50%,才能避免设备内部温度过高而降低使用寿命甚至烧毁等隐患。

人为可控的则包括消防系统管控、电源安全管控、软硬件防护管控等,例如,有的服务商会安装各种硬件防护设施保障硬件设备和网络系统正常运行,同时在技术人员和安全软件上发力以保证机房软件环境稳定运行,等等。而是方机房失火事件则很大程度归咎于消防预控机制的缺失。

外面经常讲“安全没有小事,预防重于泰山”,这一句放到任何行业都是真理,做好机房安全管理与防控工作就是对用户的最大回馈。是方机房失火事件尽管损失严重,但并不可怕,这是对我们安全管理与防控工作敲响的一道警钟,亡羊补牢,为时不晚。[返回频道首页]