/ 中存储网

数据中心设计认证评估有必要吗?

2014-08-18 10:10:20 来源:中存储

数据中心设计者无法自行评定Uptime、TIA、LEED或其他认证级别是有原因的。

Uptime Institute级别目的是为了描述设施已经实现和没有实现,可能对数据中心冗余与故障停机时间造成的影响。Uptime等级是评估数据中心设计建造的可靠性与可用性级别的切实方法。

然而,Uptime级别因不同数据中心设计者而有不同的解释。因此,自称的类似设计认证,实际缺乏可靠支持。合法的数据中心认证需要经过Uptime Institute的严格审查才能获得。

其他数据中心设计认证也按照相同方式运作,如LEED(Leadership in Energy and Environmental Design)的金、银和白金级设施认证。设计师可以根据项目情况评估自己的LEED得点,但验证与真正的LEED认证只有U.S. Green Building Council能够颁发。

为什么说的和实际不一样?

Uptime Institute数据中心等级基于设施中最薄弱的一个环节。因此,即使是该设施拥有四级能源能源与冷却组件冗余——双不间断电源、水冷机组、配电设备、机房空气处理器以及四级双主动配电路径,如果只有单一管道路径,也只能获得Uptime二级认证。

许多数据中心设计师对这种僵化和专有的做法感到不满。设计师可能会认为单管在关键任务负载数据中心已经足够强大;第二条管并不是必须达到的可靠性目标。因此,对设计师来说,数据中心应该能够获得Uptime四级认证。

数据中心设计者往往因为自己在预算、空间限制以及之前的失败经验而妥协。例如,某个具备高度能源冗余的数据中心发生了冷却故障,因为数据中心经营者对冷却冗余预算非常苛刻,却对电力系统不惜成本。这样宣称的Tier III Plus或Near Tier IV数据中心设计级别是Uptime Institute明确否定的。设施好坏只取决于其最薄弱的环节。Uptime只会将如何真正地达到可用性目标作为认证标准,并确保任何修改都是在标准级别内。

TIA vs. Uptime Institute

不同数据中心设计认证的出现,试图取代Uptime认证等级,但并没有真正的流行起来。

电信工业协会(TIA)942-A标准发布了级别附加内容,但实际用途是评估数据中心布线。附加标准F中阐述了Uptime Institute的基本定义。为了清楚地说明数据中心设计认证级别,Uptime采用罗马数字(级别I、II、III和IV),而TIA使用阿拉伯数字(级别1、2、3和4)。

这种方法更容易让设计人员根据不同标准来评估与分类数据中心基础设施各部分的耐用性。然而,TIA级别并不将数据中心作为一个整体来评估可靠性和可用性。Uptime Institute认为TIA-942-A部分分类不合法,而且对确保长期可靠性与停机时间没有任何价值。

设计认证要求的内容

获得等级认证只需要冗余组件——额外的能源供应、空调和水泵,对吗?事实并非如此。如果没有安置在适当的位置,没有注意它们如何连接、安装和标记,冗余组件不会增加任何可靠性。

不同级别的设计核心区别在于可同时维护的能力:数据中心在不影响计算机系统情况下维护所有系统组件的能力。

冗余组件经常会被以某种容易让设施出现故障的方式安装。安装选项同样还可能限制设施能力或在维护时对数据中心关键计算负载造成影响。其他常犯的错误包括定位控制和阀门在紧急时刻非常难访问,或者组件标签设置不合理与规划失误。未经确认的设计决定可能会把运营推入失败的陷阱,而这些问题是可以避免发生的。

TIA 942-A标准警告:“了解哪些可能影响数据中心运营风险的行为十分重要,不论它们是故意或偶然时间,还是自然行为。数据中心设计者、管理员和经理需要在两个方面进行重点评估,一方面尽可能减少危害设施的情况发生,一方面要做好应急预案。”

打造具有认证等级的数据中心

无论数据中心设计是否通过Uptime或TIA级别认证,真正关键的建筑设计任务,需知识渊博的团队协作,以免重蹈覆辙。

如果系统为满足认证等级而牺牲有效性或有用性,认证体系就被错误使用了。如果宣传已经达到三级或四级容错的数据中心出现故障,尤其是承载大规模云服务的设施,那么会有很多的用户受影响,数据中心运营商通过的认证将变得毫无意义并可能失去企业用户。

构建满足指定性能需求,而不考虑通过Uptime、TIA、LEED的US.Green Building Council或其他组织认证的数据中心设计其实是可行的。然而,专业的设计团队、更详细的设计文档和雇佣工程监理,都会花掉跳过认证后所节省的时间与成本。同行评估可以被作为认证评估过程的替代方案,找出潜在停机风险,用更现实灵活的方式处理,而不是按照认证的死板要求实现。

Uptime Institute要求所有目标在开始之前,必须根据实际预算进行设置,停机时间因为预算削减所产生的影响,是可以理解并在预期范围内。这就是为何没有通过严格认证就宣称自己通过设计等级不合法的原因。无论你是否通过认证,等级排名会被同行作为一种通信方式加以利用。