大多数数据中心都是精心设计而成的,很多人都误以为这样的数据中心只要追求高功效低能耗之外就可以了。因此,人们往往会忘记干净、清洁的环境对于数据中心有着重要的意义。有些数据中心甚至可能会因为户外颗粒或气体污染物的进入而处于有害环境中,在一些情况下,污染物还有可能形成于数据中心内部。为了避免数据中心的管理者们忘记这么重要的一点,今天我们就数据中心环境问题进行简单的探讨。
空气污染物对数据中心造成的影响主要分为三类:化学影响、机械影响和电学影响。电路板中的铜蠕变腐蚀和小型表面安装组件中的镀银腐蚀是两种常见的化学故障。机械影响包括散热片污染、光信号干扰、摩擦力增大等,电学影响包括电路阻抗和电弧的变化等。请注意,缩小电路板功能部件的尺寸并实现组件的小型化是改善硬件性能的必要条件,但是也会使硬件更易受到数据中心环境中的污染物的影响。制造商们一直致力于在不断缩小功能部件尺寸的同时维持硬件的可靠性,却又无需采取额外的高成本措施来加强所有的IT设备。他们的大多数IT设备都并非安装在腐蚀性环境中,腐蚀性环境会使设备面临更高的故障风险。
通过监控数据中心的粉尘和气体污染物来维持硬件的可靠性,这是数据中心管理员的职责,数据中心的清洁程度必须达到ISO14644-18级的标准。一般而言,只要采用以下所列的相应过滤方案,就能达到这样的清洁级别:
1.可按ANSI/ASHRAE标准127-2007"Methodof Testing for Rating Computer and Data Processing Room Unitary Air Conditioners"中的建议,使用MERV8过滤器不断地过滤室内空气;
2.可按标题为"ParticulateandGaseousContaminationinDatacomEnvironments"的ASHRAE书籍中的建议,使用MERV11或MERV13过滤器过滤进入数据中心的空气。应当减少数据中心内部的粉尘源。
气体污染物应符合已修改的ANSI/ISA-71.04-1985安全级别G1,以满足以下条件:
1.铜反应率低于300C/月,
2.银反应率低于300C/月,对于含有大量气体污染物的数据中心,强烈建议对进入数据中心的空气及数据中心内部的空气进行气相过滤。要维持IT设备的高度可靠性,并避免保修范围以外的硬件更换成本,请遵守此处所列的要求,这一点至关重要。
空气粉尘由粉尘引起的故障包括(但不局限于)以下几种(ASHRAE2009a):
机械影响
这些影响包括阻碍冷却气流、干扰移动部件、磨损、光干涉、互联干扰、表面变形(例如,磁性媒体)以及其他的类似影响;
化学影响
落在印刷电路板上的粉尘会导致组件腐蚀和/或临近的相隔功能部件短路;
电学影响
这些影响包括阻抗变化和电子电路导体发生桥接。
粉尘无处不在,即便采取最好的过滤措施,数据中心内还是会有粉尘。这些粉尘会落在电子硬件上。幸运的是,大多数粉尘都是无害的。只有在少数情况下,粉尘才会侵蚀电子硬件。
一般而言,数据中心内的有害粉尘中均含有大量离子,比如氯盐。这些有害粉尘主要来自直径为2.5-15μm的室外粗尘以及直径为0.1-2.5μm的室外微尘(Comizzoli1993)。粗尘颗粒中包含各种矿物性和生物性污染物(大多是因风蚀而形成的),可在空气中停留数日。微尘颗粒一般是由矿物燃料燃烧以及火山活动所形成的,可在空气中停留数年。各种巨大的盐水体也是数据中心空气粉尘污染物的一个主要来源,沿海地区的强风可将海盐向内陆方向吹进10公里(6英里)或者更远,而这些海盐能够毁坏这一范围内的电子设备(Bennett1969;Crossland1973)。
从环境中吸收湿气是粉尘损害印刷电路板可靠性的途径之一。湿尘中的离子污染物会降低印刷电路板表面的绝缘阻抗,更糟糕的是,它们还会通过离子迁移导致临近的相隔功能部件短路。
潮解相对湿度是指,粉尘吸收足够的水分变湿从而导致腐蚀和/或离子迁移时的相对湿度,这一湿度决定了粉尘的腐蚀性。当粉尘的潮解相对湿度高于数据中心的相对湿度时,粉尘处于干燥状态,不会造成腐蚀或者离子迁移。然而,在少数情况下,当粉尘的潮解相对湿度低于数据中心的相对湿度时,粉尘就会吸收湿气而变湿并导致腐蚀和/或离子迁移,从而降低硬件可靠性。Comizzoli等人在1993年所进行的某项研究显示,在全球各地,由停留在印刷电路板上的粉尘而引起的泄漏电流都会随着相对湿度的提高而呈现指数级的增长。这项研究使我们得到了以下结论:将数据中心的相对湿度保持在60%以下,这样可以将由停留的微尘而引发的泄漏电流保持在可接受的次μA级范围内。
少数情况下,数据中心内部也可能会产生有害粉尘。增湿器会通过蒸发空气中的水滴来提高室内湿度,如果加入增湿器的水含盐量高,而这些盐的潮解相对湿度又低于数据中心的相对湿度,就可能造成有害的室内粉尘污染。即使这些盐的浓度很低,也会造成严重的腐蚀和离子迁移威胁。通过使用逆向渗透法(ASHRAE2009a)来处理增湿器中的水,可以缓减这些与增湿器相关的腐蚀问题。
来自纸张、硬纸板或者纺织品的纤维性粉尘会污染散热片,并中断设备的冷却过程。数据中心操作员应避免在数据中心内大量使用这些材料。例如,新设备应在数据中心外拆箱,应将大量的打印机放置在其他位置。总的说来,大多数粉尘都是无害的。
少数情况下,当停留的粉尘的潮解相对湿度低于数据中心的相对湿度时,就有可能出现腐蚀和/或离子迁移问题。一般而言,数据中心的相对湿度必须保持在60%以下,以避免任何灰尘腐蚀硬件。锌晶须是颗粒污染物对硬件可靠性造成严重危害的另一种途径,它是数据中心内最常见的导电颗粒。
为了防止腐蚀,一些高架地板钢砖的底部都会镀上锌。支撑钢砖的纵梁和基座也会镀上锌。这些锌可能是通过电镀或热浸镀锌方式镀上去的。尽管锌晶须在这两种镀锌方式下都有可能出现,但是电镀锌上更易产生晶须(Brusse2004;Lahtinen2008)。有时,锌晶须可长达1至2毫米,在拆卸钢砖或拉动/拆卸地下电缆时,钢砖会被弄乱,这时锌晶须可能会发生移动并暴露在空气中,从而威胁到IT设备。如果IT设备吸入锌晶须,电压高于25V的电路中可能会出现短路,电弧,信号紊乱或者灾难性故障(Miller2007)。
有一种非常简单的锌晶须探测方式,这就是使用手电筒。拆下一块高架地板砖,将其立于光线较弱的区域中。打开手电筒,以45°角扫射钢砖底部。在亮光中闪烁的小斑点可能就是锌晶须。为了确认是否存在锌晶须,应当使用碳胶标签收集标本并在扫描电子显微镜(SEM)下查看。如果存在锌晶须,就应当采取补救措施,其中包括更换被污染的高架地板砖并聘请专业人士对数据中心进行清理。ISO14644-1已成为全球性的首要标准,用于根据空气中的颗粒浓度对空气清洁程度进行分级。
气体污染物含硫气体(如SO2和H2S)是数据中心内导致硬件腐蚀的最常见气体(Rice1981)。ANSI/ISA-71.04-198已发布了气体成分的环境限制。这些限制对于确定数据中心环境清洁度有着指导作用,但是,出于某些原因,对于测量腐蚀性或预测数据中心环境中的硬件故障率,它们却没有任何帮助。
首先,确定气体成分并不是一项简单的任务。
其次,一般来说,通过气体成分来预测腐蚀速率也不是一项十分直观的工作。气体间的协同作用会让情况变得更加复杂。例如,经证实,二氧化硫或氢化硫本身对于银或铜并没有十分强的腐蚀性,但是当它们同其他气体(如二氧化氮和/或臭氧)结合后,就会对银和铜产生强烈的腐蚀性(Volpe1989)。相对湿度对于铜的腐蚀速率有很大的影响,而银的腐蚀速率却与湿度无关(Rice1981)。
如ANSI/ISA-71.04-1985标准所述,要确定数据中心环境内的气体腐蚀性,有一种十分简便的量化方式,即所谓的"反应式监测法".该方法会将铜试样置于该环境中一个月,然后使用库伦还原法来分析腐蚀产物的厚度及化学性质。
但是,仅使用铜试样存在两个主要限制:
第一,对于会强烈腐蚀许多金属的污染物氯而言,铜并不十分敏感;
第二,铜的腐蚀度对于相对湿度又过于敏感。使用银试样有利于区分气体污染物与相对湿度对腐蚀性造成的影响。
如果结果表明,相对湿度对于腐蚀过程有显著的影响,那么只需降低数据中心的相对湿度,就能降低腐蚀性。现在通行的方法是同时使用银试样和铜试样,以便更好地了解环境中腐蚀气体的化学性质。表2:按ANSI/ISA-71.04-1985划分的气体腐蚀性等级严重等级铜的反应等级描述G1300C/月环境得到了良好的控制,腐蚀性不是影响设备可靠性的因素。温和G2300-1000C/月环境中的腐蚀影响可以测量,其可能是影响设备可靠性的一个因中等素。G31000-2000C/月环境中极有可能出现腐蚀现象。较严重GX>2000C/月只能在该环境中使用经过特殊设计和封装的设备。
目前,ANSI/ISA-7104-1985标准仅适用于铜腐蚀,然而正如上文所述,最好同时使用铜和银试样,以对数据中心的腐蚀性进行分级。换言之,对于一个被归入G1级严重等级的数据中心而言,铜和银的腐蚀速率限值不应超过300C/月。只有很少数的问题数据中心的铜腐蚀速率大于100C/月;而所有这些问题数据中心的银腐蚀速率都大于100C/月。
请注意,在这31个站点中,银腐蚀速率通常要比铜腐蚀速率高出一个数量级或更多。这项调查只针对已报告了硬件故障的数据中心,它清楚地指明了,铜腐蚀速率并不是硬件故障可能性的良好指标。要更好地根据铜银腐蚀速率来预测腐蚀相关故障,就需要对数据中心进行随机抽查,不论其是否出现过腐蚀相关故障。ANSI/ISA-71.04-1985是一个成熟且已被广泛接受的标准,它规定G1级严重等级的铜腐蚀速率应低于300C/月,这一数据说明"环境温和并得到了良好的控制,腐蚀性不是影响设备可靠性的因素".。
数据中心的气体污染物级别会受到位置及时间的影响。有利于监测气体腐蚀性的位置位于,机架进气口侧前方2英寸(5cm),离地面1/4及3/4机架高度处。理想情况下,应当进行全年监测,但随着数据中心历史记录的增多,可以只对已知的气体污染物处于高级别的月份进行监测。
反应式监测法要求将铜银试样暴露在外一个月,以便准确地测量环境腐蚀性。对于配有空气侧节能装置的数据中心,需要进行实时监测,以对数据中心的外部事件做出迅速反应;这些外部事件可能会释放出腐蚀性气体,而这些气体可能会流入数据中心。现在,共有两种市售的实时反应式监测器可供选择。其中一种使用石英晶体微量天平来测量腐蚀产物质量增长速率。另一种则通过测量金属薄膜阻抗的增长速率来确定气体的腐蚀性。气体的腐蚀性变化可通过实时探测得到,这样就能采取各种预防性措施,如防止外界腐蚀性空气进入数据中心。
对数据中心的气体进行气相过滤对于不符合已修改的ANSI/ISA-7104-1985铜银腐蚀G1级严重等级的数据中心,建议进行气相过滤。应对进入数据中心的气体进行气相过滤,以防止气体污染物进入数据中心。进气口的鼓风机可用来为数据中心增压,以避免受污染的室外空气渗入数据中心内部。还应通过气相过滤器对数据中心内的空气进行反复循环,以除去数据中心内部生成的污染物。建议您通过这些措施使气体污染物等级符合已修改的ANSI/ISA-7104-1985铜银腐蚀G1级严重等级。
2008年ASHRA数据通信设备环境指南为了提高设施操作的灵活性,尤其是朝着减少数据中心能耗的目标迈进,SDHRAETC9委员会修订了这些建议的设备环境规范,尤其是1级和2级的建议范围。现在,这两个环境级别的建议范围是相同的。这次修订扩大了建议的操作环境范围。建议范围的划定为数据中心操作员维持高可靠性并以最高能效运行数据中心提供了指导。IT制造商会在允许的范围内测试他们的设备,以验证设备能否在这些环境范围内正常工作。通常,制造商会在发布产品之前对其进行一系列的测试,以验证其产品能否在该环境范围内满足所有的功能需求。
这不是一种可靠性声明,而是事关IT设备的功能。但是,建议范围确实是一种可靠性声明。对于需要长时间工作的设备,IT制造商建议数据中心操作员将环境维持在建议的范围内。短时间超出建议限值也许不成问题,但是在接近允许限值的情况下运行数月会导致可靠性问题增多。通过检查大量IT制造商的可用数据,2008年的扩展建议范围是所有IT制造商一致认可的可接受范围。如果IT设备在此范围内工作,其整体可靠性就不会受到任何影响。
需要注意的是,应确保IT设备机架顶端满足适当的进气条件。许多数据中心机架顶端的进气口温度偏暖。当温热的机架废气无法直接返回到空气处理设备中时,情况更是如此。这些温暖的空气还会影响相对湿度,造成机架顶端的相对湿度值降低。
大多数中小型企业数据中心管理者却认为,有点灰尘根本不会影响到服务器,没什么大不了。但是专家们却表示说,这些灰尘尘埃肯定会影响服务器和数据中心其他设备的功能。
数据中心安装的全部都是灵敏设备,这与其他办公环境不同。灰尘颗粒不仅会影响设备的使用,而且超灵敏烟雾探测器也会探测出污染物的位置,当微粒增多时会误以为是烟雾而发出报警。当然,数据中心一定要避免出现这种情况。数据中心的清洁不仅要进行常规除尘、真空吸尘,而且还要对房子周围进行清洁。