降低机械硬盘故障率是头等大事,一直在故障率上吃苦头的希捷现在老毛病似乎又犯了——来自OEM的消息指出,希捷在2014年~2015年出货的企业级硬盘,代号Megalodon与代号Makara的Enterprise Capacity 3.5(以前叫做Constellation ES)的硬盘在启用后的一年内死亡率竟高达10%~15%!(根据之前Backblaze的调查,即便是普通台式机硬盘一年内的故障率也仅为4%)
涉及本次故障的产品,接口有SATA/SAS两种,容量横跨500GB~4TB,几乎可以说是Enterprise Capacity 3.5系列企业级硬盘全军覆没。
两款希捷企业级硬盘被广泛使用在内国内门户、电商、云计算公司的数据中心内,让众多企业用户苦不堪言。为了避免希捷企业级硬盘过快阵亡导致的Hadoop架构数据丢失,许多企业用户已经在Hadoop环境下将单块硬盘的写入速度从硬盘最高速度强制降低到了40MB/s,希望能延年益寿。对于故障率过高现象,希捷尚在查找原因,并为OEM厂商提供了了Beta版固件,但并未提供最终的故障解决方案以及宣布彻底修复缺陷。
在我们看来,希捷Enterprise Capacity 3.5系列硬盘为了在容量上与HGST竞争,采用了希捷从未使用过的6碟封装架构,也许过多的碟片、磁头以及缺少全盘充氦这样的降温措施才最终导致了产品大面积故障?
一直以来,我们都认为企业级硬盘有着更高的可靠性和更稳定的表现,希捷企业级硬盘本次爆出的故障,再度改变了我们的认识——实际上在SSD咄咄逼人的今天,机械硬盘如果连可靠性都不再有优势,那被彻底抛弃绝对是时间问题。
还记得希捷工程师希捷工程师Alvin Cox在JEDEC上发布的报告吗?那时候希捷说固态硬盘(SSD)只要连续断电的时间超过7天,其内部存储的数据就有很可能丢失,所以要安全可靠首选希捷硬盘。想不到豪言壮语不过半年,自家就后院起火。