/ 中存储网

Backblaze:2020年硬盘故障率比较,165530个硬盘的故事

2021-02-06 19:32:58 来源:中存储

国外云存储厂商Backblaze已经连续多年推出了其硬盘故障率统计报告,所有数据都来自该公司正在使用的各种型号硬盘,且每种型号的硬盘数量均大于60个,这样的真实应用场景下的数据统计,客观的反映了各品牌硬盘质量。

2020年,Backblaze添加了39,792个硬盘,截至2020年12月31日,我们管理着165,530个硬盘。其中有3,000个引导驱动器和162,530个数据驱动器。我们将在本报告的后面部分讨论引导驱动器,但是首先我们将重点关注截至12月底在我们的数据中心中运行的数据驱动器模型的HDD故障率。此外,我们将欢迎Western Digital返回农场,并看看我们新生的16TB和18TB驱动器。在此过程中,我们将分享对所提供数据的观察和见解,并且一如既往,我们期待您在评论中也这样做。

2020年硬盘故障率

到2020年底,Backblaze监视了162,530个用于存储数据的硬盘。为了进行评估,我们从考虑中删除了231个用于测试目的的驱动器以及那些我们没有至少60个驱动器的驱动器模型。到2020年,我们剩下162,299个HDD,如下所示。

Backblaze:2020年硬盘故障率比较,165530个硬盘的故事

观察

结果上面未列出的231个驱动器要么用于测试,要么在一年中的任何时候都没有至少60个相同型号的驱动器。所有驱动器,数据驱动器,引导驱动器等的数据都可以从HDD测试数据网页上下载。

对于少于25万个驱动器日的驱动器,没有任何关于驱动器故障率的结论是合理的。一年来没有足够的数据得出任何结论。我们提供的模型的行驶天数少于250,000,仅出于完整性考虑。

对于2020年内驱动器日数超过25万的驱动器型号,希捷6TB驱动器(型号:ST6000DX000)以0.23%的年故障率(AFR)领先。在列出的所有驱动器中,该模型的平均寿命也是最老的。紧随其后的是HGST的6TB Seagate型号:HGST的4TB硬盘(型号:HMS5C4040ALE640)为0.27%,4TB的硬盘(型号:HMS5C4040BLE640)为0.27%,8TB硬盘(型号:HUH728080ALE600)为0.29% ,而12TB硬盘(型号:HUH721212ALE600)为0.31%。

所有驱动器型号的2020年AFR为0.93%,不到2019年AFR的一半。我们将在本报告的后面部分对此进行讨论。

2020年的新增功能

我们的目标是在2020年初使我们合格的数据中心中使用的驱动器型号数量多样化。为此,我们在这一年中对9种新驱动器型号进行了认证,如下所示。

Backblaze:2020年硬盘故障率比较,165530个硬盘的故事

实际上,到2020年,我们的服务器场还新增了两个HDD型号:具有26个驱动器的16TB Seagate驱动器(型号:ST16000NM005G)和具有40个驱动器的16TB Toshiba驱动器(型号:MG08ACA16TA)。每个都低于我们的60驱动器阈值,因此未列出。

驱动器多样性

随着Covid-19效应在2020年3月开始渗透到世界经济中,验证更多驱动器模型的目标在2020年被证明是预言性的。到那时,我们正朝着我们的目标迈进,而与此同时,目标却越来越少作为一种创新的解决方案,而不是耕种驱动,多样化的驾驶模式是我们用来通过大流行的头几个月中普遍存在的制造和运输延迟来管理供应链的策略之一。

西部数据退货

上一次在我们的报告中列出西部数据(WDC)驱动器型号是19年第二季度。仍然有3个6TB WDC驱动器在使用中,还有261个WDC启动驱动器,但在我们的报告中都没有列出,因此直到现在还没有WDC驱动器。截至12月31日,在20年第四季度,总共安装了6002个14TB驱动器(型号:WUH721414ALE6L4),并且可以运行。

这些驱动器显然与HGST驱动器共享其血统,但它们将制造商报告为WDC与HGST。型号相似,前三个字符从HUH更改为WUH,后三个字符从604更改为例如6L4。我们不知道该更改的重要性,也许是工厂位置,固件版本或其他名称。与所有主要的驱动器制造商一样,该型号带有与每个驱动器型号相关的模式信息,并且不是随机生成的,因此6L4字符串似乎表示有用的东西。

WDC再次大放异彩,因为该驱动器型号的AFR仅为0.16%–安装了6002个驱动器,但平均仅使用1.7个月。尽管如此,在此期间只有1次失败,所以他们还是一个了不起的开端。我们期待着他们在未来几个月的表现。

希捷的新型号

2020年,我们的农场中将有6种希捷硬盘型号。上表列出了其中的5种型号,其中一种型号只有26种硬盘,因此未列出。这些驱动器的大小从12TB到18TB不等,可用于迁移替换和新存储。作为一个整体,它们总共有13,596个驱动器,累计1,783,166个驱动器日,只有46个故障,AFR为0.94%。

东芝提供更多的零位

2020年,新的Toshiba 14TB驱动器(型号:MG07ACA14TA)和新的Toshiba 16TB(型号:MG08ACA16TEY)被引入我们的数据中心,它们正将零故障归零。虽然每种驱动器型号仅安装了大约两个月,但它们是一个良好的开端。

比较2018年,2019年和2020年

的硬盘统计数据下表比较了过去3年中的每一年的AFR。每年的数据仅包括该年,以及每年年底提供的驱动器型号。

Backblaze:2020年硬盘故障率比较,165530个硬盘的故事

2020年的年度故障率(AFR)

下降2020年的AFR下降至1%以下,降至0.93%。在2019年,这一比例为1.89%。与去年同期相比下降了50%以上。那么,为什么2020年AFR这么低?答案:这是集体努力。首先,较旧的驱动器:4TB,6TB,8TB和10TB整体驱动器在2020年会更好,从2019年的1.35%AFR下降到2020年的0.96%AFR。在规模范围的另一端,我们总共增加了30,000个更大的驱动器:14TB,16TB和18TB,它们在2020年的整体AFR为0.89%。最后,12TB整体驱动的2020 AFR为0.98%。换句话说,无论驱动器是旧的还是新的,或大或小,它们在2020年的环境中均表现良好。

终身HDD统计信息

下表显示了截至2020年12月31日生产的所有驱动器型号的生命周期AFR。

Backblaze:2020年硬盘故障率比较,165530个硬盘的故事

AFR和置信区间

置信区间使您对相应的AFR值有用。较窄的置信区间范围要好于较宽的范围,而较宽的范围则意味着相应的AFR值在统计上不是有用的。例如,18TB希捷硬盘(型号:ST18000NM000J)的置信区间为1.5%至45.8%。这是非常广泛的,应该得出的结论是,相应的12.54%AFR不能真正衡量该驱动器模型的故障率。需要更多数据。另一方面,当我们查看14TB东芝硬盘(型号:MG07ACA14TA)时,范围从0.7%到1.1%相当窄,我们对0.9%AFR的信心更加合理。

3,000个引导驱动器

我们总是从报告中排除引导驱动器,因为它们的功能与数据驱动器有很大不同。尽管看起来似乎并不明显,但是拥有3,000个启动驱动器还是一个里程碑。这意味着截至12月31日,我们有3,000个Backblaze存储仓投入使用。所有这些存储仓都被组织为每个20个存储仓的Backblaze Vault或150个Backblaze Vault。

在过去的一年左右的时间里,我们从使用HDD转向使用SSD作为启动驱动器。今天,我们有1,200多个SSD作为引导驱动器。我们正在验证我们在这些SSD引导驱动器上收集的SMART和故障数据。