大数据分析和人工智能的最新进展为企业积累有关其业务各个可衡量方面的信息提供了强大的动力,这不足为奇。现在,财务法规要求组织保留记录的时间比过去要长得多。因此,各行各业的公司和机构都在坚持越来越多。
研究表明[PDF] 记录的数据量正在以每年 30% 到 40% 的速度增加。与此同时,用于存储大部分数据的现代硬盘驱动器的容量正在以不到一半的速度增长。幸运的是,大部分信息不需要立即访问。对于这些事情,磁带是完美的解决方案。
事实上,世界上的大部分数据仍然保存在磁带上,包括基础科学的数据,如粒子物理学和射电天文学、人类遗产和国家档案、主要电影、银行、保险、石油勘探等等。甚至有一群人(包括我,受过材料科学、工程或物理学培训)的工作是不断改进磁带存储。
磁带已经存在很长时间了,是的,但该技术并没有被及时冻结。恰恰相反。就像硬盘和晶体管一样,磁带在过去几十年里取得了巨大的进步。
第一个商业数字磁带存储系统,IBM 的726 型,可以在一个磁带卷上存储大约 1.1 兆字节的数据。今天,一个现代磁带盒可以容纳 15 TB。单个机械手磁带库最多可包含 278 PB 的数据。将如此多的数据存储在光盘上将需要超过 3.97 亿个,如果堆叠起来将形成超过 476 公里高的塔。
确实,磁带无法提供硬盘或半导体存储器的快速访问速度。尽管如此,该媒体的优势还是很多的。首先,磁带存储更节能:一旦所有数据都被记录下来,盒式磁带就可以静静地放在机器人库的插槽中,根本不消耗任何电力。磁带也非常可靠,错误率比硬盘低四到五个数量级。磁带非常安全,具有内置的动态加密和由介质本身的性质提供的额外安全性。毕竟,如果磁带未安装在驱动器中,则无法访问或修改数据。鉴于通过网络攻击窃取数据的速度不断增加,这种“气隙”尤其具有吸引力。
磁带的离线特性还提供了一道额外的防线来抵御有缺陷的软件。例如,在 2011 年,软件更新中的一个缺陷导致谷歌意外删除了大约 40,000 个 Gmail 帐户中保存的电子邮件。尽管跨多个数据中心的硬盘驱动器上存储了多个数据副本,但还是发生了这种丢失。幸运的是,数据也记录在磁带上,谷歌最终可以从备份中恢复所有丢失的数据。
2011 年的 Gmail 事件是首次披露云服务提供商使用磁带进行运营的事件之一。最近,微软宣布其 Azure 存档存储使用 IBM 磁带存储设备。
照片:贝特曼/盖蒂图片社
1951 年:磁带首次用于在计算机 (Univac) 上记录数据。
尽管有所有这些优点,但公司使用磁带的主要原因通常是简单的经济学。磁带存储的成本是在磁盘上保存相同数量的数据所必须支付的费用的六分之一,这就是为什么您几乎可以在存储大量数据的任何地方找到磁带系统。但是由于磁带现在已经完全从消费级产品中消失了,大多数人都不知道它的存在,更不用说磁带录音技术近年来取得的巨大进步,并且在可预见的未来还会继续取得进步。
所有这一切都是说磁带已经存在了几十年,并且将在未来几十年继续存在。我怎么能这么确定?继续阅读。
磁带之所以能存活多久,是因为一个基本原因:它便宜。而且它一直在变得更便宜。但情况会一直如此吗?
您可能会认为,如果将更多数据塞入磁盘的能力正在减弱,那么磁带也必须如此,它使用相同的基本技术但更老。令人惊讶的现实是,对于磁带而言,这种容量的扩大并没有显示出放缓的迹象。事实上,它应该会以每年约 33% 的历史速度持续多年,这意味着您可以预期大约每两到三年容量翻一番。将其视为磁带的摩尔定律。
对于必须在保持不变的存储预算下处理数据爆炸的任何人来说,这都是个好消息。要了解为什么磁带相对于硬盘驱动器仍然具有如此大的潜力,请考虑磁带和硬盘驱动器的发展方式。
两者都依赖相同的基本物理机制来存储数字数据。它们以磁性材料薄膜中的窄轨道形式实现,其中磁性在两种极性状态之间切换。该信息被编码为一系列位,由沿轨道特定点的磁极性转变的存在或不存在来表示。自从 1950 年代推出磁带和硬盘驱动器以来,两者的制造商一直受到“更密集、更快、更便宜”的口号的推动。因此,两者的成本(以每 GB 容量为单位)都下降了许多数量级。
这些成本降低是磁性基板每平方毫米上可记录的信息密度呈指数增长的结果。该面密度是沿数据磁道的记录密度与沿垂直方向的磁道密度的乘积。
早期,磁带和硬盘驱动器的面密度相似。但是硬盘驱动器销售带来的更大的市场规模和收入为更大的研发工作提供了资金,这使他们的制造商能够更积极地扩大规模。因此,当前大容量硬盘驱动器的面密度大约是最新磁带驱动器的 100 倍。
然而,由于它们具有更大的可用于记录的表面积,最先进的磁带系统提供高达 15 TB的本机磁带容量 —大于市场上容量最大的硬盘驱动器。即使两种设备占用的空间大致相同,也是如此。
内外:现代线性开带 (LTO) 磁带盒由单个卷轴组成。插入磁带后,磁带会自动送入驱动机构内置的卷轴。 照片:维克多普拉多
除了容量之外,磁带和硬盘驱动器的性能特征当然大不相同。盒式磁带中的长磁带(通常为数百米)导致平均数据访问时间为 50 到 60 秒,而硬盘驱动器的平均数据访问时间仅为 5 到 10 毫秒。但令人惊讶的是,数据写入磁带的速度是写入磁盘速度的两倍多。
在过去几年中,硬盘上数据的面密度缩放已从其历史平均每年 40% 左右放缓至 10% 到 15% 之间。原因与一些基本物理学有关:要在给定区域中记录更多数据,您需要为每个位分配一个较小的区域。反过来,这会减少您在阅读时获得的信号。如果您过多地减少信号,它就会在由覆盖磁盘的磁性颗粒的颗粒性质产生的噪声中丢失。
可以通过使这些颗粒变小来减少背景噪音。但是很难将磁性颗粒缩小到超过一定的尺寸而不损害它们以稳定方式保持磁性状态的能力。可用于磁记录的最小尺寸在该行业中被称为超顺磁极限。磁盘制造商已经达到了它。
直到最近,这种放缓对消费者来说还不是很明显,因为磁盘驱动器制造商能够通过在每个单元中添加更多的磁头和盘片来进行补偿,从而在相同尺寸的封装中实现更高的容量。但是现在可用空间和增加更多磁头和盘片的成本都限制了驱动器制造商可以取得的收益,并且平稳期开始变得明显。
有一些技术正在开发中,可以使硬盘驱动器扩展到超越当今的超顺磁性极限。这些包括热辅助磁记录(HAMR) 和微波辅助磁记录(MAMR),这些技术可以使用较小的晶粒,从而允许磁化磁盘的较小区域。但是这些方法会增加成本并带来棘手的工程挑战。即使它们成功了,根据制造商的说法,它们提供的扩展可能仍然有限。例如,西部数据公司(Western Digital Corp.)最近宣布可能会在 2019 年开始出货 MAMR 硬盘,预计这项技术将使面密度每年仅增长 15% 左右。
相比之下,磁带存储设备目前在远低于超顺磁极限的面密度下运行。因此磁带的摩尔定律可以持续 10 年或更长时间,而不会遇到来自基础物理学的此类障碍。
尽管如此,磁带仍然是一项棘手的技术。它的可拆卸特性、使用薄聚合物基板而不是硬磁盘以及同时并行记录多达 32 条轨道为设计人员带来了重大障碍。这就是为什么我在IBM Research-Zurich 实验室的研究团队一直在努力寻找方法来实现磁带的持续扩展,要么通过调整硬盘驱动器技术,要么通过发明全新的方法。
2015 年,我们和我们在FujiFilm公司的合作者表明,通过使用垂直于磁带取向的超小钡铁氧体颗粒,可以以当今商业技术可实现的密度的 12 倍以上来记录数据。最近,我们与 Sony Storage Media Solutions 合作,展示了以大约是最先进磁带驱动器当前数字 20 倍的面密度记录数据的可能性。从这个角度来看,如果这项技术要商业化,现在可能需要十几个磁带盒来存档大预算电影的所有数字组件的电影制片厂将能够将所有这些组件安装在一个磁带。
数据洪流:现代磁带库可以存储数百 PB,而 1952 年推出的 IBM 726(右)只能存储几兆字节。 照片:大卫帕克/科学来源;右:IBM
为了实现这种程度的扩展,我们必须取得一系列技术进步。一方面,我们改进了读写磁头跟随磁带上细长磁道的能力,在我们最新的演示中,这些磁道只有 100 纳米左右的宽度。
我们还必须将数据读取器(一种用于读回记录数据轨道的磁阻传感器)的宽度从目前的微米尺寸减小到小于 50 纳米。结果,我们可以用这么小的阅读器接收到的信号非常嘈杂。我们通过增加介质固有的信噪比来进行补偿,该信噪比是磁性粒子的大小和方向及其组成以及磁带表面的光滑度和光滑度的函数。为了进一步提供帮助,我们改进了设备采用的信号处理和纠错方案。
为确保我们的新原型介质能够将记录的数据保留数十年,我们改变了记录层中磁性颗粒的性质,使其更加稳定。但这种变化首先使记录数据变得更加困难,以至于普通磁带传感器无法可靠地写入新媒体。因此,我们使用了一种特殊的写入磁头,它产生的磁场比传统磁头所能提供的磁场强得多。
结合这些技术,我们能够在我们的实验室系统中以每英寸 818,000 位的线性密度读取和写入数据。(由于历史原因,世界各地的磁带工程师以英寸为单位测量数据密度。)结合新技术可以处理的每英寸 246,200 个磁道,我们的原型单元实现了每平方英寸 201 吉比特的面密度。假设一个盒式磁带可以容纳 1,140 米的磁带——这是一个合理的假设,基于我们使用的新磁带介质的厚度减小——这个面密度对应于高达 330 TB 的盒式磁带容量。这意味着单个磁带盒可以记录与装满硬盘的独轮车一样多的数据。
在2015年,在信息存储产业联盟,包括惠普企业,IBM,甲骨文和Quantum,与学术研究团体的摆沿着一个组织,发布了它所谓的“国际磁带存储路线图。” 该预测预测到 2025 年磁带存储的面积密度将达到每平方英寸 91 Gb。根据这一趋势推断,到 2028 年它将超过每平方英寸 200 Gb。
该路线图的作者每个人都对磁带存储的未来感兴趣。但你不必担心他们过于乐观。我和我的同事最近进行的实验室实验表明,每平方英寸 200 Gb 是完全可能的。因此,在我看来,将磁带保持在至少十年的增长路径上的可行性是有保证的。
事实上,磁带可能是最后一个遵循摩尔定律式缩放的信息技术之一,即使不是更久,也可以在未来十年内保持这种缩放。而这种连胜反过来只会增加磁带相对于硬盘驱动器和其他存储技术的成本优势。因此,尽管您可能很少在黑白电影之外看到它,但磁带虽然很旧,但在未来几年仍会存在。
本文作为“磁带存储卷土重来”出现在 2018 年 9 月的印刷版中。
关于作者
Mark Lantz 是IBM Research Zurich的高级磁带技术经理 。