在《自然通讯》上发表的一项研究中,研究小组以一系列包含定制合成的小分子的混合物的形式存储了各种图像文件-毕加索绘画,埃及神阿努比斯和其他人的图像。研究人员总共存储了200千字节的数据,他们说这是迄今为止使用小分子存储的最多数据。研究人员说,与传统的存储方式相比,这不是很多数据,但是在小分子存储方面,这是一个重大进步。
布朗的工程学院助理教授,该研究的作者雅各布·罗森斯坦说: “ 我认为这是向前迈出的重要一步。” “ 大量独特的小分子,我们可以存储的数据量以及数据读取的可靠性显示了进一步扩大这一规模的真正希望。”
随着数据领域的不断扩展,正在做大量工作来寻找新的和更紧凑的存储方式。通过在分子中编码数据,有可能在仅几毫米的空间中存储相当于TB级的数据。大多数有关分子存储的研究都集中在长链聚合物(如DNA)上,而DNA是众所周知的生物学数据载体。但是,与长聚合物相比,使用小分子具有潜在的优势。与合成DNA相比,小分子的生产可能更容易且更便宜,并且理论上具有更高的存储容量。
布朗研究小组在化学教授布伦达·鲁宾斯坦(Brenda Rubenstein)领导的美国国防高级研究计划局(DARPA)资助下,一直在努力寻找使小分子数据存储可行且可扩展的方法。
为了存储数据,该团队使用了小金属板,这些金属板上排列着1500个直径小于一毫米的小点。每个斑点包含分子的混合物。每种混合物中是否存在不同分子指示了数字数据。每个混合物中的位数可以和可用于混合的不同分子库一样大。然后可以使用质谱仪读取数据,质谱仪可以识别每个孔中存在的分子。
在去年发表的一篇论文中,布朗团队表明,他们可以使用一些常见的代谢物(生物体用来调节新陈代谢的分子)将图像文件存储在千字节范围内。对于这项新工作,研究人员能够通过合成自己的分子,极大地扩展其库的大小,从而扩展其可以编码的文件的大小。
该团队利用Ugi反应制造了分子。Ugi反应是制药行业常用的一种技术,用于快速生产大量不同的化合物。Ugi反应将四大类试剂(胺,醛或酮,羧酸和异氰酸酯)组合成一个新分子。通过使用每种类别的不同试剂,研究人员可以快速产生各种各样的不同分子。对于这项工作,研究小组使用了五种不同的胺,五种醛,十二种羧酸和五种异氰酸酯,以不同的组合生成了1,500种不同的化合物。
“ 这里的优势是库的潜在可伸缩性,” Rubenstein说。“ 我们仅使用27种不同的成分就可以在一天之内制作出一个1,500分子的文库。这意味着我们不必出去寻找1,500个独特分子。”
从那里开始,研究小组使用化合物的子库对图像进行编码。32位化合物库用于存储埃及神阿努比斯的二进制图像。575化合物库用于编码0.88兆像素的毕加索小提琴绘画。
用于化学文库的大量分子也使研究人员能够探索替代的编码方案,从而使数据的读取更加可靠。质谱法非常精确,但并不完美。因此,与用于存储或传输数据的任何系统一样,该系统将需要某种形式的错误校正。
论文第一作者布朗大学研究生克里斯·阿卡迪亚(Chris Arcadia)说: “ 我们设计库和读取数据的方式包括使我们能够纠正某些错误的额外信息。” “ 这帮助我们简化了实验流程,并且仍然获得了高达99%的准确率。”
研究人员说,还需要做更多的工作才能使这个想法达到有用的规模。但是,创建大型化学库并将其用于编码更大文件的能力表明该方法确实可以扩大规模。
罗森斯坦说: “ 我们不再受限于化学库的大小,这确实很重要,” “ 这是这里向前迈出的最大一步。几年前,当我们开始这个项目时,我们就这种规模的东西在实验上是否可行进行了一些辩论。因此,我们能够做到这一点真是令人鼓舞。”
论文的其他共同作者是Eamonn Kennedy,Joseph Geiser,Amanda Dombroski,Kady Oakley,Shui-Ling Chen,Leonard Sprague,Mustafa Ozmen,Jason Sello,Peter M.Weber,Sherief Reda,Christopher Rose和Eunsuk Kim。
这项工作是由DARPA(W911NF-18-2-0031)和国家科学基金会(1941344)资助的。