科技飞速发展,数据指数增长,传统的数据存储方案已经不能满足我们的需求。不少机构和学者都在研究和探寻新的数据存储方式,其中基于DNA的存储是最令人好奇的一个,而且最近又有了一点突破。
北卡罗莱纳州立大学(NCSU)的研究团队刚刚在DNA存储实用化方面又迈出了一步。
在过去的几年里,研究人员在尝试将数据编码到基因组中取得了成功: 最著名的可能是2017年,当时哈佛大学的基因组学研究人员将一部短片编入活细菌的基因组中,将其复制并成功实现提取和解码。
“DNA系统因其潜在的信息存储密度而具有吸引力; 他们理论上可以存储数十亿倍于传统电子设备中存储的数据量,“北卡罗来纳州电气和计算机工程副教授James Tuck说。“但这里面临的两大挑战是,如何识别包含您正在寻找的文件的DNA链?一旦你确定后,你如何删减编辑使它们可以被阅读?并且这样做而不会破坏数据结构?
这些正是塔克和其他NCSU研究人员试图解决的问题。为了解决文件识别挑战,他们使用了两个嵌套的引物结合序列 - 首先鉴定含有初始结合序列的链,然后鉴定含有第二个结合序列的那些链的子集。“这使估计的文件名数量从大约30,000增加到大约9亿,”塔克说。
对于提取挑战,研究人员放弃了现有技术:这些现有技术制造了相关DNA链的许多拷贝,导致其信号压倒样品的其余部分并允许容易提取,这是以效率为代价。相反,他们将小分子标签附加到用于识别目标链的引物上。引物找到目标链,复制它,并将副本留在分子标签上。然后,设计用于结合单个标签的分子微珠收集标记的链,允许它们通过磁体回收。
“该系统使我们能够检索与特定文件相关的DNA链,而无需制作每条链的多个拷贝,同时还保留了数据库中的原始DNA链,”NCSU化学和生物分子工程助理教授Albert Keung说。 。
这些技术一起被称为DNA富集和嵌套分离 或DENSe。研究人员希望扩大DENSe并使用更大的数据库进行测试,但预计成本可能是一个主要限制因素。
关于论文
本文讨论的“ 驱动基于DNA的信息存储系统的可扩展性 ”的论文发表在2019年5月的ACS Synthetic Biology上。它由Kyle J. Tomek,Kevin Volkel,Alexander Simpson,Austin G. Hass,Elaine W. Indermaur,James M. Tuck和Albert J. Keung撰写。
论文摘要:
DNA的极端密度比目前的存储介质具有引人注目的优势; 但是,为了达到实际能力,需要新的组织和获取信息的系统。在这里,我们使用化学手柄从模拟5 TB数据的复杂DNA数据库中选择性地提取独特文件,并设计和实现嵌套文件地址系统,将DNA存储系统的理论最大容量提高5个数量级。这些进步使得基于DNA的数据存储系统的开发和未来扩展具有现代容量和文件访问能力。