即使存储密度达到新的高度,许多研究人员仍将目光投向了高密度信息存储的范式转变:将数据存储在构成DNA的四个核苷酸(A,T,G和C)中,这种方法有望实现数百万个效率是当前数据存储技术的三倍。尽管基于DNA的数据存储已经实现了许多次,但仍存在许多障碍,要将其从概念验证转变为可用于生产和常规使用的可扩展技术。现在,得克萨斯大学奥斯汀分校的一组研究人员克服了其中的一个障碍,即使链条受损,也可以提高DNA数据检索的可靠性。
“我们需要一种存储数据的方法,以便以可读格式在需要的时间和地点提供它们,”从事该项目的研究科学家Stephen Jones说。“这个想法利用了生物学数十亿年来一直在做的事情:将大量信息存储在一个很小的空间中,可以持续很长时间。DNA不会占用太多空间,可以在室温下存储,并且可以持续数十万年。”
但是,DNA容易出错-DNA的错误会改变整个序列,与传统数据存储介质中简单的丢失数据相比,破坏性要大得多。这意味着在现有的DNA数据存储实验中,将存储许多数据副本,以便检索程序可以相互评估重复项以发现错误。
该研究的作者之一,分子生物学副教授伊利亚·芬克尔斯坦(Ilya Finkelstein)表示:“ [这项研究中的关键突破是一种编码算法,即使在存储过程中DNA链部分受损时,也可以准确检索信息。”
琼斯说:“我们找到了一种更像网格的方式来构建信息的方法。” “每条信息都增强了其他信息。这样,它只需读取一次。” 此外,他们解释说,他们的技术可以帮助他们确定某些信息的优先级,并避免DNA出现问题或容易出错的部分。
为了测试他们的存储方法,研究人员存储了《绿野仙踪》的副本(翻译成世界语),然后将其置于高温和极高的湿度下,破坏了DNA链。最终,他们成功地,高精度地检索了信息。
霍金斯说:“我们试图同时解决该过程中尽可能多的问题,”霍金斯最近在UT的奥登计算工程与科学学院任职。“最终我们取得了非凡的成就。”