/ 中存储网

研发 : 近期关于DNA数据存储技术的五篇文章

2025-07-17 23:11:22 来源:中国存储网

研发:通过深度学习模型
预测编码序列在DNA存储中的二级结构程度 
建议的筛选顶级高风险序列的方法可以采取主动步骤,以防止严重二级结构的发生,为可靠的信息检索提供解决方案。

Scientific Reports 发表了一篇文章,作者是 Wanmin Lin, Ling Chu, Xiangyu Yao, Zhihua Chen, Institute of Computing Science and Technology, Guangzhou, Guangdong, China, Guangzhou, Guangzhou, China, Guangzhou, Guangzhou, China , Guangzhou University, Institute of Computing Science and Technology, Guangzhou University, Guangzhou, Guangdong, China, Guangzhou, China , Qannan College for Nationalities, School of Computer Science Science of Information Technology, School of Information Technology, Qannan Normal for Nationalities, Chiannan University for Nationalities, Duyun, China and广东省人工智能医学图像分析与应用重点实验室,中国广东广州,广州大学计算科学与技术研究所刘文斌,中国广东广州,广东省人工智能医学图像分析与应用广东省重点实验室,中国广东广州。

摘要:“DNA 存储已被广泛认为是指数级增长数据的一种有前途的替代方案。然而,固有的复杂二级结构严重影响了合成、PCR 扩增和测序过程,干扰了可靠的信息恢复。在大规模存储应用中,如何有效规避负面影响是一个关键问题。由于二级结构是由具有反向互补关系的连续碱基形成的,并伴随着释放的自由能,我们构建了一个带有 k-mer 嵌入的 BiLSTM-Transformer 模型来预测序列的自由能,并进一步筛选出这些高值的序列。K-mer 嵌入可以通过重叠的短子序列捕获连续碱基配对的特征,进一步促进自由能预测。与其他深度学习模型相比,我们的仿真结果表明,带有 k-mer 嵌入的 BiLSTM-Transformer 模型具有更好的预测性能。在真实数据集上的应用表明,所提出的模型可以筛选出那些在真实 DNA 存储中容易出现更多读取错误和更少检索到的拷贝数的前高风险序列。所提出的顶级高风险序列的筛选方法可以成为防止严重二级结构发生的主动步骤,为可靠的信息检索提供解决方案。

 

研发:适用于具有多个输出序列
的DNA存储通道的有效IDS纠错算法 
仿真结果表明,与现有研究相比,作者提出的译码算法使误码率降低了 21.72% ~ 99.75%。

IEEE Transactions on NanoBioscience 发表了一篇文章,作者是 Caiyun 邓、Guojun Han、Pengchao Han 和 Yi Fang,广东工业大学信息工程学院,中国广州。

摘要: DNA 数据存储因其高密度、可复制性和长期能力而是一种尖端的存储技术。它涉及用于数据合成和排序以及解码过程的编码、插入、删除和替换 (IDS) 通道。具有多个输出序列的 IDS 通道容易出现 IDS 错误,使解码过程复杂化并降低 DNA 数据存储的性能。为了解决这个问题,我们研究了有效的 IDS 纠错算法,考虑了 DNA 数据存储中的两种编码方案。具体来说,在编码过程中,我们分别使用标记码 (MC) 和嵌入式标记码 (EMC) 作为内部代码,两者都连接到低密度奇偶校验 (LDPC) 代码作为外部代码。首先,我们提出了分段渐进匹配 (SPM) 算法,从多个输出序列中推断出共有序列,从而促进解码过程。此外,当使用 MC 作为内部代码时,我们提出了一种基于隐马尔可夫模型 (SDH) 的同步解码算法来推断基符号的后验概率 (APP),该算法支持外部解码算法。此外,当内部代码为 EMC 时,我们提出了迭代外部解码 (IED) 算法。IED 将同步解码与嵌入式归一化最小和解码 (ENMS) 集成在一起,以实现增强的外部解码 APP,从而实现更低的误码率 (BER) 传输。同时,我们通过最大限度地减少校验和节点计算来降低外部解码器的复杂性。比较这两种方案表明,以 MC 作为内部代码的 SDH 算法为 DNA 数据存储提供了一种轻量级解决方案。相比之下,带有 EMC 的 IED 表现出卓越的解码性能,复杂度随迭代次数呈线性变化。仿真结果表明,与现有研究相比,我们提出的译码算法将误码率降低了 21.72% ~ 99.75%。

 

研发:超快且准确的DNA存储和读取集成系统通过微流体磁珠聚合酶链反应
使用自制微流控 PCR 和 DNA 磁珠构建研究集成系统,以实现快速准确的 DNA 储存和读取,且具有可重复性。

ACS Nano 发表了一篇由东南210096大学生物科学与医学工程学院数字医学工程国家重点实验室 Ying 周, Kun Bi, Qi Xu, Quanjun Liu, Xiangwei Zhao, Qinyu Ge, and Zuhong Lu 撰写的文章。

摘要: DNA 存储有望解决大数据时代电子信息技术面临的海量数据有效存储和管理困境。高效可靠的数据检索对于 DNA 存储至关重要。然而,实现具有快速准确读数能力的 DNA 储存仍然具有挑战性,这在 DNA 储存的实用性和可靠性中起着关键作用。在本研究中,使用自制微流控 PCR 和 DNA 磁珠构建了一个集成系统,用于快速、准确地进行 DNA 储存和读取,且具有可重复性。为随机访问 DNA 储存而构建的自制微流控 PCR 和 DNA 磁珠具有短时间、低偏差的优点,称为 MMBP。自制 DNA 磁珠成本低、稳定且可重现。MMBP 集成的 DNA 储存和读取系统不仅可以更准确、更快速地读取信息,而且测序深度比传统 PCR 更低。总体而言,基于 MMBP 的 DNA 信息存储系统 (MMBP-DIS) 具有降低成本、将随机访问时间缩短至 10 min、提高读取准确性和灵敏度等优点。未来,它可以与 DNA 电化学合成整合,开发一种快速准确的便携式微流控装置,用于 DNA 合成-保存-读取一体化

 

研发:体外DNA数据存储
随机存取技术的进展和挑战作者
总结了DNA存储技术的最新进展,这些技术使随机存取功能成为可能,以及需要克服的挑战和当前的解决方案。

ACS应用材料与界面发表了一篇由东南大学生物科学与医学工程学院生物电子学国家重点实验室的 Ying 周, Kun Bi, Qinyu Ge和Zuhong Lu撰写的文章,该学院位于中国南京210096。

摘要: 随着数字化转型和新技术的普遍应用,数据存储面临着海量信息高密度加载需求的新挑战。作为回应,DNA 存储技术已成为一个有前途的研究方向。高效可靠的数据检索对于 DNA 存储至关重要,随机存取技术的发展对其实用性和可靠性起着关键作用。然而,事实证明,实现快速准确的随机取用功能对于现有的 DNA 存储工作来说是困难的,这限制了它在工业中的实际应用。在这篇综述中,我们总结了实现随机访问功能的 DNA 存储技术的最新进展,以及需要克服的挑战和当前的解决方案。本综述旨在帮助 DNA 存储领域的研究人员更好地了解随机访问步骤的重要性及其对 DNA 存储整体发展的影响。此外,讨论了 DNA 存储随机取存技术仍然存在的挑战和未来的研究趋势,旨在为实现大规模数据条件下的 DNA 存取提供坚实的基础。

 

研发:基于调制的DNA存储
的可否认加密方法 
在论文中,作者提出了独特利用DNA噪声通道的可否认加密方法。

交叉科学:计算生命科学发表了一篇文章,作者:Ling Chu, Yanqing Su, Xiangzhen Zan, Wanmin Lin, Xiangyu Yao, Institute of Computing Science and Technology, Guangzhou University, Guangzhou, 510006, China, Peng Xu, Institute of Computing Science and Technology, Guangzhou University, Guangzhou, Prince, 510006, China, School of Computer Science of Information Technology, Qiannan Normal University, Qiannan Normal University, Qiannan Normal University信息技术学院各民族,都云,558000,广东省人工智能医学图像分析与应用重点实验室,广州,510000;广州大学计算科学与技术研究所刘文斌,510006广州;人工智能医学图像分析与应用广东省重点实验室,广州,510000。

摘要:“合成和测序技术的最新进展使脱氧核糖核酸 (DNA) 成为下一代数字存储的有前途的替代品。随着 DNA 存储信息的实际应用,确保 DNA 存储信息的安全性已成为一个关键问题。可否认加密允许解密来自同一密文的不同信息,确保在用户被迫透露真实信息时可以提供“合理”的虚假信息。在本文中,我们提出了一种独特地利用 DNA 噪声通道的可否认加密方法。具体来说,真假消息由两个类似的调制载波加密,随后被固有错误混淆。实验结果表明,该方法不仅能够在虚假信息中难以区分地隐藏真实信息,而且能够使强制攻击者和合法接收者都能准确地解密预期信息。进一步的安全分析验证了我们的方法对各种典型攻击的抵抗力。与基于复杂生物作的传统 DNA 密码学方法相比,我们的方法具有卓越的实用性和可靠性,使其成为未来大规模 DNA 存储应用数据加密的理想解决方案。