- A+
随着信息时代的到来,人工智能(AI)、生物技术和物联网等领域的数据呈指数级增长,发展高保真、高密度和低能耗的存储技术是满足目前“大数据”存储需求的关键。DNA因其编码密度高、冷藏寿命长和存储能耗低等优点,被认为是下一代数据存储介质的理想候选者。然而,DNA片上存储工作站的访问速度、集成度以及扩展能力方面的技术瓶颈成为制约DNA存储发展的主要限制因素,因此要实现高保真、全集成和低成本的DNA存储系统仍面临挑战。
近日,南京理工大学邓盛元教授团队发展了一种基于数字微流控的紧凑型DNA数据存储流水线,完成了从DNA合成到测序的整个过程。这种新方案在可扩展和一体式DNA数据存储方面具有巨大潜力。

图1. DNA数据存储系统示意图,凸显数字微流控平台上基于200纳米磁珠的DNA化学合成到焦磷酸测序全流程。a)自制数字微流控芯片设计布局,其中部安置了6×34个电极阵列用于引导液滴流动,周边配置18个储液区,存放不同组分溶液(见右侧图例标注)。b)基本编码信息的液滴驱动图,其与磁珠表面的物质流传递同步,从写入到读取的过程在不同区域内进行。相关生化反应事件的细节建模:c)在DNA合成区,所需的一个dNTP通过亚磷酰胺化学逐个添加到磁珠上;d)在DNA测序区,磁珠上3'到5'端的正确单碱基配对通过化学发光信号予以辨别。
如图1所示,DNA数据的写入是通过在片DNA合成来实现的,作者利用磁珠载体和磁铁在数字微流控芯片中完成了亚磷酰胺化学合成方法中的偶联、氧化和脱保护等操作。基于电润湿的数字微流控能够通过覆盖有疏水绝缘体的可单独寻址电极来操纵离散液滴(微升或皮升级)。通过编程方式在电极上施加电压可以完成样品液滴的分配、合并和混合等复杂操作,从而适应灵活的样品反应条件。因此数字微流控芯片不需要额外的微泵、微阀等辅助装置或结构,有利于实现集成化的DNA存储平台。
如图2所示,作者采用亚磷酰胺化学合成法在磁珠上合成了一段DNA序列(8 nt)用来对数字微流控芯片DNA合成的可行性进行验证。他们利用荧光标记互补DNA序列和聚丙烯酰胺凝胶电泳对合成产物进行了表征,结果表明每增加一个合成循环都会稳定增加一个碱基。

图2. 有关数字微流控芯片上DNA合成的表征。a)液滴中磁珠表面的按步磷酸酰胺化学合成流程。b)对应DNA合成步骤的操作照片,包括:第1步磁分离、第2步偶联、第3步氧化,和第4步脱保护。各图之间的色差源于快速曝光,虚线网格则勾勒出电极的布局。c)通过荧光计分析磁珠表面合成的寡核苷酸(Oligo-syn)的简易过程,即与Cy3标记的探针互补配对。d) Oligo-syn在磁珠上与(从左到右)完全匹配的、单碱基错配的及空白对照杂交后的荧光强度直方图。误差棒表示3次平行实验的标准差。e)聚丙烯酰胺凝胶电泳的泳道排列展示了Oligo-syn的序列长度按1~8个亚磷酰胺循环逐步递增(鉴于单碱基分辨,没有合适分子量的marker)。
DNA数据的读取是通过焦磷酸测序来实现的(图3)。该方法通过检测互补链上增加一个碱基后经过一系列酶催化级联反应产生的化学发光信号来确定DNA序列上的碱基种类。作者首先构建了集成化的化学发光检测模块,并验证了该模块对于探测焦磷酸测序中极弱光信号的性能,结果表明错配碱基和外界光源产生的背景干扰是可以忽略的。最后,他们利用数字微流控芯片对磁珠上的一段DNA序列(27 nt)进行了原位焦磷酸测序,证明该方案的DNA测序准确度达到了100%。

图3. 磁珠基DNA测序在数字微流控平台的实现。a)自引发寡核苷酸测序(Oligo-seq)过程示意。b)多轮洗涤过程中,未匹配的Cy3-dATP在废液液滴中的荧光衰减,用以表征清洗次数是否得当。c)焦磷酸测序进程中,30秒采集窗口内含时化学发光的变化轨迹,涉及不同反应组分的强度比较:聚合酶+配对dNTP (红色)、聚合酶+非配对dNTP (蓝色)、仅含配对dNTP (黄色)、仅含MB的是空白对照(绿色)。d)用于Oligo-seq序列鉴定的化学发光输出条形图,按照dATP→dCTP→dGTP→dTTP依次引入并杂交。误差帮表示三次重复实验的标准偏差。
最后,作者利用霍夫曼编码和旋转编码算法将南京理工大学的校训“进德修业,至道鼎新”(英译作“Advancement for Virtue Cultivation for Learning, Aspiration for Innovation”)转换成了DNA序列。结果表明,在数字微流控芯片中进行DNA合成和三重测序后的准确率达到了95.28%,进一步通过Reed−Solomon纠错算法可以100%地恢复原始信息(图4)。利用该方案写入和读取8字节数据共花费了约6.5小时,相当于49分钟/字节的存储速度。

图4. 基于数字微流体的DNA存储应用实例,以保存和提取南京理工大学的校训为信息。a)将有义的目标信息存入包含冗余、引物和聚T碱基间隔序列的DNA文库的流程。b)通过三次重测序复核与多重投票确定最终序列结果,提高了存储的准确性。“•”表示化学发光所指出的该部位碱基空缺。
综上,该工作为解决DNA存储研究中的关键问题提供了一种新策略,有望作为一种无人值守的操作平台,实现高通量、全封装、精准且精巧的DNA数据存储。
论文信息
Bead-Based DNA Synthesis and Sequencing for Integrated Data Storage Using Digital Microfluidics
Yuhao Piao, Yitong Fang, Bin Li, Tiantian Man, Jie Chen, Fulin Zhu, Weiqiang Wang, Ying Wan, Shengyuan Deng
论文的第一作者是南京理工大学机械工程学院博士朴禹滈(现为环境与生物工程学院博士后)。
Angewandte Chemie International Edition
DOI: 10.1002/anie.202416004

目前评论:0