DNA芯片:未来十亿字节级别的存储解决方案
大自然以 DNA 的形式展示了如何以节省空间的方式长期存储数据。维尔茨堡生物信息学教席正在为计算机技术开发 DNA 芯片。遗传分子 DNA 因其能够在极小的空间内长期存储大量信息而闻名于世。因此,近十年来,科学家们一直在追求开发计算机技术 DNA 芯片的目标,特别是用于数据的长期存档。
研究人员一直在关注 DNA 作为数据存储介质的潜力,因为 DNA 能够在极小的空间内存储大量信息。
DNA 链中有四个重复出现的基本构件。这些模块的特定序列可以用来编码信息,就像大自然一样。要制作 DNA 芯片,必须合成并稳定相应的编码 DNA。如果效果良好,信息可以保存很长时间--研究人员假设可以保存几千年。通过自动读取和解码四个基本构件的序列,就可以检索信息。
这种芯片在存储密度、寿命和可持续性方面都优于传统的硅基芯片。
信息可以以 DNA 的形式存储在由半导体纳米纤维素制成的芯片上。光控蛋白质读取信息。图片来源:维尔茨堡大学生物信息学系主任
DNA 数据存储面临的挑战
德国维尔茨堡朱利叶斯-马克西米利安大学(Julius-Maximilians-Universität,JMU)生物信息学教研室主任托马斯-丹德卡尔(Thomas Dandekar)教授说:"大容量、长寿命的数字 DNA 数据存储是可行的,这一事实近年来已多次得到证实。但存储成本很高,每兆字节接近 40 万美元,而且 DNA 中存储的信息只能缓慢检索。根据数据量的大小,需要数小时到数天的时间"。
研究人员必须克服这些挑战,才能使 DNA 数据存储更加适用和适销对路。这方面的合适工具是光控酶和蛋白质网络设计软件。托马斯-丹德卡(Thomas Dandekar)及其主席团队成员阿曼-阿卡什(Aman Akash)和埃琳娜-本库洛娃(Elena Bencurova)在《生物技术趋势》(Trends in Biotechnology)杂志最近的一篇评论中讨论了这一问题。
Dandekar 的团队深信,DNA 作为数据存储的未来。在该杂志上,JMU 的研究人员展示了如何将分子生物学、纳米技术、新型聚合物、电子学和自动化结合起来,再加上系统化的开发,使 DNA 数据存储在几年内就能用于日常使用。
创新的DNA芯片开发
在 JMU 生物中心,Dandekar 的团队正在开发由细菌生产的半导体纳米纤维素制成的 DNA 芯片。教授说:"通过我们的概念验证,我们可以展示目前的电子和计算机技术如何被分子生物元件部分取代。通过这种方式,不仅可以实现可持续发展、完全可回收、即使在电磁脉冲或电力故障时也能保持高稳定性,而且还可以实现每克 DNA 高达十亿千兆字节的高存储密度。"
托马斯-丹德卡认为,DNA 芯片的开发具有重要意义的,他说:"只有当我们跃进到这种结合了分子生物学、电子学和新型聚合物技术的新型可持续计算机技术领域时,我们的文明才能长久。对人类来说,最重要的是走向与地球边界和环境相协调的循环经济。我们需要在 20 到 30 年内实现这一目标。芯片技术是这方面的一个重要例子,但生产芯片而不产生电子废物和环境污染的可持续技术尚未成熟。我们的纳米纤维素芯片概念为此做出了宝贵贡献。在这篇新论文中,我们对我们的概念进行了严格审查,并结合当前的研究创新进一步推进了这一概念。"
进一步改进 DNA 存储介质
Dandekar 的团队目前正致力于将半导体纳米纤维素制成的 DNA 芯片与他们开发的设计酶更好地结合起来。这些酶还需要进一步改进。
"通过这种方式,我们希望能更好地控制 DNA 存储介质,使其能够存储更多的内容,同时还能节约成本,从而逐步实现在日常生活中作为存储介质的实际应用。"
什么?DNA也能做成芯片了?
100多年前,英国数学家艾伦·图灵(Alan Turing)的图灵机为现代计算奠定了基础,而到现在,人类也一直在基本同样原理下研究芯片。
一百年后的今天,摩尔定律开始放缓,人们的目光放到了同样处在微观世界的DNA身上,并悄悄地把它放在电子技术的新赛道上。
付斌|作者
电子工程世界(ID:EEworldbbs)|出品
初创公司推出DNA存储卡
最近,一家名为Biomemory的法国初创公司推出全球首款DNA存储卡(DNA Cards),可存储1KB数据。
别看它存储容量小,可这款DNA存储卡的数据可保存至少150年,远超任何人的寿命。不过,这样“过于超前”的产品,售价达到了惊人的1000欧元。
20世纪80年代,Biomemory科学家们首次在法国使用的嵌入微芯片的信用卡中汲取灵感,设计了一种类似银色信用卡的设备,其中有一个圆形芯片,可以保存干燥的DNA。为保存DNA,卡被密封以防止任何氧气进入。
对于这个产品的下一步,Biomemory将扩大设备的容量,以容纳家庭照片、重要文档、音频和视频文件。并计划将存储时间延长到1000年,最终延长到10000年。由于DNA是在溶液中合成,因此下一步是将其干燥以延长其保质期。
当然,Biomemory显然明白对于普通人来说,花1000欧元存1KB数据对大多数人并不现实,因此该公司计划在2026年推出“Biomemory Prime”数据中心存储解决方案,可存储 100PB 数据。
不过,这也仅仅是最乐观的预期,毕竟这项技术还比较年轻,相比来说,排在它前面的还有玻璃或陶瓷存储技术。
用200公斤装下“整个世界”
DNA做成存储器,其实是一个“意外”。事实上,原本科学家事为生命科学应用而开发的DNA合成、测序和检索技术。相比传统的存储介质,DNA在信息保留时间、物理密度和体积编码容量方面都有着优势,但我们的技术还没有那么成熟。
互联网巨头微软也曾踏足这个领域,2017年,微软组建了特别技术小组,负责研发基于DNA编码技术的数据存储系统,彼时微软表示,在未来三年内,旨在研发出测试版“微缩型DNA生物存储器”。DNA容量最大且可塑性极强,能够解决爆炸式增长的数据信息与存储空间和技术不匹配的问题。
这些DNA生物存储器或许会成为每个人特制的“数据细胞器”,把全球所有电影、视频录像、照片和有价值的文档存储在每个人的DNA基因编码里,之所以能够实现这样的技术,基础在于基因编辑技术CRISPR-Cas9已趋于成熟了。
2019年,微软和华盛顿大学的研究人员又推进了DNA存储技术的发展。而后,微软还联合哈佛大学、华盛顿大学等曾一起成立了DNA数据存储联盟,推动DNA存储发展。
值得强调的是,DNA存储是国家“十四五”科技规划中明确提出要加快布局的前沿技术之一。而在美国《科学》杂志提出了未来125个科学问题中,DNA存储也是重点。
为什么大家如此关注DNA存储?这是因为数据正在以爆炸式速度增长,到2025年全球数据量会达到1750万亿字节,这些数据能耗巨大,传输体积也巨大,其中80%~90%极少被调用的“冷数据”。而且更为关键的是,信息存储在硅上,寿命大约是数十年。
DNA存储不仅密度高、能耗低,而且寿命长,能稳定保存百年、千年,极端条件下甚至可达百万年。举个例子来说,1000万块硬盘的数据,用50克的DNA就可以存储下来,而全世界440万亿字节的数据用200公斤DNA就可以存下来。
当然,这一切都是在理论中,这种技术多久才能面世,才能具备商业价值,都还是未知数。
国内轰动一时的研究
DNA是生物体内的遗传信息载体,其中腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G) 和胞嘧啶(C)4种含氮碱基按特定顺序排列以编码遗传信息。大自然,是否也遵循着什么编码规则?我们不得而知,但这样看,似乎与数学和程序有着很大的关系,科学家也从中找到了很大灵感。
1994年Adleman首先提出DNA计算模型的概念,他利用DNA碱基互补配对原则的热力学平衡过程构建了模型,以计算哈密尔顿路径问题,并取得了成功。
2004年,Okamoto等3位学者首次将数字电路与DNA计算相结合,构建DNA电路,并形成DNA逻辑门,即将不同级逻辑门通过级联的形式组成复杂的电路,最终实现通用的DNA计算,为DNA计算和组装技术实现新一代芯片组装提供了理论基础。
2009年,IBM利用DNA和纳米技术开发下一代微处理芯片,开创了DNA计算的新时代。此时,DNA计算已经具备一定战略性意义。
2023年底,海交通大学樊春海院士、王飞副教授团队一篇刊上Nature的论文也引发了巨大讨论,这标志着中国已经成功DNA计算领域取得重要进展。
DNA计算机依赖的不再是硅晶片,而是大自然数十亿年来用以编码生命蓝图的分子。这类计算机通过实验室操作来执行计算,并以DNA链式形式的数据作为输入和输出。
研究者通过集成支持通用性计算的多层DNA可编程门阵列(DPGA, DNA-based programmable gate array),展示了一种DNA集成电路(DIC)。他们发现,使用通用的单链寡核苷酸作为统一的传输信号,可以可靠地集成大规模DIC,并能最小化泄露,实现高保真度。此外对具有24个可寻址双轨门的单个DPGA进行重新配置,可以运行超过1000亿个不同的电路。
此外,为了控制分子本质上的随机碰撞,研究者设计了DNA折纸寄存器,为级联DPGA的异步执行提供了方向。他们通过三层级联DPGA(包含30个逻辑门、约500个DNA 链)组装而成的二次方程求解DIC证明了这一点。
研究者进一步证明,DPGA与模数转换器的集成可以对与疾病相关的microRNA进行分类。无明显信号衰减下集成大规模DPGA网络,这标志着迈向通用DNA计算的关键一步。
在试管里完成运算
与常规计算机相比,DNA计算潜力无限,它具有高并行、低能耗的优势。理论上,DNA每平方毫米最多可以存储1艾字节(exabyte)或10亿千兆字节。不仅如此,一滴水就能容纳数万亿DNA分子,这表明DNA计算能够并行执行海量计算的同时,只需要很少的能量。
科学家发现,DNA在一个试管里,一步就能完成1020次运算。一些电子计算机不能计算的问题,比如哈密尔顿路径问题,就可能通过DNA计算机来完成。DNA计算在未来的科学领域中,有望在优化计算、密码学、数学等领域取得突破性的创新和应用。
那么DNA是怎么计算的?它本质是利用大量不同核酸分子杂交,产生类似数学计算过程中某种组合的结果,并且根据限制条件得出约束解。
与传统的芯片蕾丝,DNA计算是由传统意义的“电路”构成的,不过这些电路是特定功能的DNA链构成的DNA电路,DNA电路中不使用任何类型的电压和电流,电路信号是DNA链的浓度或DNA链中特定片段的有无。
相比传统计算机,DNA计算机并行计算能力强,也就是说DNA可以像GPU一样,同时计算大量内容,同时DNA计算具有非常高的能量效率和存储容量。
值得一提的是,DNA不仅能实现数字电路,还能实现模拟电路。
数字电路方面,AND、OR、XOR、NOT、NAND、NOR和XNOR这些逻辑门是关键,DNA计算则以DNA链浓度作为信号,浓度高于特定阈值,则认为该信号为逻辑高,否则为逻辑低,有点类似高电平、低电平。
根据这种原理,Nielsen曾经参考FPGA的编码方式进行设计了一个自动化设计基因电路的平台Cello,设计编码方式与Verilog相似。科学家们也把这种器件叫做DPGA(高度可扩展的基于DNA的可编程门阵列,DNA-based programmable gate arrays,DPGAs)。
模拟电路方面,输入和输出信号通常用分子浓度来表示,即模拟DNA元件能够感知特定分子在具体环境中的浓度,然后通过适当的模拟计算产生固定浓度的输出信号。模拟电路中最基础的元件是晶体管,但是DNA电路无法转变为DNA晶体管电路,因此在DNA模拟电路中在行为层面上将模拟电子电路映射到模拟DNA电路。目前,科学家已经利用DNA实现了反馈控制电路、决策器、神经生物学的模数转换和数模转换等。
需要强调的是,尽管DNA计算被证实是通用计算,但DNA计算在实际应用中无法取代电子计算,最优方案是利用DNA计算实现高度并行任务,而固有的串行任务仍采用电子计算完成。同时,DNA计算发展有三方面障碍:
对大规模系统进行物理处理时会产生错误;在PCR扩增环节存在基因突变的问题;目前在浓度检测过程中缺少快捷高效的检测仪器。随着生物技术不断进步,DNA越来越被人“玩出花”,随着电子技术逐渐产生瓶颈,学科交叉成了越来越领域突破瓶颈的关键。
相关问答
dna芯片技术的优缺点?
DNA芯片技术,实际上就是一种大规模集成的固相杂交,是指在固相支持物上原位合成(insitusynthesis)寡核苷酸或者直接将大量预先制备的DNA探针以显微打印的方式...
dna管理方法?
DNA管理方法是指对DNA样本进行识别、提取、存储和分析的一系列操作步骤。以下是一些常见的DNA管理方法:1.DNA样本采集:收集DNA样本的来源可以是人体组织、血...
dna芯片检测过程?
通过检测标记信号来确定DNA芯片杂交谱型。荧光标记杂交信号的检测方法使用荧光标记物的研究者最多,因而相应的探测方法也就最多、最成熟。1.待测样品的准备...
胎儿染色体正常,基因芯片就正常吗_千问健康
胎儿染色体正常,基因芯片就正常吗?请问基因芯片多长时间出结果?
蛋白质芯片和dna芯片的异同?
蛋白质芯片与DNA芯片的主要区别在于A被检测分子需要标记B载体不同C信号检测方式D杂交反应温度E蛋白质芯片是利用抗原-抗体、配体与受体等生物大分子间的...
中国有自己生产的芯片吗?
近日,美国政府对中兴通讯发出出口禁令,引发舆论对于中国尖端产业自主创新的讨论,并激发了国人对于“中国芯”的思考。那么我们中国有自己生产的芯片吗?芯片产...
基因芯片技术有什么原理呢?
基因芯片技术利用DNA分子的互补配对原理实现基因检测。基因芯片上固定了大量DNA探针,每个探针可以与待检测样本中的特定基因序列互相配对。通过将待测样本分...
基因芯片技术的制备技术是怎样的?-懂得
2、制备技术基因芯片的制备综合了生命科学、化学染料、微电子技术、激光、统计学等领域的前沿技术,主要包括芯片的制备(选择点样仪和玻片、靶基因的...
只开了中药,怎么会有基因芯片技术收费_千问健康
厦门中医院王鹭霞医生,只开了中药,怎么会有基因芯片技术收费300元,请懂的人帮忙看一下什么是基因芯片技术?想得到的帮助:厦门中医院王鹭霞医生,只开了中药,怎么...
猪芯片是什么?
猪芯片是一种深度的生物识别技术,新开发的猪芯片上有384个小格子,其中集成了不同位点基因的生物识别功能,这些被检测出来的特异基因,对应了种猪不同的生物学...