前瞻性:公司和研究机构长期以来一直在探索DNA作为归档数字数据的潜在“存储系统”。现在出现了一种新方法,通过消除从头开始复杂且昂贵的实验室创建 DNA 链的需要,提供额外的经济激励。该领域的这种新颖的变化在成本效益和简单性方面显示出了前景。
脱氧核糖核酸聚合物通常被称为 DNA,是控制我们迄今为止发现的每个生物体的基本组成部分。它是细胞活动的控制中心,决定着动物、植物和地球上所有其他生命形式所表达的生物特征。生物体 DNA 内的遗传指令使用四碱基系统进行编码,该系统由腺嘌呤 (A)、胸腺嘧啶 (T)、鸟嘌呤 (G) 和胞嘧啶 (C) 核苷酸组成。
这种简单但普遍有效的基因编码方法长期以来一直令全世界的科学家和公司着迷。生物模型可以为存储互联网和全数字全球社会中的众多设备生成的大量数字数据的挑战提供答案。
由于需要通过复杂且容易出错的过程创建新的合成 DNA 序列,因此涉及在 DNA 链中存储数字位的实验通常非常昂贵。然而,由新加坡国立大学合成生物学家 Cheng Kai Lim 领导的一组研究人员现在提出了一种替代方法。这种创新方法旨在通过利用“活”DNA 链来解决成本问题。
研究人员利用了大肠杆菌细胞中存在的 DNA 功能,大肠杆菌是一种常见于包括人类在内的温血生物消化道中的大肠菌。这些DNA链配备有“光遗传学”电路,能够检测光的存在或不存在。利用这一功能,研究人员开发了 BacCam,一种可以直接捕获和存储 DNA 内图像的生物相机。
该团队设计了一种捕获 DNA 中“二维光图案”的方法,利用光遗传学电路记录光照并使用条形码对空间位置进行编码。研究人员解释说,随后通过“高通量下一代测序”检索存储的图像,这打开了“将生物系统与数字设备集成”的大门。
研究人员能够在生物 DNA 中存储总共 1152 位的简单 96 位图像,通过使用红色和蓝色光源同时捕获和存储两个不同的图像,成功展示了他们的方法的“多路复用”能力。 DNA 存储的图像可以以至少 90% 的准确度恢复,这对于基于生物学的数字档案来说是一项重大成就。然而,它达不到强大的文件存储系统所需的可靠性。
尽管如此,该研究表明 DNA 池可以在一次运行中存储和检索 100 到 1,000 个不同的图像。研究人员对 DNA 数据存储的持续进步持乐观态度,因为他们的方法展示了这种有前途的技术的其他应用。