跟着信息工夫的发展,数据着实成为了一种新式坐蓐而已。不外,它的爆炸式增长也让存储成为新的挑战,基于硅材料的意料机存储面貌逐渐变得难以吩咐。在此配景下,积极探索 DNA 存储以算作下一代的数据存储面貌有趣紧要。
DNA 是一种相等踏实的分子,半衰期跨越 500 年,低温条目下可保存千千万万年。DNA 存储在存储密度、寿命和能耗方面已露出出超过现时硅基数据存储工夫的后劲。
DNA 存储的扫数历程可未必分为 4 个要领,即“编”“写”“存”“读”。如今使用 DNA 测序仪读取 DNA 四个字母的编码数据相等浅显,何况速率相对较快。问题在于写入数据,这时常需要一次合成一个字母的定制 DNA 链。面前最快的 DNA 写入器每天不错合成约 3.2 亿字节的 DNA 数据,按照这种速率,写入 1g DNA 需要近 200 万年。且由于写入速率慢,老本也较高。
近日,北京大学定量生物学中心钱珑、欧阳颀,北京大学意料机学院张成,亚利桑那州立大学 Hao Yan 等东说念主在 Nature 发表最新征询后果,他们受表不雅遗传修饰和 DNA 自拼装启发,树立了一种相等规的 DNA 数据写入框架,该框架允许基于 DNA 自拼装教学的酶促甲基化将大肆的“表不雅比特”(epi-bits)以并行面貌踏实地写入 DNA 模板上。
这种面貌毋庸重新构建 DNA,而是讹诈现存的 DNA 链,在合成后对其进行修饰。“epi-bits”的功能访佛于活字印刷术中的活字,不错罗列在通用的 DNA 模板上。
基于此设施,他们告捷将中国古代汉代的老虎拓片图像和熊猫彩色图片存储在 DNA 中,并告捷读出。著作题为“Parallel molecular data storage by printing epigenetic bits on DNA”。
图 | epi-bit DNA 存储暗示图
他们合成了表率化的长模板单链 DNA 片断算作“纸张”,一系列短的、预制的 DNA 片断(有或莫得甲基)算作“字体”,这些 DNA 片断每个长 24 个碱基,其序列被贪图为与 DNA 模板上的特定区域联结。
讹诈甲基化,用数字 0 或 1 对短 DNA 片断进行编码,甲基的存在对应 1,甲基的缺失对应 0。在体内,细胞将甲基附着到特定的 DNA 序列上,以发出信号,指令哪些基因应该在不同组织中抒发和千里默。
征询东说念主员添加了甲基变嫌酶 DNMT1,通过 DNMT1 的选拔性甲基化,表不雅遗传修饰算作信息位不错精准地引入到通用 DNA 模板上以终了分子活字印刷。
基于上述设施,征询东说念主员存储了 269,337 比特的数据,包括中国古代汉代的老虎拓片图像和熊猫彩色图片,终明显每次响应 350 比特的速率。
图 | 通过 epi-bit 终了大畛域存储
此外,征询东说念主员还邀请了 60 名具有不同学术配景的学生志愿者,在教室中使用浅显的 epi-bit 书写器具手动将他们选拔的文本片断存储在 DNA 中。临了,存储的 15 篇文本中有 12 篇被告捷收复,并通过在线就业器安全地复返给了编写它们的团队。
由于该工夫使用预制的 DNA 片断,因此不错进一步优化以进行批量坐蓐。这将比为存储的每一位信息合成一条定制的 DNA 链低廉得多。面前用这种设施写入数据的老本约为每比特 0.003 好意思元。但团队服气跟着生意化的践诺和应用,老本会裁减。
下一步,团队将征询该系统的膨胀材干奈何适应大批数据。他们正在征询用甲基之外的其他化学象征修饰 DNA 模板,以便在每条链上编码更多的数据,从而进一步加速速率。
参考荟萃:
1.Zhang, C., Wu, R., Sun, F. et al. Parallel molecular data storage by printing epigenetic bits on DNA. Nature 634, 824–832 (2024). https://doi.org/10.1038/s41586-024-08040-5
免责声明:本文旨在传递合成生物学最新音信,不代表平台态度,不组成任何投资想法和冷落,以官方/公司公告为准。本文也不是诊疗决策保举,如需获取诊疗决策教唆,请赶赴正规病院就诊。