宇宙|你身体里的DNA 能存下整个宇宙的数据( 三 )


在他们的研究中 , 想开发的是另一个功能:随机读取 。常见的DNA测序技术中 , 必须要将所有的碱基串一次性读取完 , 才能够获得信息 。要么不读取 , 要么全读 。如果只想要数据中的某一个小片段 , 就会非常麻烦 。
2016年 , 他们发表了一项研究 , 可以在DNA已经存储的信息中搜索到指定的图像 , 定位后 , 用酶来复制所需的DNA片段 , 然后只需读取这一小段即可 。
宇宙|你身体里的DNA 能存下整个宇宙的数据
文章图片

KarinStrauss(右)和两位研究合作者|来源:csenews
要让DNA存储离商用更进一步 , 还需要解决合成速度和成本 。现在合成速度是每秒存储上千个字节(KB) , 成熟的云存储方案已经有每秒千兆字节(GB)以上 。
这意味着 , 编写DNA的速度还需要提升6个数量级 。如何让提升数据处理量?就像并行计算能够提升数据处理速度 , 科学家希望DNA在合成时也可以并行多条 , 同时处理 。
2021年 , 微软开发出首个纳米级DNA存储器 , 能够在每个平方厘米的区域上 , 同时合成25X106(2650)条碱基序列 。这个新的技术把原来同时合成碱基序列的数字从个位提升到了千位 。这个吞吐量 , 让DNA合成速度变成了每秒兆字节(MB) 。
宇宙|你身体里的DNA 能存下整个宇宙的数据
文章图片

新的方法让DNA合成的阵列数量大大增加|来源:微软研究院
更大的吞吐量 , 也就意味着更低的成本 。现在DNA存储的成本是每万亿字节(TB)8亿美元 。而磁带存储成本已经降到了每万亿字节16美元以下 。这样比起来似乎毫无竞争力 。但现实生活中的大型数据中心的维护成本极高 , 还要定期更新硬件;DNA存储密度大、体积小、可以长时间不变质的优势就变成了降维打击 。
所以量大、读取频率低的“冷数据” , 被认为是DNA存储最近的应用场景 。TwistBioscience最近在一份市场报告中强调 , 这种技术能够帮助科技企业在“大规模、低功耗”情况下更有效地部署 。
另外一些乐观的科学家 , 更相信技术的进步 。
自2003年人类基因组计划完成以来 , 测序成本降低了200万倍 。2016年时 , 面对每秒千字节的速度 , Goldman说:“(读写的速度提升)6个数量级对基因组学来说没什么大不了的 。你只需要再等一会儿 。”
那这“一会儿”是多久呢?这个领域似乎到了临门一脚 , 仍在等待突破 。
 


推荐阅读