DNA存储成为可能:低成本才是商用关键

鸿秦科技2019-03-14 16:50:49


DNA存储再发展

16万亿信息有处可去


      此前我们曾讨论过DNA存储的可能性,但最终结论是:由于高昂的成本问题,实际应用可能还需要进一步的开发,而最近,这一问题可能找到了全新的解决办法。7月2日消息,据国外媒体Quartz报道,如今,将数据信息存储在DNA上的成本已经足够便宜,因此该技术有望实现商业化。


      2016年,人类共计产生了16.1万亿GB的数字信息;到2025年,这一数字预计将增加十倍以上。我们的个人照片、文本和电子邮件只是占很小的一部分;真正的数据洪流来自于科学家们在其研究活动中所创造的海量信息,比如进行实验和临床试验,深入研究生物的最小组成部分;观察其他行星,尽可能深入地观察浩瀚的宇宙。

      而我们目前放置数据的地方——外部硬盘和云服务器机房——大部分都称不上完美的解决方案。它们占用大量的空间,而且每隔十年左右就需要升级一次。



从细胞入手

将DNA重新编码


      而面对未来如此庞大的信息存储量,生物技术创业公司正在寻找从我们的身体内部来解决这个问题。具体地说,就是利用我们的细胞。

      大容量存储的最新趋势是在DNA中编码数据。毕竟,基因材料已经是一种编码技术。它编码的生活:每个人体细胞包含30亿个碱基对。配对的核苷酸要么是腺嘌呤(A)与胸腺嘧啶(T),要么是鸟嘌呤(G)与胞嘧啶(C)。它们的序列,是所有执行我们(和所有生物)存活所需的功能的蛋白质的秘诀所在。


      而目前包括美国国防高级研究计划局(DARPA)在内的几家机构已经开发了基于DNA的存储系统,这种系统能够将各种信息编码到微小而稳定的分子链中,分子链能够持续数千年。只有一个问题:制造编码信息的独特DNA成本十分高昂。据《连线》杂志报道,印制目前录制一分钟立体声音所需的150万对碱基对,成本约为10万美元。


是否有办法降低成本

走向商业化


      现在总部位于波士顿的Catalog公司正试图降低那些成本。

      Catalog并不是用信息填充一长串DNA,而是制作20到30个碱基对长的DNA片段,这些片段可以用酶缝合在一起。这些片段的排列决定了它们的意义。本质上,它就像一种语言:在英语中,只有26个字母,但通过各种组合,理论上,我们可以创造出无数不同的单词。Catalog估计,存储1MB数据的成本将不到0.001美分。作为参照,在Spotify上,一分钟最高质量的立体声音约为2.4MB。


      从实际应用上来说,任何对该技术感兴趣的公司可以将其想要存储的数据提交给Catalog,然后Catalog会将那些信息转换成二进制代码,即由0和1组成的长链。接着,该公司的流程为每个核苷酸分配一对0和1;

      例如,“A”可以是00,“C”可以是01,“T”可以是11,“G”可以是10。之后,通过使用这种DNA代码,数据被转换到一小瓶的基因材料里。小瓶子可以安全地存放在任何温度达到4摄氏度的冰箱里,就比如餐馆使用的那种冰箱。


      当信息以这种方式存储时,你需要使用密钥来将DNA解码回二进制代码,然后转换回可读的格式。Catalog的创始人之一Hyunjun Park表示,一旦公司开始对信息进行编码,他们就会将他们的密钥公开,这样客户就可让任何人都能够对他们的信息进行重新排序。然而,企业可以请求获得一个新的私有密钥,这样他们的信息就有了额外的加密层。

      如果Catalog的技术真如它所说的那样有效,那么该公司将有望为使得基因数据存储可为任何人所用和持续数百年铺平道路。


      试想一下,如果上万亿的数据信息可以被存储在几个小小的试管当中,不仅是存储技术本身的突破,更是人类未来的里程碑,因为事件可以被记录,而未来可以被进一步开发。


(文章内容来源于网易科技)


鸿秦科技

(公众号ID:鸿秦科技)


Copyright © 古田计算器虚拟社区@2017