保质几千年!哈佛大学新研究用蛋白质分子存储数据,比云更安全 2019-05-03







  新智元报道  

来源:harvard

编辑:大明

【新智元导读】哈佛大学研究人员提出一种用寡肽分子存储信息的新方法,信息独立于云端之外,安全性高,数据写入后无须额外能量即可稳定存储几千年之久,检索准确率达到99.9%。

书籍可能被烧成灰,电脑可能被黑,DVD会降解无法读取。尽管近年来信息存储方式不断进步,但目前的信息存储方式仍会遭到或简单或复杂的威胁的影响。无论是一场洪水、一把火,还是一次复杂的网络攻击,都可能让记录的珍贵信息化为乌有。

 

哈佛大学的信息服务中心Whitesides团队的新化学储存方法(如下图所示)需要的空间更少,而且无需输入能量就可存储大量数据。


到目前为止,Cafferty和他的团队已经用这种方法记录、存储并“阅读”了物理学家Richard Feynman的著名演讲、Claude Shannon(他被称为“信息理论之父”)和葛饰北斋的画作《神奈川冲浪里》(右下)。到2020年,全球数字化档案估计达到44万亿Gb(是2013年的10倍),说是“数字化海啸”马上就要来了一点也不为过。

  


随着数据科学的持续繁荣,越来越多的信息在越来越小的空间中实现交互。即使是云存储,最终的空间也会被耗尽,无法阻挡所有黑客,同时要消耗大量能量。


蛋白质分子存储信息:能耗低、安全性高、保质期超长

 

现在,哈佛大学George Whitesides团队提出一种存储信息的新方法,可以将数据稳定存储达数百万年之久,数据不与容易被破解的互联网相连,数据一旦写入,就不会消耗能量。这个方案只需化学家、一些廉价分子和您宝贵的信息就可实现。

 

“想想看,用一茶匙蛋白质就能保存纽约公共图书馆的全部内容,”Brian Cafferty博士说,他是描述该技术的论文的第一作者,目前在George Whitesides博士的实验室中担任博士后研究员。同时参与该研究的还有美国西北大学的Milan Mrksich博士及其团队。该团队在ACS Central报告了他们的新方法。

 

“至少在现阶段,我们认为这种方法还不会与现有的数据存储方式处于竞争关系,”Cafferty说。“我们认为这个方法是对现有技术的补充,从初步目标来看,我们的方法非常适合长期存档数据的存储。”


 论文一作Brian Cafferty

Cafferty的分子存储工具可能无法取代云,但可以为DNA等生物储存工具提供一种诱人的替代方案。最近,科学家们发现了DNA编码的不仅仅是眼睛的颜色。研究人员现在能够通过合成DNA链来记录任何信息。

 

但是,虽然DNA与计算机芯片相比较小,但放在分子世界中来看,DNA的个头就很大了。而且DNA的合成需要熟练且时常重复的劳动。如果存储每条消息都需要从头开始设计,那么大分子存储可能会成为一种耗时长、成本高的方式。 


不同分子量的寡肽注入“微孔”,以二进制编码区分

“我们开始探索一种未从生物学中借鉴的新策略,”Cafferty说。“通过使用有机化学和分析化学中常见技术,开发出一种使用低分子量的分子来编码信息的方法。”

只需一次合成就可以生成足够的小分子,一次编码多个视频,这种方法比基于DNA的方法更省力,更便宜。团队选择了寡肽(两个或多个结合在一起的肽),因为其分子量很低,而且属于性质稳定的常见化合物,其分子比DNA,RNA都要小。

 

由于组成寡肽的氨基酸数量和类型不同,它们的分子质量是有差异的。当不同的寡肽分子混合在一起时,这种差异可以实现相互区分,就像字母表中的不同字母一样。

 

将这些“字母”组成单词会有点复杂:将不同质量的寡肽存储在384个“微孔”中,然后将寡肽混合物放置在金属板的表面上,就像将墨水吸收存储在书页中一样。如果想要读取“写下”的内容,可以通过质谱仪查看其中一个微孔,按质量对分子进行分类。看看这个孔中存在哪些寡肽、不存在哪些寡肽:即实现不同存储内容的区分。

 

然后,为了将混乱的分子翻译成字母和单词,团队使用二进制编码。例如,储存字母“M”可以使用八种可能的寡肽中的四种,每种寡肽具有不同的质量。微孔中存在的四种寡肽读为“1”,而缺失的四种读为“0”。这些分子二进制代码分别指向相应的字母,如果存储的信息是图像,则指向相应的像素。

 

使用寡肽存储的32bits信息原理示意图


使用这种方法,八种寡肽的混合物可以存储一个字节的信息; 32种寡肽的混合物可以存储四个字节,以此类推。

 

现在,这种存储方式的检索准确率为99.9%。平均“写入”速度为每秒8bits,“读取”速度每秒20 bits。尽管“写入”速度远远超过了用合成DNA书写的速度,但对于大分子而言,“读取”速度可能更快、更便宜。

 

分子存储方式无须耗能,独立于互联网之外,安全性更高


未来,还可以通过引入不同类别的分子,提高存储的稳定性和容量,并降低成本。实验中使用寡肽是定制的,因此价格较贵。但未来的图书馆可以购买更便宜的分子(如烷硫醇),只需1美分就可以记录1亿比特的信息。

 

寡肽等分子具备复原能力。“在适当的条件下,寡肽可以在数百年甚至数千年的时间内保持稳定性。”在高温和干旱的情况下,这些分子可以在没有光或氧的情况下存活下来。而且,黑客无法像攻破云存储那样窃取分子存储的内容,分子存储只能通过人工访问。即使“小偷”发现数据藏匿,也需要一点化学知识才能实现代码检索。

 

Cafferty团队的可扩展的分子存储库是一种稳定的、零能耗、抗腐蚀的存储可选方案,可用于未来的信息存储。因此,当未来一旦书被烧了、计算机被黑了,DVD读不出来了,这些分子可能还会继续存在,以提醒未来的人类,我们曾经是多么喜欢那些萌萌的猫咪视频。

 

该研究由美国国防部高级研究计划局(DARPA)资助。

参考链接:

https://chemistry.harvard.edu/news/storage-beyond-cloud

论文:

https://pubs.acs.org.ccindex.cn/doi/pdf/10.1021/acscentsci.9b00210


新智元春季招聘开启,一起弄潮 AI 之巅!

岗位详情请戳:


【加入社群】


新智元 AI 技术 + 产业社群招募中,欢迎对 AI 技术 + 产业落地感兴趣的同学,加小助手微信号:aiera2015_2   入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 – 公司 – 职位;专业群审核较严,敬请谅解)。

    已同步到看一看

    发送中