solidot新版网站常见问题,请点击这里查看。

科学家如何将绿野仙踪编码到 DNA 链

科技
WinterIsComing (31822)发表于 2020年07月31日 14时56分 星期五

来自
作为一种高密度数据储存媒介,合成 DNA 被寄予极大的希望。整个互联网都可以编码为能塞进一只鞋盒的 DNA 链,而且 DNA 分子还非常稳定,能持续数万年甚至数十万年。但问题是如何将大量的比特数据编码进形似意大利面条的 DNA 链。将一种数据格式翻译到另一种数据格式并我们想象的那么简单。得州奥斯丁大学的 William Press 团队创造出了一套 DNA 数据编码和解码算法,研究报告发表在 PNAS 期刊上。他们的工作可能为未来的基因数据存储应用奠定基础。论文合作者、博士后研究员 Stephen Jones 指出,对传统的硬盘和闪存设备而言,位翻转和消磁是 0 和 1 的敌人,而 DNA 的数据储存错误从根本上存在差异。对于可工作的 DNA 数据储存标准,你需要担心的错误是替换、插入和删除。其中替换类似位翻转,比如 T 被替换为 A (A、C、T 和 G 是 DNA 信息的基础语言)。问题就在于没有可靠的方法能知道你所读取的 DNA 链是否包含了任何替换、插入和删除。研究人员提出的 HEDGES 协议(代表 Hash Encoded, Decoded by Greedy Exhaustive Search)没有让单一的核甘酸基包含可用的数据,而是使用累积的核甘酸基序列。研究人员使用经典作品《绿野仙踪》演示了他们的方法。