DNA存儲,已經(jīng)顯示出在存儲密度、壽命和能耗方面,超越當(dāng)前基于硅的數(shù)據(jù)存儲技術(shù)的潛力。
然而,通過從頭合成將大規(guī)模數(shù)據(jù),直接寫入DNA序列,在時(shí)間和成本上,仍然不夠經(jīng)濟(jì)實(shí)惠。
在此,來自美國亞利桑那州立大學(xué)的嚴(yán)浩、北京大學(xué)的張成、歐陽頎以及錢瓏等研究者提出了一種替代的并行策略,可以使用預(yù)制核酸在DNA上寫入任意數(shù)據(jù)。相關(guān)論文以題為“Parallel molecular data storage by printing epigenetic bits on DNA”于2024年10月23日發(fā)表在Nature上。
全球數(shù)據(jù)領(lǐng)域的快速擴(kuò)展對大規(guī)模數(shù)據(jù)存儲提出了迫切挑戰(zhàn),并急需更好的存儲材料。受自然界中基因信息保存方式的啟發(fā),DNA因其卓越的存儲密度和耐久性,近年來被認(rèn)為是數(shù)字?jǐn)?shù)據(jù)存儲的有前途的生物材料。
在當(dāng)前的DNA存儲中,數(shù)據(jù)通常被轉(zhuǎn)碼為核苷酸堿基序列,寫入過程依賴于全新合成,即核苷酸按照預(yù)定順序逐一添加。盡管全新合成技術(shù)在吞吐量和效率方面不斷進(jìn)步,但串行合成過程本質(zhì)上限制了寫入速度和合成DNA的長度,并阻礙了數(shù)據(jù)寫入成本的大幅降低。
為了實(shí)現(xiàn)高效的DNA存儲,必須尋找不依賴全新合成的替代數(shù)據(jù)寫入方法,這些方法應(yīng)能夠并行且可編程地工作。實(shí)際上,已經(jīng)提出了一些優(yōu)雅的并行寫入設(shè)計(jì),例如通過結(jié)構(gòu)編程的DNA載體實(shí)現(xiàn)并行寫入,但結(jié)構(gòu)不穩(wěn)定和信息處理吞吐量有限等問題阻礙了這些方法的應(yīng)用。
相比之下,在人體細(xì)胞中,表觀基因組在不變的基因組序列之上編碼了穩(wěn)定的修飾信息。同樣,一個(gè)表觀編碼數(shù)據(jù)的系統(tǒng)可能足以在相同的DNA序列上實(shí)現(xiàn)長期信息存儲。
然而,當(dāng)前體外的表觀遺傳信息并行寫入在數(shù)據(jù)選擇性上不夠靈活。因此,為了實(shí)現(xiàn)無合成的DNA數(shù)據(jù)存儲,一個(gè)能夠在通用DNA上編程任意表觀遺傳信息的框架是理想的選擇。
另一方面,DNA自組裝已經(jīng)被廣泛研究,并能夠在納米尺度上實(shí)現(xiàn)精確的分子編程。DNA序列編程使得在大規(guī)模上對超分子結(jié)構(gòu)進(jìn)行并行且精確的控制成為可能。
之前的研究展示了使用數(shù)千種DNA鏈條在一次反應(yīng)中編程多微米交叉DNA結(jié)構(gòu)和線框DNA多面體的能力。
在此,受到自然表觀基因遺傳繼承和合成DNA自組裝的啟發(fā),研究者開發(fā)了一種非傳統(tǒng)的DNA數(shù)據(jù)寫入框架,該框架基于DNA自組裝指導(dǎo)的酶促甲基化,能夠并行穩(wěn)定地將任意表觀遺傳信息位(epi-bits)寫入DNA模板。
通過自組裝引導(dǎo)的酶甲基化,表觀遺傳修飾作為信息位,可以精確地引入到通用DNA模板上,以實(shí)現(xiàn)分子可移動型印刷。通過對有限的700個(gè)DNA可移動類型和5個(gè)模板進(jìn)行編程,研究者在一個(gè)自動化平臺上實(shí)現(xiàn)了大約275,000位的無合成寫入,每個(gè)反應(yīng)寫入350位。
以復(fù)雜表觀遺傳模式編碼的數(shù)據(jù),通過納米孔測序高通量檢索,并開發(fā)了算法,每個(gè)測序反應(yīng)可精細(xì)解析240個(gè)修飾模式。在表觀遺傳信息位框架下,60名缺乏專業(yè)生物實(shí)驗(yàn)室經(jīng)驗(yàn)的志愿者實(shí)現(xiàn)了分布式和定制的DNA存儲。
研究者的框架提出了一種新的DNA數(shù)據(jù)存儲模式,它是并行的、可編程的、穩(wěn)定的和可擴(kuò)展的。這種非常規(guī)的模式為生物分子系統(tǒng)中的實(shí)際數(shù)據(jù)存儲和雙模式數(shù)據(jù)功能開辟了道路。
圖1 epi-bit DNA存儲示意圖。
圖2 選擇性epi-bti寫入的設(shè)計(jì)與驗(yàn)證。
圖3 可編程DNA排版和并行epi-bit書寫。
圖4 通過一鍋測序擴(kuò)大外位數(shù)據(jù)存儲和數(shù)據(jù)檢索。
圖5 利用epi-bits條形碼實(shí)現(xiàn)高并行度的大規(guī)模存儲。
圖6 定制和分布式epi-bit DNA存儲。
綜上所述,隨著DNA數(shù)據(jù)存儲進(jìn)入商業(yè)化的曙光,epi-bit框架展示了具有預(yù)制模塊化的并行分子信息存儲的潛在方向。展開了廣泛的研究路線。例如,優(yōu)化序列設(shè)計(jì)和甲基轉(zhuǎn)移酶效率將實(shí)現(xiàn)穩(wěn)健和精確的數(shù)據(jù)寫入。
存儲密度可以進(jìn)一步增加,通過納入各種DNA修飾與準(zhǔn)確的檢測方法相匹配。最后,結(jié)合DNA自組裝輔助編程和無數(shù)的酶修飾,可以為實(shí)用和功能化的分子數(shù)據(jù)系統(tǒng)實(shí)現(xiàn)多樣化的DNA存儲和計(jì)算功能。
PS:對此,Nature期刊針對這項(xiàng)研究,特邀請 Carina Imburgia & Jeff Nivala兩位研究者,以“‘Do-it-yourself’ data storage on DNA paves way to simple archiving system”為題,發(fā)表了評論文章。由此可見,這篇文章的重要地位。
原創(chuàng)文章,作者:zhan1,如若轉(zhuǎn)載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2024/10/24/86ef61a553/