DNA 包裹的單壁碳納米管 (SWNT) 偶聯(lián)物具有獨特的光學特性,可用于生物傳感和成像應用。DNA-SWNT傳感器開發(fā)的一個關(guān)鍵限制是目前無法預測賦予這些傳感器強烈的分析物特異性光學響應的獨特DNA序列。在此,美國德克薩斯大學埃爾帕索分校Lela Vukovi?及加州大學伯克利分校Markita P. Landry等人基于~100個DNA-SWNT偶聯(lián)物的近紅外(nIR)熒光響應數(shù)據(jù)集,通過從~ 1010個獨特的DNA-SWNT候選池開始的選擇性進化協(xié)議縮小范圍并將其用于訓練機器學習(ML)模型,以預測對神經(jīng)遞質(zhì)血清素具有強烈光學反應的DNA序列。首先,在序列特征上進行訓練基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的分類器模型,以將DNA配體分類為對血清素的高/低反應性。其次,訓練支持向量機(SVM)回歸模型來預測DNA序列的相對光學響應值。最后,通過驗證實驗證明,將最高質(zhì)量的神經(jīng)網(wǎng)絡(luò)分類器(卷積/人工)和SVM回歸模型的集成預測相結(jié)合,可以實現(xiàn)對高/低響應序列的最佳預測(高響應序列的預測正確率為60%,對低響應序列的預測正確率為90%)。圖1. 在初始數(shù)據(jù)集上訓練的代表性CNN模型的性能總體而言,作者基于ML方法發(fā)現(xiàn)了五個血清素 DNA-SWNT傳感器。重要的是,這些傳感器都比以前僅使用手動篩選并通過實驗確定的傳感器具有更高的響應值。此外,使用該模型預測對血清素(或任何感興趣的分析物,如干擾劑)無反應的DNA序列的能力對于傳感器設(shè)計也很重要。綜上所述,這項研究結(jié)果表明ML方法可以快速識別對目標分析物有高反應性的DNA序列,并且可以顯著加快基于DNA-SWNT偶聯(lián)物的技術(shù)的發(fā)展,包括生物傳感器、生物電子學和SWNT的手性分離。圖2. 基于多個高質(zhì)量分類和回歸模型預測DNA序列對血清素的反應Discovery of DNA–Carbon Nanotube Sensors for Serotonin with Machine Learning and Near-infrared Fluorescence Spectroscopy, ACS Nano 2021. DOI: 10.1021/acsnano.1c08271