末成年小嫩xb,嫰bbb槡bbbb槡bbbb,免费无人区码卡密,成全高清mv电影免费观看

劉斌/王笑楠Adv. Sci.:機器學習輔助準確預測聚合時的分子光學特性

研究背景

對于實際應用,分子通常以聚集態存在,因此預測分子在形成聚集體時的性能(如聚集誘導發光 (AIE) 或聚集熒光猝滅 (ACQ))具有重要價值。AIE是2001年首次提出的概念,用于描述聚集體形成時分子種類的異常發光增強,具有AIE行為的發光體被稱為AIEgens。

設計新AIEgen的關鍵是從其分子結構預測AIE特性,這需要對AIE現象有高度的結構-特性理解。考慮到AIE現象的多重因素和背后機制的復雜性,機器學習(ML)極有可能提高目前對AIE的理解,為AIE的性質預測做出貢獻。通過人工智能 (AI) 系統精確預測AIE特性,即使是沒有經驗的AIE研究人員也能夠在未知的分子空間中設計具有AIE特性的分子結構。
劉斌/王笑楠Adv. Sci.:機器學習輔助準確預測聚合時的分子光學特性

研究簡介

在此,新加坡國立大學劉斌教授、王笑楠教授等人首次建立了一個包含文獻報道的356個AIE/ACQ分子的數據庫。通過訓練,這些機器學習 (ML) 模型可以建立結構-特性關系,從而實現對AIE/ACQ特性的快速預測。作者提出了一種多模態方法,通過比較和設計多種預測方法開發了集成策略。首先,同時考慮多個分子描述符,通過降維提取主要特征合成多模態特征。然后,設計并比較了幾種最先進的方法以分析不同方法的優點。最后,集成策略綜合了多種方法的優點,得到最終的預測結果。三個新設計的分子進一步驗證了這種方法在未知分子空間中的可靠性,獲得了模型預測和實驗結果之間的合理一致性。

結果表明ML可以成為預測聚集態分子性質的有力工具,從而加速固態光學材料的發展。該成果以“Machine-Learning-Assisted Accurate Prediction of Molecular Optical Properties upon Aggregation”為題發表在Advanced Science(IF=16.806)上。

劉斌/王笑楠Adv. Sci.:機器學習輔助準確預測聚合時的分子光學特性
圖1. ML輔助AIE/ACQ特性預測和新設計分子的實驗驗證流程圖

圖文詳情

1. 整體ML輔助預測流程

作者在文獻中收集到356個分子用于模型訓練,然后進行實驗分析以證明這些方法的有效性。首先使用分子描述符來表征分子,這是分子ML中的一個關鍵問題。在這項工作中,兩類分子描述符被用作預測分子性質的不同模式,即定量描述符和定性描述符。通過這種方式,可以同時考慮分子的定量和定性特性。然后,提出了五種流行的ML方法來預測分子是否具有AIE特性,包括邏輯回歸 (LR)、K-最近鄰(KNN)、梯度提升 (GB)、隨機森林 (RF) 和多層感知器 (MLP)。
作者還提出了一種融合表決策略來整合不同方法和模式的結果,并將整合的結果作為最終的預測輸出。為了比較和評估算法的有效性,采用了一些包括準確性、曲線下面積 (AUC) 和F1分數在內的評估指標。在實驗中,十倍交叉驗證用于評估具有不同描述符的不同方法,在訓練集上使用了五重交叉驗證來選擇超參數。實驗結果表明,融合表決策略比單一分類模型更穩健。
2. 單模態與多模態訓練
基于定性和定量描述符的不同方法的單獨測試策略稱為單模態訓練,其中定性描述符考慮5種指紋并編碼2048位長度,定量描述符使用108維特征。作者展示了基于多模態描述符的五種不同方法的單模態和多模態的平均結果和集成方法的混雜矩陣,多模態是指將兩類描述符組合成一個特征向量進行訓練。首先使用主成分分析 (PCA) 對2048維指紋特征進行降維,目的是使指紋和定量描述符具有更緊密的維度,避免專注于一種模式。經過這個過程,得到了356維特征,但保留了原始數據的所有信息。此外,還對定量描述符進行z-score標準化,以便它們與PCA無量綱數據具有相同的尺度。因此,對于多模態數據,特征維度為464 (356 + 108)。
劉斌/王笑楠Adv. Sci.:機器學習輔助準確預測聚合時的分子光學特性
圖2. 基于多模態策略的不同方法的結果
結果顯示,多模態預測普遍優于單模態。其中,LR算法的結果比較接近,因為線性回歸方法對特征的擬合有限。當數據為非線性時,很難實現更大的改進及處理數據不平衡問題。KNN的結果沒有顯著改善,這是因為存在維數災難問題,對少數類別的預測精度較低。GB、RF和MLP的結果得到了明顯提升,因為信息豐富的特征在復雜方法中發揮了更大的作用。GB在三個訓練特征集上得到了完全正確的結果,但在測試集上的結果不如RF,這進一步說明GB在訓練集上存在過擬合。RF算法在Daylight指紋+定量描述符的測試集中取得了最佳性能,這表明兩種模態特征的融合提高了分類空間的可分離性。MLP的結果是Daylight指紋中最好的,與單模態結果類似。可以看出,Daylight指紋的特征編碼方式更適合本文數據,與單模態相比,具有多模態數據的集成方法有了明顯的改進。
3. 模型預測的實驗驗證
為了驗證模型預測新分子結構的能力,作者設計了三種潛在的與任何報道的不同結構的AIEgens。根據已知的AIE機制,化合物1和2應該表現出相似的AIE/ACQ 特性。然而,模型預測化合物1是ACQ分子,而2是AIE分子。滴定結果表明,化合物1和2分別顯示出ACQ和AIE特性,與ML預測一致。接下來,用羰基取代了2的二氰基得到了化合物3。很明顯,化合物2的三元氨基環在其AIE行為中起著至關重要的作用,因此推斷化合物3也應具有AIE特性,但ML模型預測化合物3是 ACQ分子。為了驗證預測,作者合成了化合物3并進行了相同的AIE特性研究,結果表明化合物3是ACQ分子,這表明模型在預測優于人類感知的新結構方面具有出色的準確性。此外,只有多模態集成和單模態RF的預測結果是完全正確的,且單模態RF在測試集上的結果不如多模態集成。這表明多模態集成更穩健,對于不同的數據類型同時具有預測和探索能力。
劉斌/王笑楠Adv. Sci.:機器學習輔助準確預測聚合時的分子光學特性
圖3. 模型預測新分子結構能力的實驗驗證

總? 結

作者基于從文獻中收集的包含356個AIE/ACQ分子的數據庫,使用5種指紋和定量描述符等小分子的各種編程語言表達來構建ML模型,預測不同熒光團的AIE/ACQ特性。其中,所提出的多模態集成方法實現了最佳和最穩健的性能。該策略考慮了多個描述符的特性,并結合了多種方法的推理優勢。因此,它不僅可以學習現有的分子結構,還具有預測未知結構的能力。該ML模型在預測全新分子方面的可靠性得到了進一步證明,證明了可以通過結合ML方法和實驗分析來幫助AIEgen設計。

文獻信息

Machine-Learning-Assisted Accurate Prediction of Molecular Optical Properties upon Aggregation, Advanced Science 2021. DOI: 10.1002/advs.202101074

https://onlinelibrary.wiley.com/doi/10.1002/advs.202101074

原創文章,作者:科研小搬磚,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2023/10/11/db87871473/

(0)

相關推薦

主站蜘蛛池模板: 简阳市| 金坛市| 环江| 宁乡县| 含山县| 日喀则市| 尚志市| 沂水县| 华宁县| 彰化市| 惠州市| 天柱县| 张家川| 定兴县| 万载县| 宜都市| 崇左市| 江北区| 巴塘县| 德钦县| 永吉县| 綦江县| 连州市| 广州市| 巩义市| 九江市| 仪征市| 长泰县| 三明市| 集贤县| 通辽市| 汽车| 商洛市| 盐津县| 湖北省| 永康市| 黔西| 昌都县| 铅山县| 深水埗区| 扶绥县|