英文原題:Machine-Learned Electronically Excited States with the MolOrbImage Generated from the Molecular Ground State

通訊作者:任詠華,香港大學
作者:陳自勇,任詠華
研究背景
與激發態性質相關的判據對于發光材料的篩選與設計有指導意義。例如,高效率的熱活化延遲熒光發光分子往往具有較小的單–三重態分裂能(ΔES-T)。雖然密度泛函理論已經廣泛應用于激發態計算,其成本還是遠大于對分子基態的計算,對三重態激發能也有較大的預測誤差。而要包含激發態的電子相關效應,則需要進一步增加成本。因此,使用機器學習考慮電子相關效應,對激發態性質進行高精度地預測,成為了另一個實用的方案。相比對分子基態性質的大量研究,機器學習在激發態方面的應用還相當有限。將基態計算得到的分子軌道,與不同的量子算符結合,可以生成各式的電子積分矩陣。有趣的是,矩陣本身可以視作一個二維的分子軌道圖像(MolOrbImage)。受到卷積神經網絡(CNN)在計算機視覺領域巨大成功的啟發,我們相信將CNN與MolOrbImage結合對于激發態性質的預測也會達到理想的準確度。
?
快訊亮點
以電子相關方法[ADC(2)]為基準,通過構建以卷積層為主導的神經網絡,本項工作對分子激發態性質進行了準確預測,包括:?
(1)對第一單重態(S?)和三重態(T?)能量,平均絕對誤差優于文獻報道;?
(2)單重態躍遷振子強度得到了定性預測;?
(3)對于不在訓練集范圍內的分子,模型展現了一定的可遷移性。
內容介紹
本文選取了40000個QM9分子(最多包含9個重原子,包括碳,氮,氧和氟),在ADC(2)/cc-pVTZ水平下計算了激發能和振子強度,以用作訓練和測試集。結果表明,對S?(圖1a)和T?(圖1b)激發態能量預測的誤差呈現正態分布,且平均絕對誤差也隨著訓練集中分子數目(Ntrain)的增加而穩步下降。整體結果優于先前的文獻報道。對于比較困難的振子強度,預測的準確性也隨著Ntrain的增大而增加,fS1在Ntrain=32000時相關系數r達到了0.86。雖然我們的模型不會直接學習激發態間的分裂能,這些分裂能可以間接地通過絕對能量相減得出。本文展示了三個對分子設計具備指導意義的能差(圖1d-f),其中的ΔET1-T2和本課題組最近提出的熱刺激延遲磷光(TSDP)緊密相關。對于三個能差,預測結果和參考值間均顯示了非常強的相關性(r>0.9)。?
?一個有實際應用價值的機器學習模型也需要能夠對不在訓練集中的分子做出合理預測。本文通過外推集分子(圖2a)展示了模型優異的遷移性。對內插分子(圖2b,2d),特別是ET1,模型預測結果明顯的優于基于密度泛函理論的計算值。到了外推集,模型的預測平均絕對誤差只是稍微增加,而且相關系數也大于0.95(圖2c,2e)。我們相信,基于分子軌道的MolOrbImage,可以獲取外推分子的重要特征,從而使模型具有強大的遷移性。
綜上所訴,本文基于卷積神經網絡和分子軌道圖像,在基態計算的成本上可以得到含有電子相關效應的激發態性質。該工作不僅是對機器學習激發態研究的擴充,也可以為發光功能材料的篩選和設計提供理論指導。
圖 1. 模型的預測結果:第一(a)單重態和(b)三重態激發能的誤差分布隨訓練集體量的變化,平均絕對誤差在括號中給出;(c) 單重態振子強度的學習曲線;(d) ΔES1-T1,(e) ΔES2-S1 和(f) ΔET2-T1的預測值與參考值,r為相關系數。
圖 2. 模型的遷移能力:(a)我們選取了測試集中的前100個分子作為內插集,并通過對內插分子的改造得到了外推集。在外推集中,分子可以含有第三周期元素,或者重原子數大于9。(b,d) 內插集和(c,e)外推集的機器學習結果和基于B3LYP的計算結果也進行了對比。
J. Phys. Chem. Lett. 2023, 14, 7, 1955–1961
Publication Date: February 14, 2023
https://doi.org/10.1021/acs.jpclett.3c00014
Copyright ? 2023 American Chemical Society
原創文章,作者:計算搬磚工程師,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2023/12/31/a83b28e8af/