研究背景分子在催化劑表面的吸附強度是影響催化反應活性的關鍵描述符。然而,在很多催化反應(如合成氣轉化)中,會產生大量的反應中間體,反應勢能面更加復雜。這進一步導致了所研究的吸附幾何構型存在很大的不確定性,尋找最優的吸附構型是一個耗時且困難的全局優化問題。針對這個難題,弗里茨·哈伯研究所(隸屬于德國馬克斯·普朗克科學促進學會)Johannes T. Margraf團隊提出了一種基于機器學習的自動化全局優化協議,用于確定最佳的表面吸附物構型。該方法適用于任意表面模型,并通過迭代地更新模型所配置的訓練集,從而最小化人為干預和所需的DFT計算成本。結論與展望全局優化協議的流程如圖1(a)所示,包含三個部分:第一部分:使用極小值跳躍(Minima hopping,MH)方法來生成訓練數據集,經過少量的DFT驗證后,實現迭代式的Gaussian approximation potentials (GAP)優化;第二部分:通過MH并行模擬產生大規模的具有能量極小值的構型;第三部分:使用核主成分分析(KPCA)和K-Means聚類產生最終的候選構型,使用DFT進行優化。圖1. (a)流程框架圖;(b)建模約束與DFT優化策略;(c)數據采樣策略該流程采用吸附分子和經過優化的基底結構作為輸入。作者首先使用了SMILES字符串來表示吸附分子,并使用RDkit包中的MMFF力場來優化氣相下的吸附分子。MMFF力場是基于半經驗的,但是避免了非物理基礎,保留了化學鍵拓撲規則(Hookean約束)。將吸附分子放置在基底表面所得到的構型作為GAP模型的初始訓練集。很顯然,基于單個吸附構型得到的機器學習勢的精度很低,難以找到勢能面上的全局最優點。盡管如此,這些構型對于提升GAP,尋找勢能面中的高能量區域是有幫助的。對于生成的構型,作者采用分層的最遠點采樣方法(stratified FPS),從中挑選出5個結構進行DFT計算。所得到的計算結果除了為下一個GAP模型提供訓練數據外,還用于估計當前GAP的外推誤差。作者提出了基于均方根誤差的Exponential moving average(EMA)方法來估計DFT與GAP的能量與原子受力的偏差,以Rh<211>表面吸附CH2CO分子為例得到的GAP收斂趨勢如圖2所示。當GAP的能量偏差小于8meV/atom、原子受力偏差小于0.15eV/?時,則認為GAP模型收斂。圖2. 模型收斂評估,紅色表示均方根誤差,藍色表示均方根誤差的EMA經過收斂,該迭代式訓練過程產生了一套假定的形成能極小值所對應的構型。然而,基于初始迭代和訓練,這些構型的精度和質量相當低。因此,收斂的GAP模型被用于更為大規模的MH模擬。這里,作者使用了一個并行的MH模擬方法,其中產生了許多獨立的MH模擬,并同時探索勢能面的不同區域,共享訪問能量最小值的信息,如圖3所示。由于全局最小結構通常是先驗未知的,因此決定何時終止并行MH運行是不確定的。為此,作者采用了類似于MD模擬的終止策略,每個MH進程使用獨立的溫度進行模擬,當溫度達到初始溫度的兩倍或超過最大迭代次數時終止。在并行MH方法中,由于幾個MH模擬通常會落在勢能面的重疊區域,重新發現附近先前發現的最小值,收斂的速度得到了極大的提升。圖3. 并行MH模擬架構由于并行MH模擬嘗試對吸附分子和結合位點空間進行詳盡的探索,這通常會得到勢能面上極小值的吸附構型。然而,這些都是GAP 上的最小值點,同時還受到吸附分子的Hookean約束。為此,作者提出了進一步的構型篩選策略用于DFT計算。對于這些構型,作者將其Smooth Overlap of Atomic Positions(SOAP)向量的均值作為輸入進行KPCA降維(可視化如圖4所示),并通過K-Means(K=10)進行構型聚類,依據GAP,選擇類中最低形成能的構型用于DFT優化。圖4. 吸附構型的篩選策略,圖的左上角給出了2D的KPCA可視化,并標注了每個類中的最低形成能構型;圖的右上角描述符了構型的形成能;圖的下方給出了5個典型的構型為了證明所提出的工作流程在多相催化中的適用性,作者使用了13個分子在Rh<111>上吸附和5個分子在Rh<211>上吸附的兩組案例進行驗證,如圖5所示。通過與Yang等人之前的研究結果對比,作者發現所提出的流程可以找到相似甚至更低形成能的吸附構型,這表明GAP和MH模擬的質量都足以預測DFT優化的有用初始構型。最大的差異是在Rh<211>吸附CH3CHOH上觀察到的,作者發現了一個比之前報道的最小值低0.26 eV的構型。顯然,這樣的能量差異對催化將有重要的影響。此外,作者還分析了該優化流程在計算成本上的核心優勢,像H2O和CH3這樣簡單的吸附只需要15-16次迭代,即使是像CH2CO這樣復雜的吸附物,整個工作流程的執行時間也不到8000核小時(on a 40 core Intel Skylake 6148 node)。相比之下,在DFT水平上執行完整的并行MH運行將需要大約155倍的計算成本。
圖5. 吸附形成能與構型對比分析
結論與展望這項工作提出了一個表面吸附的全局優化工作流程,可以使用少量的DFT計算作為參考,而無需人工干預,自動化地為任何類型的表面吸附體系生成定制的原子間勢。該優化流程也在Rh<111>和<211>表面合成乙醇的重要反應中間體上進行了測試。總的來說,這項工作提出了一個穩健高效的全局優化工作流程,非常適合應用于多相催化的復雜過程。文獻信息Jung, H., Sauerland, L., Stocker, S. et al. Machine-learning driven global optimization of surface adsorbate geometries. npj Comput Mater 9, 114 (2023).https://doi.org/10.1038/s41524-023-01065-w