末成年小嫩xb,嫰bbb槡bbbb槡bbbb,免费无人区码卡密,成全高清mv电影免费观看

【AI+計算+材料】北航ACS AMI:機器學習擴展過渡金屬硼化物家族!

【做計算 找華算】理論計算助攻頂刊,10000+成功案例,全職海歸技術團隊、正版商業軟件版權!經費預存選華算,高至15%預存增值!研究背景層狀三元過渡金屬硼化物(MABs) 由于獨特的物理性質(如高強度、導電性等),在電催化、電化學、高溫陶瓷等領域有廣泛的應用前景。其中,M2AB2在MBenes的合成中起著重要作用。然而,目前對M2AB2的研究仍將A位點局限于IIIA和IVA族元素,需要全面探索M2AB2的化學組分空間。最近,在描述化合物的熱力學穩定性時,常用的指標是分解反應到相應競爭相的能量ΔHd,可以通過凸包(convex hull,CH)分析得到的,但由于需要手工編程和復雜的數據處理,這種方法復雜且成本高。此外,現有的小規模數據集也限制了一般機器學習(machine learning,ML)方法的發揮。對此,北京航空航天大學孫志梅團隊基于高通量智能計算平臺(ALKEMIE),開發了一個小數據集的機器學習方法來探索M2AB2的穩定性。作者構建了3個M2AB2晶體結構數據集,研究不同結構和組分特征對穩定性的影響,研究成果擴展了MAB系列材料,并提供了一種基于小數據集的機器學習方法來預測新化合物。結果與討論DFT和ML的整體框架如圖1所示。首先,將所有優化好的結構隨機分成三個數據集,即訓練集(60%)、驗證集(10%)和測試集(30%)。其次,根據數據集生成相應的組成與結構特征;在訓練集和驗證集中,通過CH分析得到作為ML目標的ΔHd值。然后,基于原始特征和目標進行特征選擇,選出優化后的特征子集;接著,基于訓練集和驗證集進行訓練過程和實時的模型優化。最后,得到可靠的模型,并在測試集上進行測試,根據DFT-ML結果評估MAB相的穩定性。圖1. DFT-ML整體框架為了盡可能多地探索新的M2AB2,作者選擇的DFT數據集的化學空間包括M = Sc、Y、Ti、Zr、Hf、V、Nb、Ta、Cr、Mo、W、Mn、Tc、Fe、Ru、Co、Rh、Ni和A = Zn、Cd、Al、Ga、In、Tl、Si、Ge、Sn、Pb、P、As、S,如圖2所示。本文共研究了234個正交晶系和234個六方晶系的M2AB2結構。考慮到晶體對稱性的影響,作者構建了3個DFT數據集:(I)包括234個正交晶系和234個六方晶系的M2AB2結構;(II)僅包含234個六方晶系的M2AB2結構;(III)僅包含234個正交晶系的M2AB2結構。在特征生成過程中,為了生成高質量的輸入矩陣,作者選擇了13種組分和結構特征,包括元素性質、原子軌道、價電子軌道等,并使用了各種統計數據,例如平均值和標準差等來描述這些特征。對于數據集I,考慮到兩種不同晶體對稱性的影響,生成了87個組分和結構特征。對于數據集II和III,由于每個數據集中只有一種晶體,因此產生了78個組分特征。圖2. 候選M2AB2的化學空間考慮到M2AB2的規模(數據集I、II和III為468、234和234,<103)屬于小樣本建模,過大的特征數量級(102)可能無法訓練出可靠的模型,導致維數災難和模型性能不佳。因此,作者使用MOD-selection算法進行特征工程。使用MOD-selection算法,作者分別在數據集I、II和III的特征數閾值N = 5、10、15和20處獲得了4個優化的特征子集。為了展示特征選擇的結果,作者以數據集I中的15個特征的子集為例,如圖3所示。平均的Mendeleev Number(meanMN)在子集中排名第一,對目標ΔHd的影響占主導地位。第二個特征 rNfV顯示了f價電子對數據集I中ΔHd的重要影響。除了meanMN和rNfV之外,子集中的其他特征對ΔHd的影響相對較小,但對獲得可靠的ML模型也做出了貢獻。特征選擇完成后,對所有子集進行歸一化處理,保證輸入矩陣的所有列都在同一量綱,避免數據值的奇異性。最終,對于三組M2AB2,訓練過程的輸入數據矩陣由相對于晶體數量的M行(數據集I為M = 326,數據集II和III為M = 164)和對應特征號的N列(N = 5、10、15和20)組成。因此,在數據集I、II和III中,分別有142、70和70個晶體用于預測過程。圖3. 候選M2AB2的化學空間為了避免小樣本ML方法在訓練過程中出現過擬合或數據泄漏的問題,作者基于holdout交叉驗證方法分析了訓練集和測試集的統計分布。統計結果如圖4所示。對于meanMN和平均電負性(圖4a、c),結構特征(c軸的晶格常數,圖4b)、目標ΔHd(圖4d)等,訓練集和測試集的分布基本一致。此外,ΔHd在訓練集和測試集上的取值范圍均為-0.05~0.65 eV/atom,符合正態分布。因此,在數據的統計分布方面可以有效避免過擬合或數據泄漏問題。圖4. 平均Mendeleev Number,晶格常數(c軸),平均電負性,和ΔHd的頻率分布直方圖,藍色和橙色表示訓練和測試數據為了減少小樣本對模型精度的影響,作者在深度神經網絡(deep neural network,DNN)中采用了Batch歸一化和Dropout層等一系列方法。此外,為了獲得高精度和高效率的最佳模型,作者創建了一系列具有不同隱藏層結構的DNNs,并在1000個epoch中選擇具有不同特征數閾值(N = 5、10、15和20)的子集對這些網絡進行訓練。在15個特征子集上訓練的兩種隱藏層結構(200、100和40)的DNN具有最小的平均絕對誤差(MAE,0.041 eV/atom)和RMSE (0.049 eV/atom),被選為預測數據集I中預測ΔHd的最佳模型。圖5a顯示了隱藏層為200、100和40的模型在驗證數據集上的回歸性能。大多數數據點分布良好,這意味著該模型具有良好的回歸性能。為了評估模型的熱力學穩定性分類性能,作者使用圖5b中訓練集和驗證集的數據點繪制了一個混淆矩陣。在混淆矩陣中,虛線表示ΔHd(70 meV/atom)的閾值,它將數據點分為四部分(TP,TN,FP,FN)。紫色點(TP和TN)代表正確識別為熱力學亞穩或不穩定相的M2AB2對應的數據,而橙色點(FP和FN)代表錯誤分類的M2AB2。總體分類準確率達到90%,表明該模型具有出色的分類性能。1000個epoch的訓練集和驗證集的均方誤差(MSEs)如圖5c所示。訓練集和驗證集的MSE損失函數分別收斂于0.0042和0.0024,表明模型得到了充分的擬合。此外,數據集I、II和III在未知測試集上的表現也進一步驗證了模型的可靠性。圖5.(a) DFT計算的ΔHd和預測的ΔHd比較;(b)將ΔHd預測應用于穩定性預測得到的混淆矩陣;(c)1000個epoch中訓練集和驗證集的MSE loss評估ML模型的可解釋性具有重要意義。一個可解釋的模型可以挑選出優勢特征,并擬合出目標與特征之間的關系。圖6顯示了ΔHd上一些重要特性的協同效應。在圖6a中,對于數據集I中的混合晶體類型模型,c軸的晶格常數可以看作是六方晶系(藍色,<10 ?)和正交晶系(紅色,>10 ?)的顯著特征。大多數藍色點低于紅色點,這表明六方晶系的M2AB2一般比正交晶系的M2AB2更穩定。在圖6b中,最大Mendeleev Number(A原子的基團數)與ΔHd沒有明顯的關系。然而,對于某一種A原子,所有穩定或亞穩態M2AB2(ΔHd < 70 meV/atom)都具有5種類型的未填電子軌道(NUnfill = 5),不穩定M2AB2呈現NUnfill≤5。也就是說,NUnfill = 5是M2AB2熱力學穩定的必要條件。圖6c顯示了數據集II的兩個重要特征。當最大Mendeleev Number或A元素類型不變時,特征平均電負性直接由M元素的電負性決定。在圖6d中,對于數據集III,與數據集I和數據集II相比,Mendeleev Number最大的ΔHd的總體增長趨勢更為明顯。圖6. 可視化預測ΔHd和重要特征,互補的特征在一定程度上縮小了ΔHd的目標范圍,并表現出ΔHd的變化趨勢采用ML和DFT相結合的方法,系統地研究了六方晶系和正交晶系M2AB2在化學空間中的熱力學穩定性。考慮到不同晶體結構對稱性的數據集I、II和III訓練的三個DNNs,并且每組的訓練和測試數據集是隨機分開的,六方晶系和正交晶系M2AB2的DFT計算或ML預測結果ΔHd以熱圖的形式同時展示。數據集I、數據集II和III的ΔHd熱圖如圖7所示。一般來說,每個熱圖中網格從左到右的顏色變化(從藍色到紅色)表明,前面的過渡金屬可以穩定六方晶系和正交晶系的M2AB2結構。這種趨勢與作者的ML模型發現的組分特征平均Mendeleev Number是一致的。含有過渡金屬Tl和Pb的晶體在六方晶系和正交晶系中都相當不穩定。含Al正交晶系的結構ΔHd值較低(圖7b,d),說明正交晶系有利于M2AlB2的穩定性。此外,數據集I和II中的六方晶系Zr2PbB2(圖7a,c)和數據集I和III中的正交晶系Mo2AlB2(圖7b,d)的穩定性與之前的DFT計算相對應。此外,還發現了3個負ΔHd的新M2AB2具有較高的合成可能性。在數據集I和II中,它們是六方晶系的Nb2PB2,Nb2AsB2和Zr2SB2(圖7a,c),這為將MABs擴展到VA和VIA族提供了機會。圖7. 數據集I中六方晶系(a)和正交晶系(b)以及數據集II中六方晶系(c)和數據集III中正交晶系(d)的M2AB2 ΔHd熱圖此外,為了評價熱力學穩定性相對較低的體系的熱穩定性,作者選擇了ΔHd值在65~75 meV/atom之間的三種亞穩相,包括六方晶系的V2AsB2和Ta2AsB2以及正交晶系的Hf2CdB2。然后,作者通過10 ps的AIMD模擬測試了它們在300 K下的熱穩定性。通過力學穩定性和動力學穩定性評估,保證了MAB相的理論存在性。作者計算了M2AB2的力學性能和聲子譜。用DFTP法計算了M2AB2的剛度常數和聲子譜。最后得到38個六方晶系和19個正交晶系理論穩定的M2AB2。M2AB2的理論體積模量(K)、剪切模量(G)和楊氏模量(E)分別為76~280 GPa、39~193 GPa和100~454 GPa和68~272 GPa、47~175 GPa和115~404 GPa。其中,六方晶系的V2PB2(454 GPa)和Nb2PB2(414 GPa)表現出較高的強度,模量值也相對較高,甚至遠遠大于先前報道的MABs和MAXs。總結展望作者訓練了三種不同的ML模型,將DFT和ML相結合來預測ΔHd和相應的M2AB2的熱力學穩定性。與計算的DFT相比,模型的預測精度高(>95%)且具有較低的MSE(~0.003),因此可以作為預測ΔHd的可靠工具。模型揭示了ΔHd和穩定性之間的定量關系,發現了3個穩定的六方晶系M2AB2,和75個亞穩態M2AB2。這項工作為小樣本ML建模提供了一種方法,以加速化合物的發現,并將MAB系列化合物擴展到VA和VIA族。文獻信息Yuqi Sun, Guanjie Wang, Kaiqi Li, Liyu Peng, Jian Zhou, Zhimei Sun. Accelerating the Discovery of Transition Metal Borides by Machine Learning on Small Data Sets. ACS Applied Materials & Surfaces 15, 24, 29278-29286 (2023)https://doi.org/10.1021/acsami.3c03657 點擊閱讀原文,報名計算培訓!

原創文章,作者:計算搬磚工程師,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2023/10/25/232dc4a63f/

(0)

相關推薦

主站蜘蛛池模板: 荔波县| 平陆县| 瑞丽市| 常山县| 永州市| 湾仔区| 汾阳市| 将乐县| 当阳市| 阳朔县| 南溪县| 新余市| 右玉县| 安龙县| 航空| 马山县| 达拉特旗| 奇台县| 卓尼县| 武功县| 乌拉特前旗| 武宁县| 黑河市| 东丽区| 班戈县| 广元市| 富蕴县| 泗阳县| 正安县| 灵丘县| 湘乡市| 温州市| 巴林右旗| 吉水县| 米脂县| 志丹县| 宜宾市| 瓦房店市| 剑川县| 延长县| 常宁市|