Edward H. Sargent院士npj.Comput.Mater.: AI+計算+實驗!開發可解釋的材料設計模型 2024年1月4日 上午10:05 ? 頂刊 ? 閱讀 31 研究背景 面向材料性質預測的機器學習模型以很小的計算成本來得到與密度泛函理論近似的計算結果,這加速了新材料發現的進程。為了彌合理論和實驗之間的差距,機器學習的預測結果需要以可解釋的化學規則的形式提煉出來,供科學家使用,從而來進一步設計新材料。 在此,多倫多大學Edward H. Sargent團隊和渥太華大學Isaac Tamblyn團隊合作提出了一種將基于進化算法的搜索與機器學習代理模型相結合的框架(Deep Adaptive Regressive Weighted Intelligent Network,DARWIN),可以有效利用機器學習的解釋性指導材料的發現。 結果與討論 DARWIN包含3個部分: (1)機器學習預測代理模型 在代理模型中,作者主要關注光電材料的應用,因此,作者聚焦于材料的熱穩定性(energy above the hull)、帶隙和帶隙的類型(direct/indirect),開發了3個預測模型。熱穩定性和帶隙類型的數據來源于Materials Project數據庫,分別包含117000和45000個數據點;帶隙的數據來源于開源的HSE06數據庫,包含超過10000個材料的HSE06帶隙數據。 3個代理模型均使用了圖神經網絡框架,并由MatDeepLearn包和PyTorch框架聯合搭建(原子表示為圖的節點,兩個原子之間的空間信息表示圖的邊,如圖1(a)所示),將得到的圖利用卷積層和池化層實現材料的特征提取。為了提高代理模型的精度,作者采用遷移學習的策略,即在OQMD數據庫中的500k的形成能數據上訓練得到一個源模型,并通過微調的方法訓練本文中的三個目標代理模型。在熱穩定性和帶隙預測中,經過遷移學習得到的模型誤差要比從頭訓練模型的誤差低;在帶隙類型的預測中,經過遷移學習得到的模型的精度要比從頭訓練模型的精度高。此外,由于帶隙類型的數據不平衡,作者采用了欠采樣(under-sampling)的方法來平衡直接帶隙和間接帶隙數據集,所得到的性能對比如圖1(b-d)所示。圖1中,r-MEGNet和r-CGCNN表示使用優化結構的數據集上訓練的MEGNet和CGCNN模型,將其性能視為baseline性能。 圖1:(a)圖神經網絡架構;(b)預測熱穩定性的性能對比;(c)預測帶隙的性能對比;(d)預測帶隙類型的性能對比 (2)進化算法(Evolutionary algorithm,EA)搜索模型 EA建立在三個代理模型的基礎上,用于快速搜索具有特定性質的材料,如圖2所示。EA可以分為五個步驟:初始化一個主要的候選材料集、使用代理模型進行預測、評估這些預測的性質與目標性質的差距、選擇合適的材料(適者生存)、突變選擇的個體(替換一定比例的元素)產生新的候選集。突變過程是采用替換具有相同氧化態的元素實現的,以保證結構的電中性。EA依靠代理模型來預測感興趣的材料性質,并評估候選集合的適合性。實驗表明,突變策略本身就足以搜索廣闊化學空間,來得到最佳的材料組成。 圖2:進化算法架構 (3)化學可解釋性模型 DARWIN通過確定化學特征和規則來提供對材料性質的物理和化學見解,這些信息可以為實驗科學家設計新材料提供參考。在EA模型運行過程中,所有候選物都被分為兩類:滿足目標性質的材料和不滿足目標性質的材料。這些材料都使用新的材料描述符來描述,如對于AxByXz化合物,采用B位點和X位點原子的電負性的統計值,以及各類孤立的元素性質、元素的HOMO-LUMO能級以及能帶中心等。為此,作者訓練了一個基于隨機森林的分類模型,以獲得描述符對模型的重要性。 為了證明DARWIN的有效性和通用性,作者在以下3個案例中進行了實踐。 (1)設計具有直接帶隙的材料 作者嘗試將研究直接帶隙和間接帶隙的材料體系擴展至所有穩定的p-block半導體。DARWIN發現,化合物包含高原子質量的p-block元素更容易表現出直接帶隙(即元素具有更小的熔點和大的共價半徑),這已經被相關文獻所報道;類似地,LUMO能級越小的元素會導致整個化合物p軌道的價電子更多,化合物也更容易表現出直接帶隙,也更加穩定。此外,作者還觀察到隨著元素平均電負性的增加,材料趨向于更加穩定的直接帶隙材料,如圖3所示。利用這些設計規則,作者修改了一些廣泛用于半導體和催化應用的間接帶隙材料,使之成為直接帶隙材料。為了測試DARWIN衍生的規則是否有更廣泛的應用,作者展示了一些設計的通過陽離子修飾和混合陰離子的化合物,如表1所示。 圖3:DARWIN提供的化學見解。(a)用于設計直接帶隙材料的化學可解釋性;(b)用于設計直接帶隙、穩定的紫外發光材料的化學可解釋性 表1:通過對間接帶隙材料進行改性與設計,得到的直接帶隙材料 (2)設計具有直接帶隙的、穩定的、紫外發光材料 接著,作者使用DARWIN來解決一個更為復雜的多目標材料發現問題,即發現具有直接帶隙的、穩定的、紫外發光材料(帶隙范圍為3-4 eV),化合物的搜索空間擴展至所有的三元鹵素化合物。作者發現,B位點(化合物中的第二個金屬元素)和X位點(陰離子)的電負性的差異對模型具有重要的影響,進一步分析發現當一個材料屬于具有直接帶隙的、穩定的、紫外發光的材料時,這個電負性的差異在0.84-1.5之間。這表明這個特定的范圍是最佳的電負性差異窗口(OEDW)。利用OEDW,作者實驗合成了具有代表性、且滿足目標性質的K2CuCl3和K2CuBr3,如圖4所示。作者還對K2CuCl3進行了第一性原理計算(優化結構采用GGA-xc泛函,電子結構采用HSE06泛函),發現K2CuCl3具有直接帶隙,且PDOS揭示了鹵素元素對價帶頂具有重要的貢獻,而B位點主要占據了導帶底,與DARWIN所揭示的化學見解高度吻合。表2是作者依據化學可解釋性所設計的紫外發光材料。 圖4:K2CuX3的實驗與計算結果 表1:設計的穩定、具有直接帶隙的紫外發光材料 (3)設計具有直接帶隙的、穩定的、紅外發光的鈣鈦礦材料 為了測試DARWIN的通用性,作者進一步設計具有直接帶隙的、穩定的、紅外發光的鈣鈦礦材料(聚焦于串聯太陽能電池,帶隙為1.2 eV)。作者發現,化合物中元素的熔點的和與元素周期表中最大行之商,對搜索結果有負面的影響,如圖5所示。也就是說,為了得到具有1.2 eV的帶隙值,元素盡可能選擇重金屬,這也與之前文獻報道的(MAPbI3和CsPbI3具有小的帶隙)結果一致。從統計意義上來說,元素的熔點和p軌道的價電子數分別與紅外發光的材料呈現負的相關性和正的相關性。這些可解釋性準則也可以用來修飾化合物,表3列出了一些按照DARWIN解釋規則設計的鈣鈦礦化合物。 圖5:用于設計直接帶隙、穩定的紅外發光鈣鈦礦材料的化學可解釋性 表3:設計的穩定、具有直接帶隙的紅外發光鈣鈦礦材料 結論展望 這項工作提出了將機器學習預測代理模型、進化算法和化學可解釋性聯用的材料設計框架DARWIN,并在設計直接帶隙材料、穩定的紫外發光材料和紅外發光鈣鈦礦材料的案例中證明了DARWIN的有效性和通用性。最后,作者展示了DARWIN產生的化學規則如何在統計意義上更加健壯,并適用于更加廣泛的應用(如紫外鹵化物鈣鈦礦的設計等)。 文獻信息 Choubisa, H., Todorovi?, P., Pina, J.M. et al. Interpretable discovery of semiconductors with machine learning. npj Comput Mater 9, 117 (2023). https://doi.org/10.1038/s41524-023-01066-9 原創文章,作者:菜菜歐尼醬,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2024/01/04/8836e44eb8/ 頂刊 贊 (0) 0 生成海報 相關推薦 李陽/沈國震AM: 機器學習助力仿生電子皮膚新突破,實現通用觸覺認知! 2023年10月7日 南開AM: 調控納米多孔NiSb競爭吸附位點來增強氮電還原 2023年10月11日 蘇大鄭洪河/同濟黃云輝Nano Energy:20 C容量高達1501.4 mAh/g的硅負極! 2023年10月18日 ?華科伽龍Angew.:揭示非溶劑化電解液中Li-S電池容量衰減的根源 2023年10月9日 侴術雷/王保峰Small: 通過粘結劑的分子設計增強硅負極電化學性能的關鍵因素 2023年10月23日 ?西安交大丁書江NML:0至60℃全天候實用鋰金屬電池! 2022年11月7日