近年來,人工智能機器學習在材料科學研究中得到了廣泛的應用。通過構建的材料數據庫等大數據系統進行機器學習模型訓練,許多還沒有實驗和理論數據的化合物性質可以被預測出來,這將大大加速新材料發現及相關研究。
?
機器學習在材料科學中的應用之一是建立結構與性能之間的關系,它試圖在材料指紋(包括組成元素的特征、原子結構信息以及這些特征的任何組合)和我們感興趣的目標屬性之間建立預測關系。過去的工作中,機器學習方案的預測能力在材料的帶隙、彈性模量、相穩定性、離子電導率、導熱系數、熔融溫度、玻璃化轉變起始溫度等性質有著很好的表現。
?
北京大學深圳研究生院新材料學院潘鋒團隊近年承擔了國家材料基因組工程研發固態電池及關鍵材料的項目,構建有60多萬獨立晶體結構的大數據系統(www.pkusam.com)并且嘗試應用人工智能機器學習的方法來加速新型材料的發現。
?
在以往的研究中,機器學習方案的成功是基于數據庫中數據的共同趨勢,通過這樣的共同趨勢訓練,開發的模型可以應用于預測大多數化合物的結構與性能的關系。這對通常的化合物是有效的、準確的,因為在材料數據庫的大多數情況下,通常化合物具有規則的結構單元。然而,例外總是存在的(即使有95%的預測精度,總還有5%的例外)。
?
潘鋒團隊通過對大量數據不斷改良機器學習不僅能夠實現高精度預測材料的結構和性能相關性(相當于發現材料的“遺傳”性質),同時首次原創性著眼于這些不在預測范圍的“例外”,并且通過分析這些“例外”(相當于發現材料的“變異或突變”性質),即分析遠離總體趨勢的異常結果,從中獲得新的洞見,發現了新型的結構基元(具有正3價的銀離子基團),這對基礎物理化學有了一些新的認識,并在科學上開辟了新的領域。
?
該成果“Discovering unusual structures from exception using big data and machine learning techniques”以論文形式,應邀在著名學術期刊Science Bulletin,(64 (2019) 612–616)上以封面文章發表。
?
在該工作中,團隊通過自主建立了一個包括HSE計算數據的材料結構數據庫,并基于此通過機器學習的方法對材料結構的帶隙進行學習,并展示了機器學習是如何被用來作為一種工具來挑選這些不尋常的案例,以及如何用傳統的分析方法來研究這些不尋常的案例,從而拓寬已有的科學知識。
?
在該工作中,團隊只使用了相對較小的數據集進行訓練,并且ML模型的總體性能與已有的工作相當,模型R2約為0.89。通過觀察帶隙預測模型的結果,團隊從數據庫約4000種化合物中確定了34種不同尋常的“例外”化合物,在具體的分析之后,其中許多化合物具有不尋常的結構或其它異常,如特殊的配位環境或氧化態,帶隙相對于同族其它化合物的突然增加,或是同族不同化合物之間的不同相結構。
?
機器學習預測帶隙的結果
?
在這些具有較大預測誤差的化合物中,團隊發現了具有Ag3+和O22-特殊結構的AgO2F。隨后,通過與KAgO2(“正常”結構)的電子結構對比,他們發現AgO2F中不尋常的氧化態(O22-)使得O與Ag之間軌道雜化很小,帶隙附近的能級主要由O原子的2p軌道貢獻,帶隙遠小于其它含有Ag3+的化合物。這一實例證明了可以通過檢查機器學習模型中的異常,從大型數據庫中快速發現異常結構。
?
AgO2F(“異常”結構)與KAgO2(“正常”結構)的電子結構比較。AgO2F由于具有不尋常的氧化態(O22-)從而具有異常的表現
該工作由新材料學院潘鋒教授和伯克利汪林望教授指導,16級研究生揭鑒澍與團隊合作完成。本工作得到國家材料基因工程重點研發計劃和廣東省重點實驗室的資金支持。
?
Jie J, Hu Z, Qian G, et al. Discovering unusual structures from exception using big data and machine learning techniques[J]. Science Bulletin, 2019.
原創文章,作者:菜菜歐尼醬,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2023/11/17/ff47461607/