金屬和連接體的選擇共同決定了金屬-有機骨架(MOF)的結構和客體可及性,但大量可能的金屬-連接體組合使得合成組分的選擇具有挑戰性。在此,利物浦大學Matthew J. Rosseinsky等人利用機器學習(ML)來幫助化學家從最早的材料設計階段確定可用選項的優先級,在這個階段,只有有機配體和合成組合的金屬物種的化學特性是已知的,以便確定最有可能提供高客體可及性MOF結構的金屬-連接體組合。為了實現這一目標,首先,作者從劍橋結構數據庫 (CSD) MOF子集中獲得了一個將3D MOF結構連接到其化學骨架成分(即金屬和連接體)的數據集。然后,評估了各種ML模型以了解組分化學和MOF特性之間的聯系,而無需明確要求對MOF結構有經驗知識。圖1. 創建1M1L3D數據集及ML模型的工作流程作為說明性示例,作者構建了1M1L3D 數據集,由3D連接的僅由單一金屬和單一連接體物種組成的MOF網絡構建而成,并將其用于訓練隨機森林模型。該模型成功預測由給定金屬-連接體組合產生的這種類型MOF的可及性,準確率為80.5%。此外,還生成了兩個額外的ML模型,分別用于預測孔隙是小、中還是大。這些ML方法提供了簡單的指導,根據生成客體可及性MOF的可能性以及潛在孔隙尺寸與吸附、分離和催化應用所需尺寸的匹配,為合成探索的候選金屬-連接體組合的優先排序提供參考,目的是加速發現超出當前結構數據庫的開放框架MOF結構。圖2. ML基于其連接體和金屬成分預測候選MOF可及性的準確性Machine Learning Prediction of Metal-Organic Framework Guest Accessibility from Linker and Metal Chemistry, Angewandte Chemie International Edition 2021. DOI: 10.1002/anie.202114573