由于其高孔隙率和可定制的功能,金屬有機框架(MOF)被認為是適用于廣泛應用的材料候選者,包括氣體分離和儲存、催化和能量轉換。其中,金屬節點和有機連接體的大量組合導致了無限的材料空間,這為設計高性能MOF提供了高度的靈活性和潛力,同時也帶來了一定的挑戰。在此,德國馬普學會復雜技術系統動力學研究所周騰博士等人報道了一種可解釋的機器學習(ML)方法,用于加速發現用于選擇性分離乙烷(C2H6)和乙烯(C2H4)的有前景MOF材料。首先,作者基于分子模擬數據訓練和測試ML模型,同時以不同類型的材料描述符和指紋作為輸入,將MOF分類為C2H4選擇性和 C2H6選擇性類別。基于對獲得模型的SHAP解釋可推斷出一系列特征規范,從而指定MOF結構中的首選特征。根據這些規范,可從大型MOF數據庫中有效地將一小部分MOF識別為潛在的C2H6選擇性吸附劑。最后,對這些潛在候選者進行了GCMC模擬,其中93.8% 的已識別候選物被證實具有C2H6選擇性,最佳MOF(hMOF-5067000)顯示出6.46的高C2H6/C2H4選擇性。圖1. 基于PubChem的RF模型的全局和局部解釋盡管作者基于該模型方法確定了高性能MOF,但也存在一些限制。首先,PubChem指紋僅使用二進制變量來指示存在或不存在,而不是子結構的出現頻率。這使得結果易于理解和解釋,但缺少有關子結構數量的重要信息。如果以包括每個子結構的出現頻率更新指紋,則可以顯著提高ML模型的性能。此外,作者基于開發的ML模型將MOF分為兩類,即C2H4選擇性和C2H6選擇性MOF。如果可以使用基于回歸的ML方法對選擇性值進行定量預測,則可為先進MOF發現獲得更有用和可靠的見解。總之,這項工作表明通過可解釋ML模型獲得的有見地的特征規范對于高效發現用于氣體分離的高性能MOF非常有幫助。圖2. MOF候選物的GCMC衍生選擇性Interpretable machine learning for accelerating the discovery of metal-organic frameworks for ethane/ethylene separation, Chemical Engineering Journal 2022. DOI: 10.1016/j.cej.2022.136651