末成年小嫩xb,嫰bbb槡bbbb槡bbbb,免费无人区码卡密,成全高清mv电影免费观看

這篇Angew超神!給出MOF結構就能預測合成條件!

這篇Angew超神!給出MOF結構就能預測合成條件!
共同一作:Yi Luo, Saientan Bag
通訊作者:Pascal Friederich, Manuel Tsotsalas
通訊單位:德國卡爾斯魯厄理工學院

研究背景

金屬-有機框架(MOF)化學通過創造一個巨大的化學空間而蓬勃發展,其中已發現了超過100000個MOF。隨著結構類型、結構單元、接頭和官能團種類的不斷擴大,這一數字還在迅速增加。為了合成新的MOF結構,研究人員必須依靠知識經驗和試錯法,這是一個非常具有挑戰性的過程,非常耗時、勞動密集且需要大量資源。因此,尋找一種找到最佳MOF合成條件的有效方法是當前加快MOF探索的瓶頸。

基于科學文獻開發機器學習(ML)方法來預測所需MOF晶體結構的合成參數是一種具有挑戰性但很有前途的方法,這將推進和加速化學合成。然而,MOF的逆合成設計,即針對目標MOF結構(如計算機設計)的合適合成條件的自動預測仍然是一個未解決的挑戰。

成果簡介

在此,德國卡爾斯魯厄理工學院(KIT)Pascal Friederich, Manuel Tsotsalas(共同通訊)等人展示了如何通過基于其晶體結構直接預測MOF的合成條件,將機器學習(ML)用于合理化和加速MOF發現過程。該方法基于:i)通過從文獻中自動提取合成參數來建立第一個MOF合成數據庫,ii)使用MOF數據庫訓練和優化ML模型,以及 iii)預測新MOF結構的合成條件。ML模型即使在初始階段也表現出良好的預測性能,優于通過綜合調查獲得的人類專家預測。自動預測工具地址見:https://mof-synthesis.aimat.science/,僅需提交MOF晶體結構的cif文件,該工具便會自動預測該結構的合成溫度、時間、溶劑及添加劑(酸、堿或無添加劑)該工作以“MOF Synthesis Prediction Enabled by Automatic Data Mining and Machine Learning”為題發表于國際頂刊Angewandte Chemie International EditionIF=15.336)。

這篇Angew超神!給出MOF結構就能預測合成條件!

圖文詳情

要點1:數據庫構建

作者開發了一個自動流程來提取有關CoRE MOF數據庫中所有公開可用的 MOF結構的MOF合成信息,提取的六個相關參數是金屬源、接頭、溶劑、添加劑、合成時間和溫度。除了從MOF文獻中檢索合成信息外,還使用MOF數據庫中的晶體學信息文件(CIF)自動提取接頭的結構信息和金屬中心的氧化態。最終,作者將出版物中提取的合成細節(即金屬來源、接頭、溫度、合成時間、溶劑和添加劑)、接頭信息和CIF中的金屬來源整合到SynMOF數據庫中。
這篇Angew超神!給出MOF結構就能預測合成條件!
圖1. MOF合成的試錯法與數據驅動方法的流程示意圖
除了MOF合成條件的詳細信息外,SynMOF數據庫目前由983個MOF結構組成,提供金屬源和有機組分的統計數據。它包含46種不同金屬,最常見的氧化態范圍為+1~+3。大多數MOF結構由過渡金屬組成,其中銅和鋅占近50%。在多種有機分子中,最常用的MOF合成接頭是多齒羧酸(即苯-1,3,5-三羧酸、苯-1,4-二羧酸和苯-1,2,4,5-四羧酸),然后是含氮堿(即吡啶、三唑和四唑)。
作者分析了MOF合成過程中最常用的溶劑在不同溫度和添加劑方面的情況。在80~160 °C的溫度范圍內,N,N-二甲基甲酰胺(DMF)、水及二者與其他溶劑的混合物是最常用的溶劑。在高于160 °C的溫度下,合成主要在水中進行。此外,大多數高溫(120°C以上)MOF合成反應是在沒有添加劑的情況下進行的,而在低于80°C的溫度下,酸性添加劑占主導地位。
這篇Angew超神!給出MOF結構就能預測合成條件!
圖2. SynMOF數據庫的構建
要點2:機器學習模型的訓練
基于SynMOF數據庫中的數據,作者訓練了多個ML模型來預測訓練期間未見的各種MOF的合成條件。作者使用兩種類型的表示作為ML模型訓練的輸入:一種基于接頭的分子指紋,擴展了金屬類型及其氧化態的編碼;另一種是由由 Kulik等人開發的MOF表示。隨著時間的推移,越來越多的新結構和相應的合成參數將可用于訓練和改進ML模型。因此,圖神經網絡等表示學習方法可能會比依賴手工特征表示的模型更準確。
這篇Angew超神!給出MOF結構就能預測合成條件!
圖3. 訓練的機器學習模型及訓練結果
訓練結果表明,ML模型可識別目標MOF結構與所需合成條件(特別是溫度和時間)之間的可預測關系。鑒于目前從文獻中提取的數據量,隨機森林模型在所有預測參數中具有最高性能。然而,神經網絡將會隨著數據集大小的增長做出更好的預測,甚至可利用不同合成參數(如溶劑和溫度)之間的相關性。因此,將來更復雜的模型將優于隨機森林。
基于ML的溶劑預測評估表明,ML模型優于隨機選擇,可達>90?%的準確度。在添加劑預測的情況下,ML模型的任務是將所需添加劑分類為酸性、堿性和無添加劑。雖然在訓練集上表現良好,但對看不見的測試數據的泛化受到數據集不平衡的影響(大多數合成信息不使用添加劑)。使用訓練數據點的平衡校正權重,導致預測可以很好地區分涉及堿性和酸性添加劑的合成過程。然而,酸性/堿性和無添加劑之間的區別不太明顯。
要點3:ML模型性能評估
為了評估ML性能,作者對11位人類MOF專家展開了測試。基于從 SynMOF數據庫中隨機選擇的50個MOF開發了一個在線測驗,參與者獲得了MOF的3D結構、接頭的化學結構和金屬離子的信息,并要求專家在沒有任何文獻或其他外部資源幫助的情況下估計合成條件。結果顯示,專家的溫度和時間預測與報道的合成條件之間的相關系數R2接近于零。這表明ML模型能夠學習SynMOF 數據庫中的廣義方式和相關性,超出了專家的一般直覺,因此可用于識別新MOF的實驗合成條件。

結論展望

總之,研究人員通過自然語言處理(NLP)方法基于自動數據提取建立了一個 SynMOF數據庫,可為900多個MOF提供合成條件和結構信息,并根據這些數據訓練ML模型以識別MOF合成方式。預計創建的SynMOF數據庫將推動MOF社區內的NLP研究,而ML合成預測平臺將成為數據驅動的MOF發現的新黃金標準。即使在初始階段,ML模型也優于MOF專家的綜合預測,這是綜合過程背后的復雜性和開發數字預測工具迫切需求的基礎。這種自動化按需合成預測將大大加速新MOF的發現,并作為MOF社區及其他領域的寶貴工具。

數據庫、用于ML訓練和預測的合成參數提取代碼及專家調查可在以下網站獲取:
https://github.com/Tsotsalas-Group/MOF_Literature_Extraction
https://github.com/aimat-lab/MOF_Synthesis_Prediction

文獻信息

MOF Synthesis Prediction Enabled by Automatic Data Mining and Machine Learning, Angewandte Chemie International Edition 2022. DOI: 10.1002/anie.202200242

https://onlinelibrary.wiley.com/doi/10.1002/anie.202200242

原創文章,作者:v-suan,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2023/10/15/93fcb29523/

(0)

相關推薦

主站蜘蛛池模板: 肇庆市| 阳朔县| 自贡市| 阜南县| 北宁市| 莱芜市| 娱乐| 葫芦岛市| 城口县| 阿合奇县| 大新县| 甘肃省| 同江市| 贵溪市| 富蕴县| 高邑县| 鄂伦春自治旗| 乐山市| 黄陵县| 巩留县| 涞源县| 昔阳县| 崇礼县| 临洮县| 曲麻莱县| 育儿| 平凉市| 泽库县| 岑巩县| 遂宁市| 祁阳县| 沁阳市| 宁国市| 抚顺县| 麻栗坡县| 宜宾市| 卢氏县| 阜城县| 西安市| 江永县| 基隆市|