李遠播/劉存ES&T: 機器學習模型預測土壤中植物根系有機污染物的積累 2023年10月15日 下午8:08 ? 未全平臺發布, 頂刊 ? 閱讀 13 根系富集因子 (RCF) 是描述生命周期影響評估 (LCIA) 和植物修復潛力評估中土壤中植物有機污染物積累的重要表征參數。然而,由于化學-土壤-植物根系之間復雜的相互作用,建立穩健的預測模型仍然具有挑戰性。 在此,中國農科院植物保護研究所李遠播研究員及中科院南京土壤所劉存副研究員等人開發了端到端的機器學習模型,通過在具有341 數據點、涵蓋72 種化學品的統一RCF數據集上進行訓練,將復雜的分子結構關系轉移到RCF。首先,從文獻中開發了一個數據庫,其中包括RCF值、化學特性和描述符、土壤有機質(fOM)和植物脂質含量(f脂質)。 然后使用這個數據庫開發了三個模型來預測logRCF,包括線性回歸模型,梯度提升回歸樹(GBRT)模型以及基于分子結構的 GBRT-擴展連通性指紋模型(ECFP),并在預測精度方面比較了模型性能。最后,使用特征重要性分析來進一步分析 GBRT-ECFP 模型結果,以確定影響植物根系積累的關鍵子結構。 圖1. RCF數據集的統計分析 最終,作者通過預測RCF值證明了所提出的GBRT-ECFP模型的有效性,并通過5倍交叉驗證評估了預測性能,其中R2值為0.77,平均絕對誤差(MAE)為0.22。 此外,作者還揭示了化學、土壤和植物特性之間的非線性關系。子結構重要性分析揭示了分子子結構與RCF之間的關系,進一步的深入分析確定了與 RCF相關的關鍵化學拓撲子結構(例如,-O、-Cl、芳環和大共軛π系統)。由于其簡單性和通用性,GBRT-ECFP模型為LCIA和其他環境評估提供了一個有價值的工具,以更好地表征化學對人類健康和生態系統的風險。 圖2. 三種ML模型的預測精度對比 Direct Prediction of Bioaccumulation of Organic Contaminants in Plant Roots from Soils with Machine Learning Models Based on Molecular Structures, Environmental Science & Technology 2021. DOI: 10.1021/acs.est.1c02376 原創文章,作者:v-suan,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2023/10/15/1775482347/ 電池 贊 (0) 0 生成海報 相關推薦 JACS:>99%的選擇性!MOF中相鄰Zn-Zr位點助力CO2加氫反應 2023年11月30日 8篇催化頂刊:黃勃龍、莊小東、蘭亞乾、韓曉鵬、杜亞平、汪的華等最新成果 2023年10月17日 Angew.:多功能中間層設計抑制高能金屬鋰電池中的正極交叉 2023年10月7日 休斯頓大學任志鋒AM:d-(Fe, Ni)OOH工業條件下高效催化OER 2023年9月25日 西交李明濤課題組:g-C3N4/石墨烯夾層增強鋰硫電池循環性能 2023年11月24日 黃少銘/張琪ACS Nano: MOF衍生的多級硫主體中構建異質結構以捕獲多硫化物并促進轉化動力學 2023年10月15日