背景介紹
抗生素耐藥性在全球范圍內呈上升趨勢,以及微生物不可避免地會對新的化學結構產生抗藥性,因此需要不斷發現多種新的抗生素類別,而新抗生素開發周期通常需要10-15年。其中,共軛低聚電解質(COE)分子是一類新型抗生素候選物,但其復雜的結構、類似物的缺失和革蘭氏類型的特異性等進一步加劇了挑戰。機器學習(ML)可以提供一種簡化開發的替代方法,從而確定分子結構中與抗生素活性最密切相關的基本元素。
然而,可能會為每個COE分子生成數以千計的描述符,因此需要開發一個有原則的向下選擇過程,以便開發一個操作模型。分子特性的ML建模是通過應用ML的最新發展實現的,特別是關于深度學習和分子表示,而ML模型和分子表示方法可以緊密聯系在一起。ML輔助抗生素特性預測中的許多方法都依賴于大型數據集,并專注于尋找與現有抗生素相似(即具有相同分布)的新候選抗生素。

成果簡介
近日,美國麻省理工學院Tonio Buonassisi和Armi Tiihonen、新加坡國立大學Sarah J. Cox-Vazquez和Guillermo C. Bazan(共同通訊作者)等人報道了一種預測共軛低聚電解質(COEs)分子抗菌活性的模型,其中COEs是一類新的抗生素,但缺乏廣泛的結構-活性關系研究。該模型可作為指導新預測COEs合成的咨詢工具,其由四部分組成:(1)分子指紋表示;(2)特征向下選擇;(3)ML模型配對;(4)描述符重要性分析。作者將該模型應用于一組136個COEs中,使用一個對分子域不可知的自動分子描述符向下選擇過程。由此產生的指紋由21個分子描述符組成,其中40%以上與分子的三維(3D)形狀有關。這與不依賴于形狀的分子性質相關的描述符或與分子形狀的低維簡化相關的描述符形成對比,例如沒有長度信息的分子鍵,與COEs的假定作用機制一致,即插入細菌膜。

圖文速遞



總結展望
綜上所述,通過該預測模型,作者證明了ML確實可以幫助抗生素的開發,即使是關于潛在機制的信息很少,并且實驗數據的可用性有限的候選者家族也有效。作者還證明在傳統和復雜的ML模型中,分子代表性都會提高預測的準確性:它需要捕捉抗生素活性潛在機制的關鍵信息,以實現高預測準確性。
作者認為如果指紋針對研究中的分子域進行了優化,那么指紋識別仍然是一種有效的選擇或學習表示的補充成分。最后,作者提出了一個域不可知框架來快速選擇和分析分子指紋,以描述新型抗生素。在該工作中作者只研究了一類分子 COEs,但 3D 描述符在指紋向下選擇中占主導地位表明能夠捕獲 3D 的表示和模型在其他抗生素候選域中也可能值得探索,尤其是當分子很大時 和作用機制與這里懷疑的分子形狀有關。
文獻信息
Predicting Antimicrobial Activity of Conjugated Oligoelectrolyte Molecules via Machine Learning.J. Am. Chem. Soc., 2021, DOI: 10.1021/jacs.1c05055.
原創文章,作者:科研小搬磚,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2023/10/13/c0c410c5b4/