在藥物和材料設計領域,優化候選分子的理化和功能特性是一個至關重要的任務,因其直接關系到藥物的有效性和安全性。然而,在多目標優化過程中,平衡多個可能相互沖突的目標一直是一個巨大的挑戰,尤其是缺乏多屬性標注的訓練數據使得傳統人工智能方法的應用受到限制。
為了解決這一問題,浙江大學吳振興,謝昌諭、侯廷軍以及中南大學曹東升團隊聯合在Nature Machine Intelligence期刊上發表了題為“Leveraging language model for advanced multiproperty molecular optimization via prompt engineering”的最新論文。論文指出,Prompt-MolOpt是一種利用大語言模型中的嵌入技術來優化分子的工具。作者通過引入基于提示的嵌入,Prompt-MolOpt不僅能夠在有限的多屬性數據下進行有效的分子優化,而且在零樣本情況下也表現出良好的泛化能力。
在與現有模型(如JTNN、hierG2G和Modof)的比較中,Prompt-MolOpt在多屬性優化的成功率上超越了傳統方法,特別是在保持藥效團或用戶指定的片段方面顯示出更強的靈活性。此外,Prompt-MolOpt通過構建針對特定領域的優化數據集,成功地引導分子優化向相關化學空間推進,提升了優化分子的質量。這些研究結果不僅為化學研究提供了新的工具,也為藥物和材料的發現開辟了新的路徑,展示了在復雜優化任務中應用AI的巨大潛力。
(1)本文首次提出了Prompt-MolOpt工具,利用基于提示的嵌入技術,顯著提升了分子在特定屬性調整方面的優化能力。通過借鑒大語言模型的框架,Prompt-MolOpt能夠有效處理有限的多屬性數據,即使在零樣本情況下也能成功泛化從單屬性數據集中學到的因果關系。
(2)實驗通過與現有模型(如JTNN、hierG2G和Modof)的比較評估,Prompt-MolOpt在多屬性優化成功率上實現了超過15%的相對提升,顯示出其在分子優化領域的優越性。此外,Prompt-MolOptP變體能夠在結構轉化過程中保留藥效團或用戶指定的片段,這一特性擴展了該工具的應用范圍。
(3)本文通過構建針對特定領域的優化數據集,Prompt-MolOpt成功引導分子優化向相關的化學空間發展,提高了優化分子的質量。實際案例(如血腦屏障通透性優化)進一步驗證了該工具的實際應用價值。綜上所述,Prompt-MolOpt為多屬性和多靶位分子優化提供了靈活的方法,展現了其在化學研究及藥物和材料發現中的廣泛潛力。
圖1: Prompt-MolOptP的多屬性和多位點BBBP優化實例研究。
圖4: Prompt-MolOptP分子優化框架概述。
本研究通過引入Prompt-MolOpt,展示了將變換器架構與提示學習相結合的創新思路,為多屬性分子優化提供了新的可能性。該方法不僅允許研究者在優化過程中靈活指定需要保留的分子結構,還通過與領域專家的互動,增強了人工智能在藥物設計中的實用性。這種協作模式突顯了跨學科合作的重要性,表明AI技術的成功應用依賴于專業知識的支持。
此外,Prompt-MolOpt在零樣本學習中的表現,顯示出該方法在數據稀缺條件下的潛力,突破了以往模型對大量標記數據的依賴。這一發現為未來的分子優化研究開辟了新方向,尤其是在真實世界應用中,如改善藥物的生物利用度和安全性。同時,研究中提出的構建領域相關數據集的方法,為定制化的分子優化提供了切實可行的路徑,強調了針對特定應用的優化策略。
然而,研究也指出了當前方法在整合靶點信息和處理手性等方面的不足,未來的研究應繼續探索這些挑戰,進一步提升分子優化的有效性和適用性。這些啟示不僅推動了化學和藥物開發領域的發展,也為其他科學研究領域的技術應用提供了借鑒。
Wu, Z., Zhang, O., Wang, X. et al. Leveraging language model for advanced multiproperty molecular optimization via prompt engineering. Nat Mach Intell (2024).
原創文章,作者:zhan1,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2024/10/31/c5f3373c11/