該論文還針對基于定制化文本的分子生成任務做了進一步的探索。如圖10所示,例1中的輸入強調了結構中的五個苯環和疏水基團。然而MolT5的結果產生了不正確的苯環數量,并且生成的結構含有一些親水基團。相比之下,MolReGPT則給出了與輸入相對應的正確結構。在例2中,MolT5和MolReGPT都生成了正確的苯環數量,而MolReGPT生成了更多的親水基團,更符合我們給定的輸入。05 結論這篇文章提出了MolReGPT,一種通用的基于檢索的上下文小樣本分子學習的提示范式,賦予大語言模型(如ChatGPT)分子發現的能力。MolReGPT利用分子相似性原理從本地數據庫中檢索分子-分子文本描述對作為上下文學習中的示例,指導大語言模型生成分子的SMILES字符串,從而無需對大語言模型進行微調。這篇工作的方法專注于分子-文本描述間相互翻譯任務,包括分子文本描述生成(Mol2Cap)和基于文本的分子生成(Cap2Mol),并在該任務上對大語言模型的能力進行了評估。實驗結果表明,MolReGPT可以使ChatGPT在分子描述生成和分子生成方面分別達到0.560和0.571的Text2Mol分數。從分子理解和基于文本的分子生成角度來看,其性能都超過了MolT5-base這樣的微調模型,甚至可以與微調的MolT5-large相媲美。總而言之,MolReGPT提供了一個新穎的、多功能集成的范式,通過上下文學習在分子發現中部署大型語言模型,這大大降低了領域轉移的成本,探索了大型語言模型在分子發現中的潛力。參考文獻[1] Edwards, C., Zhai, C., and Ji, H. Text2mol: Cross-modal molecule retrieval with natural language queries. In Pro- ceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pp. 595–607, 2021.[2] Edwards, C., Lai, T., Ros, K., Honke, G., Cho, K., and Ji, H. Translation between molecules and natural language. In Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing, pp. 375–413, Abu Dhabi, United Arab Emirates, December 2022. As- sociation for Computational Linguistics.[3] Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, ?., and Polosukhin, I. At- tention is all you need. Advances in neural information processing systems, 30, 2017.[4] Raffel, C., Shazeer, N., Roberts, A., Lee, K., Narang, S., Matena, M., Zhou, Y., Li, W., and Liu, P. J. Exploring the limits of transfer learning with a unified text-to-text transformer. The Journal of Machine Learning Research, 21(1):5485–5551, 2020.[5] Li, J., Liu, Y., Fan, W., Wei, X. Y., Liu, H., Tang, J., & Li, Q. (2023). Empowering Molecule Discovery for Molecule-Caption Translation with Large Language Models: A ChatGPT Perspective. arXiv preprint arXiv:2306.06615.博士招生廣告香港理工大學PolyU電子計算學系 機器學習/人工智能 (生物醫藥方向,AI4Science, Drug Discovery) 全獎PhD/博士后/研究助理讓我們一起探索人工智能和生物醫藥的交叉領域,為未來的醫藥發展作出貢獻!導師主頁:李青教授個人主頁:https://www4.comp.polyu.edu.hk/~csqli/導師主頁:范文琦博士(研究助理教授)個人主頁:https://wenqifan03.github.io計劃招收多名全獎博士生,全年春/夏/秋入學均可(全年招聘)招生詳情請見:https://wenqifan03.github.io/openings.html此外,研究團隊長期招聘博士后和研究助理,及聯合培養博士項目,歡迎聯系。郵件建議:感興趣的同學按照下面的郵件格式把簡歷發到郵箱:wenqi.fan@polyu.edu.hk (范文琦博士),并同時抄送qing-prof.li@polyu.edu.hk (李青教授)郵件主題:PhD/Postdoc/RA-Open Position-YourName正文:個人經歷簡介,包括畢業院校、GPA/Ranking、TOEFL/IELTS英文成績、publications/research experience、獎項、etc.