末成年小嫩xb,嫰bbb槡bbbb槡bbbb,免费无人区码卡密,成全高清mv电影免费观看

重磅Nature!GPT-4來搶“飯碗”了!

基于Transformer的大型語言模型正在各個(gè)領(lǐng)域取得重大進(jìn)展,如自然語言處理、生物、化學(xué)和計(jì)算機(jī)編程等。
在此,來自美國(guó)卡耐基梅隆大學(xué)Gabe Gomes研究者展示了Coscientist的發(fā)展和能力,這是一個(gè)由GPT-4驅(qū)動(dòng)的人工智能系統(tǒng),通過結(jié)合互聯(lián)網(wǎng)和文檔搜索代碼執(zhí)行和實(shí)驗(yàn)自動(dòng)化等工具授權(quán)的大型語言模型自主地設(shè)計(jì)、計(jì)劃和執(zhí)行復(fù)雜的實(shí)驗(yàn)。相關(guān)論文以題為“Autonomous chemical research with large language models”于2023年12月20日發(fā)表在Nature上。
重磅Nature!GPT-4來搶“飯碗”了!
大型語言模型(LLMs),特別是基于Transformer的模型,近年來正經(jīng)歷快速發(fā)展。這些模型已成功應(yīng)用于各種領(lǐng)域,包括自然語言、生物和化學(xué)研究以及代碼生成。如OpenAI所示,模型的極端擴(kuò)展已經(jīng)導(dǎo)致了該領(lǐng)域的重大突破。此外,從人工反饋中強(qiáng)化學(xué)習(xí)等技術(shù)可以大大提高生成文本的質(zhì)量,以及模型在推理其決策的同時(shí)執(zhí)行不同任務(wù)的能力。
2023年3月14日,OpenAI發(fā)布了迄今為止最強(qiáng)大的LLM, GPT-414。盡管關(guān)于模型訓(xùn)練、大小和使用的數(shù)據(jù)的具體細(xì)節(jié)在GPT-4的技術(shù)報(bào)告中有所限制,但OpenAI研究人員已經(jīng)提供了大量證據(jù),證明該模型具有非凡的解決問題的能力。這些包括但不限于SAT和BAR考試的高分?jǐn)?shù),LeetCode挑戰(zhàn)和圖片的上下文解釋,包括小眾笑話。此外,技術(shù)報(bào)告提供了一個(gè)如何使用該模型解決化學(xué)相關(guān)問題的例子。
同時(shí),化學(xué)研究的自動(dòng)化也取得了重大進(jìn)展。例子從有機(jī)反應(yīng)的自主發(fā)現(xiàn)和優(yōu)化到自動(dòng)化流程系統(tǒng)和移動(dòng)平臺(tái)的開發(fā)。
實(shí)驗(yàn)室自動(dòng)化技術(shù)與強(qiáng)大的LLMs的結(jié)合,為自主設(shè)計(jì)和執(zhí)行科學(xué)實(shí)驗(yàn)的受歡迎系統(tǒng)的開發(fā)打開了大門。為了實(shí)現(xiàn)這一點(diǎn),研究者打算解決以下問題。LLMs在科學(xué)過程中的能力是什么?研究者能獲得多大程度的自主?研究者如何理解自主智能體所做的決策?
在此,研究者提出一個(gè)基于multi-LLMs的智能代理(以下簡(jiǎn)稱Coscientist),能夠自主設(shè)計(jì)規(guī)劃執(zhí)行復(fù)雜的科學(xué)實(shí)驗(yàn)。Coscientist可以使用工具瀏覽互聯(lián)網(wǎng)和相關(guān)文檔,使用機(jī)器人實(shí)驗(yàn)應(yīng)用程序編程接口(APIs)并利用其他LLMs完成各種任務(wù)。這項(xiàng)工作是獨(dú)立完成的,并與自主代理的其他工作并行進(jìn)行,ChemCrow是化學(xué)領(lǐng)域的另一個(gè)例子。本文在六個(gè)任務(wù)中展示了聯(lián)合科學(xué)家的通用性和性能:(1)使用公開可用的數(shù)據(jù)規(guī)劃已知化合物的化學(xué)合成;(2)在大量硬件文檔中高效搜索和導(dǎo)航;(3)在云實(shí)驗(yàn)室中使用文檔執(zhí)行高級(jí)命令;(4)低指令精確控制液體處理儀器;(5)解決需要同時(shí)使用多個(gè)硬件模塊和集成不同數(shù)據(jù)源的復(fù)雜科學(xué)任務(wù);(6)解決需要分析先前收集的實(shí)驗(yàn)數(shù)據(jù)的優(yōu)化問題。
重磅Nature!GPT-4來搶“飯碗”了!
圖1. 系統(tǒng)的架構(gòu)
Coscientist通過與多個(gè)模塊交互(web和文檔搜索,代碼執(zhí)行)和執(zhí)行實(shí)驗(yàn)來獲得解決復(fù)雜問題所需的知識(shí)。主模塊(‘ Planner ‘)具有規(guī)劃的目標(biāo),通過調(diào)用以下定義的命令來基于用戶輸入進(jìn)行規(guī)劃。規(guī)劃器是一個(gè)GPT-4聊天完成實(shí)例,充當(dāng)助手的角色。初始用戶輸入和命令輸出被視為發(fā)送給規(guī)劃器的用戶消息。規(guī)劃器的系統(tǒng)提示(定義LLMs目標(biāo)的靜態(tài)輸入)以模塊化方式設(shè)計(jì),描述為定義動(dòng)作空間的四個(gè)命令:`谷歌`,` PYTHON `, ` DOCUMENTATION `和` EXPERIMENT `。
計(jì)劃者根據(jù)需要調(diào)用這些命令來收集知識(shí)。谷歌命令負(fù)責(zé)使用` Web searcher `模塊搜索互聯(lián)網(wǎng),這是另一個(gè)LLM本身。PYTHON命令允許規(guī)劃器使用“代碼執(zhí)行”模塊執(zhí)行計(jì)算,為實(shí)驗(yàn)做準(zhǔn)備。EXPERIMENT命令通過DOCUMENTATION模塊描述的API實(shí)現(xiàn)“自動(dòng)化”。與谷歌一樣,DOCUMENTATION命令從源向主模塊提供信息,在本例中是關(guān)于所需API的文檔。本文展示了與Opentrons Python API和Emerald Cloud Lab (ECL)符號(hào)實(shí)驗(yàn)室語言(SLL)的兼容性。這些模塊共同組成了Coscientist,它從用戶那里接收一個(gè)簡(jiǎn)單的純文本輸入提示(例如,“執(zhí)行多個(gè)Suzuki反應(yīng)”)。這種架構(gòu)如圖1所示。
重磅Nature!GPT-4來搶“飯碗”了!
圖2. 協(xié)同科學(xué)家在化學(xué)合成計(jì)劃任務(wù)中的能力
為了演示W(wǎng)eb搜索模塊的功能之一,研究者設(shè)計(jì)了一個(gè)由7種化合物組成的測(cè)試集來合成,如圖2a所示。Web搜索器模塊的版本分別表示為` search-gpt-4 `和` search-gpt-3.5-turbo `。研究者的基線包括OpenAI的GPT-3.5和GPT-4, Anthropic的Claude 1.3和Falcon-40B-Instruct,根據(jù)OpenLLM排行榜,這些模型在實(shí)驗(yàn)時(shí)被認(rèn)為是最好的開源模型之一。
研究者提示每個(gè)模型提供詳細(xì)的化合物合成,并將輸出按以下比例進(jìn)行排序(圖2):
  • 5非常詳細(xì)和化學(xué)精確的程序描述

  • 4用于詳細(xì)和化學(xué)準(zhǔn)確的描述,但沒有試劑的數(shù)量

  • 3一個(gè)正確的化學(xué)描述,不包括一步一步的過程

  • 2極其模糊或不可行的描述

  • 1不正確的回答或不遵守指示

由GPT-4驅(qū)動(dòng)的Web搜索器在綜合規(guī)劃方面有顯著改進(jìn)。在對(duì)乙酰氨基酚、阿司匹林、硝基苯胺和酚酞的所有試驗(yàn)中,它達(dá)到了最高得分(圖2b)。盡管它是唯一一個(gè)對(duì)布洛芬達(dá)到最低可接受分?jǐn)?shù)3的模型,但它對(duì)乙酸乙酯和苯甲酸的表現(xiàn)低于其他一些模型,可能是因?yàn)檫@些化合物的廣泛性質(zhì)。這些結(jié)果表明,讓LLMs擱淺以避免“幻覺”的重要性。總的來說,支持GPT-3.5的Web搜索器的性能落后于它的GPT-4競(jìng)爭(zhēng)對(duì)手,主要是因?yàn)樗鼪]有遵循關(guān)于輸出格式的具體說明。
重磅Nature!GPT-4來搶“飯碗”了!
圖3. 文檔搜索概述
重磅Nature!GPT-4來搶“飯碗”了!
圖4. 機(jī)器人液體處理控制能力和與分析工具的集成
獲取文檔使人們能夠?yàn)槁?lián)合科學(xué)家在物理世界中進(jìn)行實(shí)驗(yàn)提供足夠的信息。為了展開調(diào)查,研究者選擇了Opentrons OT-2,這是一個(gè)開源的液體處理程序,具有文檔齊全的Python API。文檔中的“入門”頁面在系統(tǒng)提示中提供給規(guī)劃師。其他頁面使用上述方法向量化。
重磅Nature!GPT-4來搶“飯碗”了!
圖5. 交叉耦合鈴木和Sonogashira反應(yīng)實(shí)驗(yàn)由Coscientist設(shè)計(jì)和執(zhí)行
通過使用來自互聯(lián)網(wǎng)的數(shù)據(jù),執(zhí)行必要的計(jì)算,并最終為液體處理程序編寫代碼,評(píng)估了Coscientist計(jì)劃催化交叉耦合實(shí)驗(yàn)的能力。為了增加復(fù)雜性,研究者要求Coscientist使用在GPT-4訓(xùn)練數(shù)據(jù)收集截止后發(fā)布的OT-2加熱-搖動(dòng)模塊。提供給聯(lián)合科學(xué)家的可用命令和動(dòng)作如圖5a所示。盡管研究者的設(shè)置還不是完全自動(dòng)化的(板塊是手動(dòng)移動(dòng)的),但不涉及人工決策。
聯(lián)合科學(xué)家復(fù)雜化學(xué)實(shí)驗(yàn)?zāi)芰Φ臏y(cè)試挑戰(zhàn)設(shè)計(jì)如下:(1) Coscientist提供一個(gè)配備有兩個(gè)微孔板(源板和目標(biāo)板)的液體處理器。(2)源板包含多種試劑的原液,包括苯乙炔和苯硼酸,多種芳基鹵化物偶聯(lián)劑,兩種催化劑,兩種堿和溶解樣品的溶劑(圖5b)。(3)靶板安裝在OT-2加熱-搖床模塊上(圖5c)。(4)聯(lián)合科學(xué)家的目標(biāo)是在現(xiàn)有資源的情況下,成功設(shè)計(jì)并執(zhí)行Suzuki-Miyaura和Sonogashira耦合反應(yīng)協(xié)議。
重磅Nature!GPT-4來搶“飯碗”了!
圖6.?化學(xué)推理能力
本研究通過Coscientist系統(tǒng)展示了在化學(xué)實(shí)驗(yàn)設(shè)計(jì)中的高級(jí)推理能力。研究重點(diǎn)放在使用Coscientist優(yōu)化Pd催化反應(yīng)的多變量設(shè)計(jì)。
圖6a介紹了Suzuki反應(yīng)數(shù)據(jù)集的應(yīng)用,涉及不同配體、試劑和溶劑。圖6e則展示了Buchwald–Hartwig反應(yīng)數(shù)據(jù)集,記錄了配體、添加劑和堿的變化。Coscientist的測(cè)試被設(shè)計(jì)為一款游戲,目標(biāo)是最大化反應(yīng)產(chǎn)率。玩家需以JSON格式提供特定反應(yīng)條件和化學(xué)解釋。
圖6b使用歸一化優(yōu)勢(shì)度量來評(píng)估Coscientist的性能,顯示了其在每次迭代中的推理能力提高。圖6c對(duì)比了提供先驗(yàn)信息與否的GPT-4和GPT-3.5的性能。結(jié)果表明,提供先驗(yàn)信息的GPT-4在初始猜測(cè)上更優(yōu),但最終性能相同。
圖6d的導(dǎo)數(shù)圖表顯示輸入先驗(yàn)信息與否之間沒有顯著差異。與標(biāo)準(zhǔn)的貝葉斯優(yōu)化相比,基于GPT-4的方法展示出更高的NMA和歸一化優(yōu)勢(shì)值。圖6e比較了沒有先驗(yàn)信息的GPT-4在處理化合物名稱或SMILES字符串時(shí)的性能,兩種情況下性能相似。
總結(jié)來說,Coscientist在化學(xué)實(shí)驗(yàn)設(shè)計(jì)和優(yōu)化中展現(xiàn)了出色的推理能力和數(shù)據(jù)處理方法,其性能在多個(gè)測(cè)試中得到了證實(shí)。
綜上,研究者提出了一個(gè)能夠(半)自主設(shè)計(jì)規(guī)劃多步執(zhí)行科學(xué)實(shí)驗(yàn)的人工智能代理系統(tǒng)概念證明。該系統(tǒng)展示了先進(jìn)的推理和實(shí)驗(yàn)設(shè)計(jì)能力,解決了復(fù)雜的科學(xué)問題并生成了高質(zhì)量的代碼。當(dāng)LLMs獲得相關(guān)研究工具,如互聯(lián)網(wǎng)和文檔搜索、編碼環(huán)境和機(jī)器人實(shí)驗(yàn)平臺(tái)時(shí),這些能力就會(huì)出現(xiàn)。為L(zhǎng)LMs開發(fā)更集成的科學(xué)工具有可能大大加速新發(fā)現(xiàn)。
未來,正在加速到來,留給“化學(xué)人”的時(shí)間不多了!
參考文獻(xiàn)
Boiko, D.A., MacKnight, R., Kline, B.?et al.?Autonomous chemical research with large language models.?Nature?624, 570–578 (2023). https://doi.org/10.1038/s41586-023-06792-0
原文鏈接:
https://www.nature.com/articles/s41586-023-06792-0

原創(chuàng)文章,作者:wdl,如若轉(zhuǎn)載,請(qǐng)注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2023/12/22/5c40600bef/

(0)

相關(guān)推薦

主站蜘蛛池模板: 建湖县| 班玛县| 封开县| 昌平区| 云霄县| 施甸县| 荥经县| 宜兰县| 齐齐哈尔市| 吕梁市| 嘉祥县| 昆山市| 恭城| 顺昌县| 济阳县| 双柏县| 江门市| 清涧县| 财经| 应城市| 十堰市| 晴隆县| 平南县| 四平市| 彰武县| 海南省| 邵阳县| 阿拉善左旗| 漳平市| 闽清县| 东平县| 通河县| 准格尔旗| 社旗县| 徐闻县| 平昌县| 绵阳市| 云龙县| 娱乐| 清镇市| 东至县|