精品香蕉99久久久久网站,欧美变态口味重另类av电影,高校长白沽txt无弹窗笔趣阁

基于Transformer的大型語言模型正在各個(gè)領(lǐng)域取得重大進(jìn)展，如自然語言處理、生物、化學(xué)和計(jì)算機(jī)編程等。

在此，來自美國(guó)卡耐基梅隆大學(xué)的Gabe Gomes等研究者展示了Coscientist的發(fā)展和能力，這是一個(gè)由GPT-4驅(qū)動(dòng)的人工智能系統(tǒng)，通過結(jié)合互聯(lián)網(wǎng)和文檔搜索、代碼執(zhí)行和實(shí)驗(yàn)自動(dòng)化等工具授權(quán)的大型語言模型，自主地設(shè)計(jì)、計(jì)劃和執(zhí)行復(fù)雜的實(shí)驗(yàn)。相關(guān)論文以題為“Autonomous chemical research with large language models”于2023年12月20日發(fā)表在Nature上。

大型語言模型(LLMs)，特別是基于Transformer的模型，近年來正經(jīng)歷快速發(fā)展。這些模型已成功應(yīng)用于各種領(lǐng)域，包括自然語言、生物和化學(xué)研究以及代碼生成。如OpenAI所示，模型的極端擴(kuò)展已經(jīng)導(dǎo)致了該領(lǐng)域的重大突破。此外，從人工反饋中強(qiáng)化學(xué)習(xí)等技術(shù)可以大大提高生成文本的質(zhì)量，以及模型在推理其決策的同時(shí)執(zhí)行不同任務(wù)的能力。

2023年3月14日，OpenAI發(fā)布了迄今為止最強(qiáng)大的LLM, GPT-414。盡管關(guān)于模型訓(xùn)練、大小和使用的數(shù)據(jù)的具體細(xì)節(jié)在GPT-4的技術(shù)報(bào)告中有所限制，但OpenAI研究人員已經(jīng)提供了大量證據(jù)，證明該模型具有非凡的解決問題的能力。這些包括但不限于SAT和BAR考試的高分?jǐn)?shù)，LeetCode挑戰(zhàn)和圖片的上下文解釋，包括小眾笑話。此外，技術(shù)報(bào)告提供了一個(gè)如何使用該模型解決化學(xué)相關(guān)問題的例子。

同時(shí)，化學(xué)研究的自動(dòng)化也取得了重大進(jìn)展。例子從有機(jī)反應(yīng)的自主發(fā)現(xiàn)和優(yōu)化到自動(dòng)化流程系統(tǒng)和移動(dòng)平臺(tái)的開發(fā)。

實(shí)驗(yàn)室自動(dòng)化技術(shù)與強(qiáng)大的LLMs的結(jié)合，為自主設(shè)計(jì)和執(zhí)行科學(xué)實(shí)驗(yàn)的受歡迎系統(tǒng)的開發(fā)打開了大門。為了實(shí)現(xiàn)這一點(diǎn)，研究者打算解決以下問題。LLMs在科學(xué)過程中的能力是什么?研究者能獲得多大程度的自主?研究者如何理解自主智能體所做的決策?

在此，研究者提出一個(gè)基于multi-LLMs的智能代理(以下簡(jiǎn)稱Coscientist)，能夠自主設(shè)計(jì)、規(guī)劃和執(zhí)行復(fù)雜的科學(xué)實(shí)驗(yàn)。Coscientist可以使用工具瀏覽互聯(lián)網(wǎng)和相關(guān)文檔，使用機(jī)器人實(shí)驗(yàn)應(yīng)用程序編程接口(APIs)并利用其他LLMs完成各種任務(wù)。這項(xiàng)工作是獨(dú)立完成的，并與自主代理的其他工作并行進(jìn)行，ChemCrow是化學(xué)領(lǐng)域的另一個(gè)例子。本文在六個(gè)任務(wù)中展示了聯(lián)合科學(xué)家的通用性和性能：(1)使用公開可用的數(shù)據(jù)規(guī)劃已知化合物的化學(xué)合成；(2)在大量硬件文檔中高效搜索和導(dǎo)航；(3)在云實(shí)驗(yàn)室中使用文檔執(zhí)行高級(jí)命令；(4)低指令精確控制液體處理儀器；(5)解決需要同時(shí)使用多個(gè)硬件模塊和集成不同數(shù)據(jù)源的復(fù)雜科學(xué)任務(wù)；(6)解決需要分析先前收集的實(shí)驗(yàn)數(shù)據(jù)的優(yōu)化問題。

圖1. 系統(tǒng)的架構(gòu)

Coscientist通過與多個(gè)模塊交互(web和文檔搜索，代碼執(zhí)行)和執(zhí)行實(shí)驗(yàn)來獲得解決復(fù)雜問題所需的知識(shí)。主模塊(‘ Planner ‘)具有規(guī)劃的目標(biāo)，通過調(diào)用以下定義的命令來基于用戶輸入進(jìn)行規(guī)劃。規(guī)劃器是一個(gè)GPT-4聊天完成實(shí)例，充當(dāng)助手的角色。初始用戶輸入和命令輸出被視為發(fā)送給規(guī)劃器的用戶消息。規(guī)劃器的系統(tǒng)提示(定義LLMs目標(biāo)的靜態(tài)輸入)以模塊化方式設(shè)計(jì)，描述為定義動(dòng)作空間的四個(gè)命令:`谷歌`，` PYTHON `， ` DOCUMENTATION `和` EXPERIMENT `。

計(jì)劃者根據(jù)需要調(diào)用這些命令來收集知識(shí)。谷歌命令負(fù)責(zé)使用` Web searcher `模塊搜索互聯(lián)網(wǎng)，這是另一個(gè)LLM本身。PYTHON命令允許規(guī)劃器使用“代碼執(zhí)行”模塊執(zhí)行計(jì)算，為實(shí)驗(yàn)做準(zhǔn)備。EXPERIMENT命令通過DOCUMENTATION模塊描述的API實(shí)現(xiàn)“自動(dòng)化”。與谷歌一樣，DOCUMENTATION命令從源向主模塊提供信息，在本例中是關(guān)于所需API的文檔。本文展示了與Opentrons Python API和Emerald Cloud Lab (ECL)符號(hào)實(shí)驗(yàn)室語言(SLL)的兼容性。這些模塊共同組成了Coscientist，它從用戶那里接收一個(gè)簡(jiǎn)單的純文本輸入提示(例如，“執(zhí)行多個(gè)Suzuki反應(yīng)”)。這種架構(gòu)如圖1所示。

圖2. 協(xié)同科學(xué)家在化學(xué)合成計(jì)劃任務(wù)中的能力

為了演示W(wǎng)eb搜索模塊的功能之一，研究者設(shè)計(jì)了一個(gè)由7種化合物組成的測(cè)試集來合成，如圖2a所示。Web搜索器模塊的版本分別表示為` search-gpt-4 `和` search-gpt-3.5-turbo `。研究者的基線包括OpenAI的GPT-3.5和GPT-4, Anthropic的Claude 1.3和Falcon-40B-Instruct，根據(jù)OpenLLM排行榜，這些模型在實(shí)驗(yàn)時(shí)被認(rèn)為是最好的開源模型之一。

研究者提示每個(gè)模型提供詳細(xì)的化合物合成，并將輸出按以下比例進(jìn)行排序(圖2)：

5非常詳細(xì)和化學(xué)精確的程序描述
4用于詳細(xì)和化學(xué)準(zhǔn)確的描述，但沒有試劑的數(shù)量
3一個(gè)正確的化學(xué)描述，不包括一步一步的過程
2極其模糊或不可行的描述
1不正確的回答或不遵守指示

由GPT-4驅(qū)動(dòng)的Web搜索器在綜合規(guī)劃方面有顯著改進(jìn)。在對(duì)乙酰氨基酚、阿司匹林、硝基苯胺和酚酞的所有試驗(yàn)中，它達(dá)到了最高得分(圖2b)。盡管它是唯一一個(gè)對(duì)布洛芬達(dá)到最低可接受分?jǐn)?shù)3的模型，但它對(duì)乙酸乙酯和苯甲酸的表現(xiàn)低于其他一些模型，可能是因?yàn)檫@些化合物的廣泛性質(zhì)。這些結(jié)果表明，讓LLMs擱淺以避免“幻覺”的重要性。總的來說，支持GPT-3.5的Web搜索器的性能落后于它的GPT-4競(jìng)爭(zhēng)對(duì)手，主要是因?yàn)樗鼪]有遵循關(guān)于輸出格式的具體說明。

圖3. 文檔搜索概述

圖4. 機(jī)器人液體處理控制能力和與分析工具的集成

獲取文檔使人們能夠?yàn)槁?lián)合科學(xué)家在物理世界中進(jìn)行實(shí)驗(yàn)提供足夠的信息。為了展開調(diào)查，研究者選擇了Opentrons OT-2，這是一個(gè)開源的液體處理程序，具有文檔齊全的Python API。文檔中的“入門”頁面在系統(tǒng)提示中提供給規(guī)劃師。其他頁面使用上述方法向量化。

圖5. 交叉耦合鈴木和Sonogashira反應(yīng)實(shí)驗(yàn)由Coscientist設(shè)計(jì)和執(zhí)行

通過使用來自互聯(lián)網(wǎng)的數(shù)據(jù)，執(zhí)行必要的計(jì)算，并最終為液體處理程序編寫代碼，評(píng)估了Coscientist計(jì)劃催化交叉耦合實(shí)驗(yàn)的能力。為了增加復(fù)雜性，研究者要求Coscientist使用在GPT-4訓(xùn)練數(shù)據(jù)收集截止后發(fā)布的OT-2加熱-搖動(dòng)模塊。提供給聯(lián)合科學(xué)家的可用命令和動(dòng)作如圖5a所示。盡管研究者的設(shè)置還不是完全自動(dòng)化的(板塊是手動(dòng)移動(dòng)的)，但不涉及人工決策。

聯(lián)合科學(xué)家復(fù)雜化學(xué)實(shí)驗(yàn)?zāi)芰Φ臏y(cè)試挑戰(zhàn)設(shè)計(jì)如下：(1) Coscientist提供一個(gè)配備有兩個(gè)微孔板(源板和目標(biāo)板)的液體處理器。(2)源板包含多種試劑的原液，包括苯乙炔和苯硼酸，多種芳基鹵化物偶聯(lián)劑，兩種催化劑，兩種堿和溶解樣品的溶劑(圖5b)。(3)靶板安裝在OT-2加熱-搖床模塊上(圖5c)。(4)聯(lián)合科學(xué)家的目標(biāo)是在現(xiàn)有資源的情況下，成功設(shè)計(jì)并執(zhí)行Suzuki-Miyaura和Sonogashira耦合反應(yīng)協(xié)議。

圖6.?化學(xué)推理能力

本研究通過Coscientist系統(tǒng)展示了在化學(xué)實(shí)驗(yàn)設(shè)計(jì)中的高級(jí)推理能力。研究重點(diǎn)放在使用Coscientist優(yōu)化Pd催化反應(yīng)的多變量設(shè)計(jì)。

圖6a介紹了Suzuki反應(yīng)數(shù)據(jù)集的應(yīng)用，涉及不同配體、試劑和溶劑。圖6e則展示了Buchwald–Hartwig反應(yīng)數(shù)據(jù)集，記錄了配體、添加劑和堿的變化。Coscientist的測(cè)試被設(shè)計(jì)為一款游戲，目標(biāo)是最大化反應(yīng)產(chǎn)率。玩家需以JSON格式提供特定反應(yīng)條件和化學(xué)解釋。

圖6b使用歸一化優(yōu)勢(shì)度量來評(píng)估Coscientist的性能，顯示了其在每次迭代中的推理能力提高。圖6c對(duì)比了提供先驗(yàn)信息與否的GPT-4和GPT-3.5的性能。結(jié)果表明，提供先驗(yàn)信息的GPT-4在初始猜測(cè)上更優(yōu)，但最終性能相同。

圖6d的導(dǎo)數(shù)圖表顯示輸入先驗(yàn)信息與否之間沒有顯著差異。與標(biāo)準(zhǔn)的貝葉斯優(yōu)化相比，基于GPT-4的方法展示出更高的NMA和歸一化優(yōu)勢(shì)值。圖6e比較了沒有先驗(yàn)信息的GPT-4在處理化合物名稱或SMILES字符串時(shí)的性能，兩種情況下性能相似。

總結(jié)來說，Coscientist在化學(xué)實(shí)驗(yàn)設(shè)計(jì)和優(yōu)化中展現(xiàn)了出色的推理能力和數(shù)據(jù)處理方法，其性能在多個(gè)測(cè)試中得到了證實(shí)。

綜上，研究者提出了一個(gè)能夠(半)自主設(shè)計(jì)、規(guī)劃和多步執(zhí)行科學(xué)實(shí)驗(yàn)的人工智能代理系統(tǒng)的概念證明。該系統(tǒng)展示了先進(jìn)的推理和實(shí)驗(yàn)設(shè)計(jì)能力，解決了復(fù)雜的科學(xué)問題并生成了高質(zhì)量的代碼。當(dāng)LLMs獲得相關(guān)研究工具，如互聯(lián)網(wǎng)和文檔搜索、編碼環(huán)境和機(jī)器人實(shí)驗(yàn)平臺(tái)時(shí)，這些能力就會(huì)出現(xiàn)。為L(zhǎng)LMs開發(fā)更集成的科學(xué)工具有可能大大加速新發(fā)現(xiàn)。

未來，正在加速到來，留給“化學(xué)人”的時(shí)間不多了！

參考文獻(xiàn)

Boiko, D.A., MacKnight, R., Kline, B.?et al.?Autonomous chemical research with large language models.?Nature?624, 570–578 (2023). https://doi.org/10.1038/s41586-023-06792-0

原文鏈接：

https://www.nature.com/articles/s41586-023-06792-0

原創(chuàng)文章，作者：wdl，如若轉(zhuǎn)載，請(qǐng)注明來源華算科技，注明出處：http://www.zzhhcy.com/index.php/2023/12/22/5c40600bef/

末成年小嫩xb,嫰bbb槡bbbb槡bbbb,免费无人区码卡密,成全高清mv电影免费观看

重磅Nature！GPT-4來搶“飯碗”了！

末成年小嫩xb,嫰bbb槡bbbb槡bbbb,免费无人区码卡密,成全高清mv电影免费观看

重磅Nature！GPT-4來搶“飯碗”了！

相關(guān)推薦