過去的幾十年中機器學習(ML)影響了電催化領域,研究人員開始利用基于ML的數據驅動技術來克服計算和實驗限制以加速合理的催化劑設計。然而,很少有討論ML流程整體協同加速CO2還原(CO2RR)電催化劑的計算和合理設計的綜述。在此,澳大利亞國立大學殷宗友教授、科廷大學夾國華教授及中科院深圳先進院趙海濤副研究員等人總結了機器學習(ML)在CO2RR電催化劑設計中應用的最新進展。與之前這方面的綜述不同,作者主要將ML在電催化CO2RR中的應用分為兩個方面:一方面,研究人員基于AI技術構建了勢函數,替代了求解薛定諤方程這種耗時的量子化學計算過程,從而加速了計算并達到大規模、低成本高通量模擬的目的,這是ML輔助加速計算過程的體現;另一方面,訓練數據來源于高通量實驗數據、理論計算或模型構建數據集,這是ML輔助合理設計過程的體現,包括建立數據集/數據源選擇、描述符選擇和驗證、ML算法選擇和模型預測。作者詳細討論了這兩種策略,并概述了ML在CO2RR電催化劑設計中的機遇和未來挑戰。圖1. ML加速CO2RR電催化劑計算和設計的示意圖最后,作者總結了未來ML在CO2RR電催化劑設計中的挑戰:1)計算成本問題。DFT計算仍將是短期內篩選電催化劑和研究機理的主要工具,希望ML將在未來大幅降低昂貴的DFT計算成本;2)數據來源仍面臨挑戰。數據集是未來合理設計CO2RR電催化劑的基礎,然而目前缺乏用于模型訓練和驗證的足夠多樣化和廣泛的實驗數據集;3)描述符的兼容性問題。由于實驗觀察和 DFT計算之間的代溝,實驗和模擬描述符之間的交互目前是不兼容的;4)算法的壁壘問題。算法參數可能會造成誤差,如何消除這些誤差需要算法調試。因此,有必要基于數據科學方法確保數據集和訓練模型的可靠性和可重復性;5)可靠ML流程的合理設計問題。考慮到決速步驟的多樣化,未來集成DFT計算、ML和實驗的工作流程將促進對電催化CO2RR的進一步理解。圖2. 不同ML方法訓練模型的預測性能比較Machine learning accelerated calculation and design of electrocatalysts for CO2 reduction, SmartMat 2022. DOI: 10.1002/smm2.1107