末成年小嫩xb,嫰bbb槡bbbb槡bbbb,免费无人区码卡密,成全高清mv电影免费观看

機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等

1. IF=31.068,Nat. Rev. Phys.概述可解釋機器學習在粒子物理學中的應用!
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
機器學習(ML)方法在粒子物理學中具有廣泛應用,但沒有可解釋性就不能保證算法學習的結果是正確/穩健的。開發可解釋的ML/AI方法是為了消除多變量分析的黑箱問題,然而物理學中可解釋AI的曙光主要歸結為解釋神經網絡如何分析實驗數據,而不是轉向更可解釋的ML框架,這有助于更好地理解ML模型的動力學并在隨后的分析中建立信心。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
在此,德國電子同步加速器(DESY)研究中心/洪堡大學Ayan Paul等人概述了如何將可解釋性引入粒子物理學中常用的ML方法。其中,用于對科學數據中的非線性關系進行建模的兩個最常見的ML框架是決策樹和神經網絡。決策樹易于解釋,但不如神經網絡強大。相反,在給定噪聲數據的情況下,神經網絡的泛化效果要好得多,但其參數無法提供任何關于輸入變量與輸出變量如何連接的洞察力。此外,處理更復雜的數據集需要增加模型的復雜性,但這樣做會導致其可解釋性下降。為了重新引入訓練模型的可解釋性元素,研究人員提出了事后方法來檢查ML模型并嘗試找出做出決策的原因。這些方法大致分為兩類:(1)根據輸入變量解釋每個結果的局部方法;(2)全局方法,將模型解釋為一個整體并確定整體“變量重要性”,從而構建輸入變量在確定輸出中的重要性層次結構。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
圖1. ML模型準確性-可解釋性之間的權衡
進一步,作者以測量希格斯粒子與底部夸克的湯川耦合為例說明了可解釋分析在粒子物理學中的應用。這種測量面臨的挑戰是從運動學相似的背景中提取極小的信號,而基于運動學切割的傳統方法無法分離這些信號。ML(增強決策樹,BDT)模型使任務更可行,但代價是分析不透明。然而,動力學可通過使用Shapley值來解釋BDT并將重要性層次分配給變量來理解。此外,本文中關注的是變量重要性方面,但更有挑戰性的主題如誤差傳播、模型魯棒性和建立物理模型也需要關注。作者認為:貝葉斯推理和ML的協同作用可實現對模型參數和預測的誤差估計;模型魯棒性的理解可幫助避免在模型訓練的參數空間附近的錯誤預測,進而實現更好的泛化;建立與物理相關的模型可建立更可靠的系統動力學模型,從而預測控制系統的基本規律??傊?,本文提供了一個初學者指南,用于構建粒子物理領域可解釋的多變量分析模型。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
圖2. 粒子物理學領域可解釋性分析的簡單舉例
Lessons on interpretable machine learning from particle physics, Nature Reviews Physics 2022. DOI: 10.1038/s42254-022-00456-0
2. npj Comput. Mater.: 機器學習發現環境壓力下控制實驗材料穩定性的方程
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
雖然實驗研究中的機器學習(ML)已經展示了令人印象深刻的預測能力,但從實驗數據中提取可替代的知識表示仍然是一項難以捉摸的任務。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
在此,美國麻省理工學院Tonio Buonassisi, Richa Ramesh Naik及Armi Tiihonen等人使用科學ML從環境壓力(高溫、濕度和光照)下降解有機-無機甲基碘化鉛(MAPI)鈣鈦礦薄膜的實驗數據中推斷出潛在的偏微分方程(PDE)。在這項研究中,作者專注于PDE-FIND算法在鈣鈦礦降解數據中的應用。其中,選擇 PDE-FIND是因為它是一種可解釋的方法并提供了對動力學的簡潔描述,并且可以靈活地將領域專業知識應用于庫選擇。直接從實驗老化測試數據中成功識別控制PDE將加深對熱降解的理解,并為鈣鈦礦太陽能電池的可靠壽命預測及長期老化測試加速因子的確定提供工具。本研究的目標有兩個:(1)使用稀疏回歸方法 PDE-FIND揭示與鈣鈦礦降解相對應的潛在PDE;(2)通過比較有/無噪聲的模擬數據,量化噪聲對PDE-FIND提取PDE精度的影響。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
圖1. PDE-FIND基于實驗數據提取PDE
使用稀疏回歸算法,作者發現在35~85°C的廣泛溫度范圍內控制MAPI降解的底層PDE最低限度可由一個二階多項式來描述。盡管數據集中存在噪聲和方差,但僅選擇了與系統動力學相對應的函數,并且PDE與數值導數表現出良好的一致性。通過對模擬數據的魯棒性分析表明,當添加高達5% 的高斯噪聲時,具有二階多項式庫的PDE-FIND可成功識別描述模擬數據的PDE。然而,擬合參數的誤差隨噪聲的增大而增大,最高接近80%。如果獲得的數據具有低噪聲或可通過降噪技術去噪,則科學ML方法在揭示動力系統的控制方程方面非常有用。總之,該研究展示了ML加速對鈣鈦礦材料降解的理解和可靠性優化,突出了與ML輔助科學發現相關的前景和挑戰。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
圖2. 基于模擬數據評估噪聲對PDE提取的影響
Discovering equations that govern experimental materials stability under environmental stress using scientific machine learning, npj Computational Materials 2022. DOI: 10.1038/s41524-022-00751-5
3. npj Comput. Mater.: 自動DFT+機器學習模擬Ni3Al基合金的反相疇界能
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
反相疇界(APB)是平面缺陷,在強化鎳基高溫合金中起著關鍵作用,它們對合金成分的敏感性為合金設計提供了靈活的調整參數。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
在此,美國加州大學伯克利分校Mark Asta、勞倫斯利弗莫爾國家實驗室Timofey Frolov等人報道了一個計算工作流程以提供足夠的數據來訓練機器學習(ML)模型,從而自動研究成分對Ni3Al基合金中(111)APB能(記為γ111)的影響。作者通過創建一個計算工作流程來自動化DFT計算,最終生成了豐富的數據(包括溶質位點偏好、γ111及物理上有意義的特征),從而實現對APB能的化學貢獻的數據驅動評估。具體而言,對于每個三元物種,作者首先使用PyDII計算其亞晶格偏好,然后使用該預測來使用ATAT構建模型超晶胞。接下來,基于VASP進行DFT計算以獲得γ111。最后,使用在scikit-learn中實現的ML技術來分析數據中的相關性并為γ111構建預測性ML模型。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
圖1. γ111成分依賴性的代表性曲線
研究表明,PyDII預測Co和Cr是位置偏好變化最大的兩個物種。對于Co,可將其行為歸類為更偏好Ni亞晶格;對于Cr,PyDII預測對Al亞晶格的偏好非常強烈。DFT結果還表明,幾種元素表現出對γ111的非單調濃度依賴性,這可能對合金設計產生重要影響。在d區元素中,Ta可能是在高濃度下使γ111最大化的元素。此外,用于分析γ111成分依賴性的隨機森林(RF)模型實現了0.033 J m-2的五倍交叉驗證誤差,R2?為 0.753。進一步,作者通過預測商業高溫合金中的APB能證明了RF模型的可轉移性與普適性。總之,這項研究表明高通量計算和ML之間的協同作用為探索廣闊的合金成分空間提供了機會,并加快了合金應用的發展進程。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
圖2. RF模型結果
Modeling antiphase boundary energies of Ni3Al-based alloys using automated density functional theory and machine learning, npj Computational Materials 2022. DOI: 10.1038/s41524-022-00755-1
4. 倫敦瑪麗女王大學Adv. Sci.: 用于表示域獨立材料發現的公式圖自注意網絡
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
機器學習(ML)在材料屬性預測中的成功在很大程度上取決于如何表示材料以進行學習。目前存在兩種主要的材料描述符,一種在表示中編碼晶體結構,另一種僅使用化學計量信息。其中,圖神經網絡(GNN)尤其擅長在化學精度范圍內預測材料特性。然而,由于各自的材料表示之間幾乎沒有重疊,當前的GNN僅限于上述兩種途徑中的一種。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
在此,英國倫敦瑪麗女王大學郝陽教授等人引入了公式圖的新概念,它統一了僅化學計量和基于結構的材料描述符。進一步,作者開發了一種吸收公式圖的自注意力集成GNN并將其命名為Finder(Formula graph self-attention network for materials discovery),從而實現了單獨使用公式或通過單獨晶體結構計算來預測材料特性。Finder是一種消息傳遞GNN,它在Transformer架構中采用了一種自注意力機制的變體。研究表明,在Materials Project(MP)中管理的各種基準數據庫上,Finder可以超越一些最先進的純化學計量模型(如Roost)并可與MEGNet和CGCNN等晶體圖模型競爭。與這項工作中重新審視的其他模型相比,Finder模型顯示出更快的收斂速度并在探索的所有訓練集大小下實現了更低的誤差。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
圖1. Finder模型學習效率評估和t -SNE/PCA 可視化
作為一個具有挑戰性的應用,作者研究了Finder在預測來自JARVIS DFT存儲庫材料的頻率相關介電常數方面的能力。隨后,作者確定了具有從近紅外 (NIR)到紫外線(UV)區域的工作頻率范圍內有前途的介電常數趨近于零(ENZ)材料。結果表明,含有釩氧陰離子的化合物是一種令人興奮的低損耗 ENZ候選材料。ENZ材料表現出奇異的特性,如促進諧波產生的非線性電光現象、波混合、超快光開關和相位可調超表面設計。盡管訓練數據庫的規模有限,但Finder模型可在不使用晶體結構的情況下準確預測材料的介電功能,使其成為任何給定規模的強大材料發現平臺??傊?,諸如Finder之類的領域不變框架結合了NLP和計算機視覺等其他學科的方法論,開創了材料科學真正的跨學科研究途徑。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
圖2. 從MP數據庫中發現ENZ材料
Formula Graph Self-Attention Network for Representation-Domain Independent Materials Discovery, Advanced Science 2022. DOI: 10.1002/advs.202200164
5. 馬普學會CEJ: 可解釋機器學習加速發現用于乙烷/乙烯分離的MOF!
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
由于其高孔隙率和可定制的功能,金屬有機框架(MOF)被認為是適用于廣泛應用的材料候選者,包括氣體分離和儲存、催化和能量轉換。其中,金屬節點和有機連接體的大量組合導致了無限的材料空間,這為設計高性能MOF提供了高度的靈活性和潛力,同時也帶來了一定的挑戰。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
在此,德國馬普學會復雜技術系統動力學研究所周騰博士等人報道了一種可解釋的機器學習(ML)方法,用于加速發現用于選擇性分離乙烷(C2H6)和乙烯(C2H4)的有前景MOF材料。首先,作者基于分子模擬數據訓練和測試ML模型,同時以不同類型的材料描述符和指紋作為輸入,將MOF分類為C2H4選擇性和 C2H6選擇性類別?;趯Λ@得模型的SHAP解釋可推斷出一系列特征規范,從而指定MOF結構中的首選特征。根據這些規范,可從大型MOF數據庫中有效地將一小部分MOF識別為潛在的C2H6選擇性吸附劑。最后,對這些潛在候選者進行了GCMC模擬,其中93.8% 的已識別候選物被證實具有C2H6選擇性,最佳MOF(hMOF-5067000)顯示出6.46的高C2H6/C2H4選擇性。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
圖1. 基于PubChem的RF模型的全局和局部解釋
盡管作者基于該模型方法確定了高性能MOF,但也存在一些限制。首先,PubChem指紋僅使用二進制變量來指示存在或不存在,而不是子結構的出現頻率。這使得結果易于理解和解釋,但缺少有關子結構數量的重要信息。如果以包括每個子結構的出現頻率更新指紋,則可以顯著提高ML模型的性能。此外,作者基于開發的ML模型將MOF分為兩類,即C2H4選擇性和C2H6選擇性MOF。如果可以使用基于回歸的ML方法對選擇性值進行定量預測,則可為先進MOF發現獲得更有用和可靠的見解。總之,這項工作表明通過可解釋ML模型獲得的有見地的特征規范對于高效發現用于氣體分離的高性能MOF非常有幫助。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
圖2. MOF候選物的GCMC衍生選擇性
Interpretable machine learning for accelerating the discovery of metal-organic frameworks for ethane/ethylene separation, Chemical Engineering Journal 2022. DOI: 10.1016/j.cej.2022.136651
6. 南信大張磊教授ACS AMI: 高通量計算+機器學習設計二維鹵化物鈣鈦礦
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
鹵化物鈣鈦礦可進一步在維度和成分上進行設計,并用于儲能應用。揭示離子與低維鹵化物鈣鈦礦之間的相互作用對于實現下一代儲能裝置(如光充電離子電池和離子電容器)至關重要。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
在此,南京信息工程大學張磊教授等人進行了密度泛函理論(DFT)計算和機器學習(ML)研究,以評估離子與二維鹵化物鈣鈦礦之間的相互作用對儲能應用的影響。首先,作者進行了高通量第一性原理計算,以獲得訓練/測試數據集中的640個觀測值。在特征工程步驟中計算Pearson相關系數以消除冗余特征,然后選擇適當的特征(13個)將其用于構建ML模型。此外,為了全面評估特征重要性并避免Pearson方法造成的偏差,作者使用14種不同的排序方法根據特征與輸出值的相關性對特征進行排序。接下來,作者比較了六種機器學習算法(KNN、Kriging、隨機森林、Rpart、SVM 和Xgboost)的精度,其中Xgboost算法(r = 0.968, R2 = 0.93)實現了最佳精度并被用于預測虛擬空間。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
圖1. 整個機器學習過程的流程圖
其中,虛擬空間由各種離子/A2BX4系統的吸附能組成,其中離子包括Li+、Zn2+、K+、Na+、Al3+、Ca2+、Mg2+和F,A位物種包括Li、Na、K、Rb、和 Cs,B位物種指Ge、Sn、Pb,X位物種指F、Cl、Br 和I。通過Xgboost算法預測由11976個二維離子/鈣鈦礦系統組成的數據庫,然后根據無鉛和鹵素混合標準篩選材料。最終,預測集中的5個示例離子/鈣鈦礦系統,即Li+/K2GeClBr3、K+/Rb2SnFBr3、K+/Rb2SnBr3I、Na+/Cs2SnFCl2I和Na+/LiCsSnFBr2I被建議作為離子電容器的潛在候選者。作者通過第一性原理和分子動力學進一步評估選定的材料候選物,并解釋其光電特性和穩定性。總之,這項基于ML的研究為開發用于太陽能可充電離子電容器和鈣鈦礦基離子電池的二維鹵化物鈣鈦礦材料提供了參考。
機器學習||頂刊匯總:Nat. Rev. Phys.、npj Comput. Mater.、Adv. Sci.、CEJ等
圖2. 機器學習預測與第一性原理計算的5種候選材料吸附能比較
Designing Two-Dimensional Halide Perovskites Based on High-Throughput Calculations and Machine Learning, ACS Applied Materials & Interfaces 2022. DOI: 10.1021/acsami.2c00564

原創文章,作者:v-suan,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2023/10/14/adf532b0d5/

(0)

相關推薦

主站蜘蛛池模板: 阿克| 大田县| 闽清县| 开阳县| 弥渡县| 东乡族自治县| 两当县| 南康市| 漳州市| 化州市| 潍坊市| 望江县| 阳西县| 屏东市| 乌鲁木齐市| 濮阳县| 三都| 石门县| 嵊泗县| 西平县| 探索| 永善县| 东丽区| 龙江县| 姜堰市| 莱芜市| 祁东县| 永善县| 监利县| 金坛市| 邵东县| 蒙城县| 保德县| 延边| 图木舒克市| 治多县| 嘉义县| 东城区| 娱乐| 新营市| 怀集县|