機(jī)器學(xué)習(xí)勢(shì)函數(shù)(MLP)在多相催化研究中通常依賴(lài)于“系統(tǒng)特定”的數(shù)據(jù)采樣,即圍繞特定催化劑結(jié)構(gòu)與反應(yīng)坐標(biāo)構(gòu)建數(shù)據(jù)集并進(jìn)行分子動(dòng)力學(xué)采樣。該方法易造成數(shù)據(jù)冗余與泛化通用能力不足,難以像密度泛函理論(DFT) 那樣對(duì)任意結(jié)構(gòu)進(jìn)行“所見(jiàn)即算”的通用計(jì)算。近日,上海科技大學(xué)物質(zhì)科學(xué)與技術(shù)學(xué)院胡培君教授與謝聞博助理研究員提出了新一代元素基通用型機(jī)器學(xué)習(xí)勢(shì)函數(shù)(EMLP)的采樣和訓(xùn)練方法。相關(guān)成果以“General reactive element-based machine learning potentials for heterogeneous catalysis”為題,發(fā)表在國(guó)際學(xué)術(shù)期刊《自然-催化》(Nature Catalysis)。
他們發(fā)展了一種勢(shì)函數(shù)訓(xùn)練新方法(REICO),通過(guò)算法生成并優(yōu)化“小體系”,擺脫對(duì)特定結(jié)構(gòu)與反應(yīng)坐標(biāo)的依賴(lài),將采樣從“結(jié)構(gòu)空間”轉(zhuǎn)向“原子相互作用空間”。此模型可在小體系中學(xué)習(xí)可遷移的原子間的相互作用并推廣至大體系,實(shí)現(xiàn)了接近 DFT 的通用預(yù)測(cè),在多種催化反應(yīng)中展現(xiàn)出與DFT一致的高精度,具備跨體系通用能力,為大規(guī)模復(fù)雜催化體系模擬提供了高效可靠的DFT替代方案,也為新一代大原子模型提供了新的訓(xùn)練思路,推動(dòng)機(jī)器學(xué)習(xí)勢(shì)函數(shù)從“專(zhuān)用”走向“通用”,在多相催化、材料、生物化學(xué)等領(lǐng)域具有廣闊應(yīng)用前景。

圖1. EMLP 訓(xùn)練流程。其中RECIO方法中完全擺脫結(jié)構(gòu)空間,專(zhuān)注于原子間相互作用訓(xùn)練集數(shù)據(jù)生成、元素基機(jī)器學(xué)習(xí)勢(shì)函數(shù)(EMLP)訓(xùn)練流程以及訓(xùn)練出的勢(shì)函數(shù)模型在多相催化中的應(yīng)用。

圖2. EMLP可以廣泛應(yīng)用在各種化學(xué)體系中,實(shí)現(xiàn)了氣固液多相體系的統(tǒng)一精確描述,超越了傳統(tǒng)機(jī)器學(xué)習(xí)勢(shì)函數(shù)的應(yīng)用局限。EMLP不僅能準(zhǔn)確預(yù)測(cè)多相催化反應(yīng),還能用于計(jì)算有機(jī)化學(xué)反應(yīng)、表面動(dòng)力學(xué)和溶液環(huán)境,展示了其真正的通用性。
上??萍即髮W(xué)物質(zhì)學(xué)院胡培君課題組聯(lián)培研究生楊昌熙、吳辰宇,助理研究員謝聞博為共同第一作者。謝聞博、胡培君教授為共同通訊作者。
