由于對經濟可行且環境可持續的解決方案的需求不斷增加,將二氧化碳(CO?)轉化為有價值的化學品受到了廣泛關注[1]、[2]。在各種二氧化碳利用途徑中,通過氫化將二氧化碳轉化為甲醇(CTM)被認為是一個有前景的選擇,因為甲醇市場需求高,且作為化學原料具有價值,同時還能減少對傳統甲醇生產中化石燃料的依賴[3]、[4]。
在CTM工藝中,催化劑的發展至關重要,因為它顯著影響關鍵性能指標,如二氧化碳轉化率和甲醇選擇性。以往的研究主要集中在使用不同的金屬和載體/促進劑[5]、[6](以不同的摩爾比或質量比)來識別能夠提高二氧化碳轉化率和甲醇選擇性的新催化劑。這些催化劑需要在不同的條件下合成(例如,煅燒溫度、煅燒時間),以實現理想的性能,包括結晶度指數、晶體尺寸和表面積[7]。合成后,會對催化劑進行性能評估,以評估二氧化碳轉化率和甲醇選擇性[8]。這種實驗工作流程需要大量努力且耗時較長。因此,開發一個高效的基于模型的預測和優化框架對于CTM工藝中的催化劑發現至關重要。
鑒于已有實驗數據的可用性,開發一個數據驅動的機器學習模型是預測CTM工藝關鍵性能指標的有希望的方法[9]。以往的研究開發了各種機器學習模型來預測轉化性能。例如,Suvarna等人開發了一個集成樹模型,用于預測在不同催化劑性質、合成條件和操作條件下的甲醇產率[10]。Nia等人應用了四種機器學習模型來預測二氧化碳轉化率和甲醇選擇性[7]。同樣,其他研究也采用了神經網絡、支持向量回歸、隨機森林回歸、高斯過程回歸和混合神經網絡架構來預測CTM工藝中的甲醇選擇性和二氧化碳轉化率[11]、[12]、[13]、[14]、[15]、[16]。盡管取得了這些進展,但這些研究的共同局限性在于它們完全依賴于有限的實驗數據,這限制了預測準確性并阻礙了模型的泛化能力。因此,迫切需要開發一種新型的數據驅動預測模型,即使在數據有限的條件下也能準確預測CTM工藝中的催化劑性能。
CTM工藝的性能本質上受到化學反應限制的影響。具體來說,預測的二氧化碳轉化率受到給定反應溫度和壓力下平衡二氧化碳轉化率的限制[17]。此外,甲醇是CTM工藝的主要產物,而一氧化碳(CO)是副產物[18]。因此,實現100%的甲醇選擇性實際上是不可能的,這引入了另一個限制。二氧化碳轉化率和甲醇選擇性都必須保持在最低閾值以上;否則,工藝將變得效率低下且在經濟上不可行。然而,現有的研究在開發數據驅動的機器學習模型時大多忽略了這些化學反應限制,可能導致不現實的結果。為了解決這一限制,將化學反應限制納入數據驅動的機器學習建模中是必要的。這不僅提高了預測的可靠性,還促進了尊重潛在工藝物理特性的自適應機器學習模型的發展。
CTM工藝中催化劑發現的最終目標是確定最佳的催化劑組分、組成、合成條件和操作條件組合[19]、[20]。然而,關于CTM工藝中催化劑優化的研究較少,這是一個典型的混合整數線性或非線性優化問題。以往的研究主要將機器學習模型與無導數優化技術相結合,以確定CTM工藝的最佳合成和操作條件[7]、[14]、[19]、[21];然而,這種方法僅適用于連續變量。這種方法也被應用于操作優化,以提高CTM工藝的技術經濟性能[22]、[23]。此外,這些出版物忽略了化學反應限制對其開發的機器學習模型的影響,可能會影響最優結果的準確性。這一研究空白可能源于缺乏一個能夠同時處理離散變量(例如催化劑組分)和連續變量(例如催化劑組成、合成條件和操作條件)的高效基于模型的預測和優化框架。
最近,我們證明了將獨熱向量嵌入深度神經網絡(DNN)中,可以使DNN模型有效地與混合整數非線性編程(MINLP)結合[24]。這種方法已被用于二氧化碳捕獲[24]和電力到甲醇工藝[25]、[26]的設計和操作優化。在當前的工作中,我們提出將獨熱向量嵌入到增強型自適應機器學習模型中,以將該模型與MINLP結合[27]用于催化劑發現。這種集成有望克服當前的局限性,并系統地確定CTM工藝的最佳催化劑組分、組成、合成條件和操作條件。具體來說,這使得可以明確優化催化劑組成,允許模型選擇(或排除)特定的金屬氧化物。它還可以同時優化連續變量。此外,所提出的優化框架是一種高效的解決方案,僅需幾秒鐘即可確定最佳催化劑設計。
總之,CTM工藝中的催化劑發現面臨兩個主要挑戰。首先,需要一種新型的機器學習模型,能夠在有限的實驗數據基礎上準確預測關鍵催化劑性能指標,同時遵守基本的化學反應限制。其次,一個可行的基于學習的優化框架對于系統地確定最佳催化劑設計和工藝參數以最大化二氧化碳轉化率和甲醇選擇性至關重要。
本研究開發了一種基于增強型自適應學習的預測和優化方法,用于發現CTM工藝中的最佳催化劑。最初收集了1272個數據樣本作為原始數據,然后使用快速傅里葉變換方法檢測異常值,并基于皮爾遜相關分析和領域知識進行特征選擇。接著開發了一個增強型自適應深度神經網絡(AA-DNN)模型,該模型包括用于數據增強的變分自編碼器和用于性能預測的自適應深度神經網絡。即使實驗數據有限,該模型也能準確預測CTM工藝中的關鍵性能指標,同時遵守化學反應限制。將AA-DNN模型的預測性能與傳統DNN和增強型DNN模型進行了比較,突顯了其更高的準確性。進一步利用AA-DNN模型構建了兩個混合整數非線性優化問題,以確定含有一種和兩種載體/促進劑的銅基催化劑的最優組分、組成、合成條件和操作條件。分析結果證明了所提出方法的重要性和有效性。本研究的主要貢獻如下:
我們提出了一種新穎且高效的基于增強型自適應深度神經網絡的預測和優化框架,用于CTM工藝中的催化劑發現。
據我們所知,這是首次將變分自編碼器用于數據增強與自適應深度神經網絡相結合,以解決催化劑性能預測中的關鍵挑戰,包括有限的實驗數據和遵守化學反應限制。
本研究為研究人員提供了一種實用的方法,用于在各種設計場景中確定最佳的催化劑組分、組成、合成條件和操作條件。
研究結果為提高CTM工藝中的催化劑性能提供了寶貴的見解。此外,所提出的基于增強型自適應學習的預測和混合整數非線性優化框架有潛力擴展到其他二氧化碳轉化工藝中的催化劑發現。
數據準備
數據準備
本研究使用來自先前發表研究的實驗數據來開發CTM工藝中催化劑性能的預測模型。原始數據(1272個樣本)收集自[28]、[29]、[30]、[31]、[32]、[33]、[34]、[35]、[36]、[37]、[38]、[39]、[40]、[41]、[42]、[43]、[44]、[45]、[46]、[47]、[48]、[49]、[50]、[51]、[52]、[53]、[54]、[55]、[56]、[57]、[58]、[59]、[60]、[61]、[62]、[63]、[64]、[65]、[66]、[67]、[68]、[69]、[70]、[71]、[72]、[73]、[74]、[75]、[76]、[77]、[78]、[79]等文獻。
數據分析和特征選擇
本研究匯總了來自先前出版物的1272個原始實驗樣本。使用快速傅里葉變換方法[117]檢測并移除了異常值,得到了1145個無異常值的樣本。這些樣本用于估計輸入變量(催化劑組成、合成條件和操作條件)與目標輸出(二氧化碳轉化率和甲醇選擇性)之間的皮爾遜相關系數[118],如圖2所示。
結論
本研究開發了一種新穎且高效的基于增強型自適應深度神經網絡(AA-DNN)模型的預測和混合整數非線性優化框架,用于發現二氧化碳到甲醇(CTM)工藝中的有效催化劑。
收集了來自先前實驗研究的數據作為原始數據。使用快速傅里葉變換方法移除了異常值,得到了1145個無異常值的樣本。隨后根據皮爾遜相關分析和領域知識,數據集被精煉為368個樣本。
作者貢獻聲明
Dat-Nguyen Vo:撰寫——原始草稿、可視化、驗證、方法論、調查、正式分析、概念化。Xunyuan Yin:撰寫——審稿與編輯、監督、資源管理、項目協調、資金獲取、概念化。
利益沖突聲明
作者聲明他們沒有已知的可能會影響本文報告工作的競爭性財務利益或個人關系。
致謝
本研究得到了新加坡教育部的支持,資助項目屬于學術研究基金第一層級(RG63/22和RG95/24)。此外,本研究還得到了Schmidt Sciences, LCC的支持。