91乱子伦国产乱子伦海的味道,影音先锋久久,日韩无码一区二区三区

首頁今日動態人才市場新技術專欄中國科學人云展臺
BioHot
云講堂直播會展中心特價專欄技術快訊免費試用

生物通官微
陪你抓住生命科技
跳動的脈搏

生物通首頁 > 今日動態 > 正文

一個結合長期記憶網絡和多個短期記憶網絡的持續學習框架

《Neural Networks》：A Continual Learning Framework with Long-Term and Multiple Short-Term Memory Networks

【字體：大中小】 時間：2026年02月27日 來源：Neural Networks 6.3

編輯推薦：

　　持續學習框架LaMuS通過引入多個短期記憶網絡與一個長期記憶網絡，結合高斯混合模型約束解決知識整合難題，有效平衡穩定性與可塑性。

劉尚格|王磊|嚴瑞|霍靜|李文斌|高陽

南京大學新型軟件技術國家重點實驗室，南京，210008，中國

摘要

持續學習旨在在保持穩定性和可塑性的同時逐步積累知識。大多數現有方法側重于減輕災難性遺忘，但往往以犧牲可塑性為代價。雖然引入輔助記憶組件來關注新任務數據可以有效提高可塑性，但使用單一網絡可能不足以捕捉新任務中的全部知識多樣性。受到神經科學研究強調的豐富、分布式記憶表示價值的啟發，我們提出了一種新框架，該框架結合了多個短期記憶網絡來捕獲多樣化的任務特定知識，并通過長期記憶網絡來保留先前的知識。為了最大化該框架的潛力，我們指出了常用的基于歐幾里得距離的正則化方法的局限性，并開發了一種基于高斯混合模型（GMM）的正則化方法，以鼓勵從多個短期網絡中靈活選擇和整合知識。通過對各種基準測試的理論分析和實驗研究，證明了我們的框架在更好地平衡知識保留和新學習方面的有效性和優勢。此外，我們的框架與各種基于權重正則化的算法以及采用帶有回放的功能正則化的方法兼容，為在不同范式中增強持續學習提供了一種多功能的方法。

引言

持續學習的目標是使人工智能系統能夠從一系列任務中學習和積累知識（Parisi, Kemker, Part, Kanan, Wermter, 2019a, Parisi, Kemker, Part, Kanan, Wermter, 2019b; Roy et al. (2023); Wang et al. (2024)）。持續學習中的一個關鍵挑戰是穩定性與可塑性的平衡問題，即如何在保留先前獲得的知識（穩定性）和學習新任務的能力（可塑性）之間找到平衡（De Lange et al. (2021); Kim et al. (2023); Wang et al. (2024)）。

目前大多數方法（Bhat et al. (2023); Sun et al. (2023); Wang et al. (2022)）優先考慮穩定性以減輕災難性遺忘（French (1999); McCloskey and Cohen (1989)）。這通常會限制可塑性，阻礙模型學習新任務的能力（Peng et al. (2024); Wang et al. (2024)）。受到互補學習系統理論（McCllland et al. (1995)以及大腦中短期記憶與長期記憶之間相互作用的啟發（Kumaran et al. (2016); Parisi et al. (2018)），一些持續學習方法結合了短期記憶和長期記憶組件來解決穩定性與可塑性的問題（Arani et al. (2022); Kamra et al. (2017); Kemker and Kanan (2017); Peng et al. (2024)）。特別是，一些研究探索了輔助記憶組件來存儲和處理任務特定知識（Kim et al. (2023); Peng et al. (2024); Wang, Zhang, Jia, Li, Bao, Ma, Zhu, Zhong, 2021b, Wang, Zhang, Li, Zhang, Su, Zhu, Zhong, 2023），以提高可塑性。在基于權重正則化的方法中，如輔助網絡持續學習（ANCL）（Kim et al. (2023）引入了專門用于新任務的輔助網絡來增強可塑性。同樣，在基于功能正則化并帶有回放的方法中，如帶有經驗回放的互補學習系統（CLS-ER）（Arani et al. (2022）通過模型權重的指數移動平均（EMA）維護兩個互補的網絡：一個能夠快速適應新任務的靈活模型和一個能夠保留長期知識的穩定模型。為了術語的一致性，我們將保留先前任務知識的網絡稱為長期記憶網絡，將快速適應新任務的網絡稱為短期記憶網絡。

盡管取得了進展，但這些方法都有一個根本性的局限性。它們通常依賴于單一的短期記憶組件，這限制了捕捉和利用新任務中多樣化信息的能力。從兩個角度來看待這一局限性：1）從神經科學的角度來看，研究表明海馬體可以通過分布式激活模式形成多樣化的記憶表示（Leutgeb et al. (2007); O’Reilly and Rudy (2001）。這些多樣化的記憶表示能夠高效編碼不同的信息（GoodSmith et al. (2017)，并且分布式激活模式有助于信息處理和學習（Kuchibhotla et al. (2017)）。這一生物學證據表明，在人工智能系統中部署和維護多個記憶網絡的潛在好處。2）從優化的角度來看，當只使用單一記憶網絡時，我們將面臨預先識別最適合整合的網絡的挑戰。

這種情況促使我們考慮使用多個短期記憶網絡，并利用優化過程自動識別最佳組合的短期記憶網絡與長期記憶網絡進行整合。基于這一想法，我們提出了一個名為長期和多個短期記憶網絡（LaMuS）的新框架用于持續學習。如圖1d所示，所提出的框架引入了多個短期記憶網絡以及一個長期記憶網絡。多個網絡的存在使我們的模型能夠從不同角度學習新任務并更靈活地適應它們。同時，長期記憶網絡保留了先前獲得的知識，在穩定性和可塑性之間取得了平衡。

然而，所提出的框架面臨的一個關鍵挑戰是如何有效地將這些多個短期記憶網絡與長期記憶網絡整合在一起。現有的持續學習方法在整合單一短期記憶網絡時通常采用基于歐幾里得距離的約束，無論是通過對網絡權重的參數約束（例如ANCL-EWC中的

L_{2}

（Kim et al. (2023)）還是特征對齊（例如CLS-ER中的MSE損失（Arani et al. (2022)）。雖然這些方法對單一網絡有效，但直接將這樣的歐幾里得距離正則化應用于多個網絡并通過求和組合時會遇到問題。由于凸函數之和仍然是凸的，將這些約束應用于多個網絡不可避免地會導致優化結果趨向于一個“平均”點。這與我們引入多個短期記憶網絡并利用優化過程自動識別最佳短期網絡集的目標相矛盾。為了解決這個問題，我們進一步設計了一種基于高斯混合模型（GMM）（Bishop and Nasrabadi (2006）的新正則化方案，以同時支持多個模式，每個模式對應于其中一個短期記憶網絡。這種方案有效地避免了上述“平均”效應，并促進了合適短期網絡的自動整合。

為了展示所提出的LaMuS框架的通用性，我們沿著兩條平行路徑對其進行了實現。首先，我們通過用多個短期記憶網絡替換ANCL（Kim et al. (2023)中的單一輔助網絡，并通過基于GMM的正則化方法來增強基于權重正則化的方法。其次，我們通過用多個塑性模型替換CLS-ER（Arani et al. (2022)中的單一塑性模型，并再次使用基于GMM的正則化方法來改進結合回放與功能正則化的方法，以實現有效的知識整合。

我們的主要貢獻可以總結如下：

•
提出了一種新的持續學習框架，利用多個短期記憶網絡來適應新任務的多樣化信息。這種方法在保持穩定性的同時增強了可塑性。
•
設計了一種創新且基于數學原理的正則化方法，用于在持續學習的背景下整合記憶網絡。與直接使用基于歐幾里得距離的正則化方法相比，這種方法提供了更有效的正則化。
•
我們通過將其應用于基于權重正則化的方法和結合功能正則化與回放的方法來實例化我們的框架，展示了所提出框架的通用性。
•
在各種基準測試上進行了廣泛的實驗，證明了所提出框架在平衡穩定性和可塑性方面的有效性。還對該框架與相關CL方法進行了徹底的分析和比較。

提出的方法

在本節中，我們介紹了長期和多個短期記憶網絡（LaMuS）框架。首先，我們建立了持續學習中正則化的統一視圖。然后，我們介紹了從單一輔助組件擴展到多個短期記憶網絡的過程，并指出了在整合多樣化知識時結合凸約束的局限性。接著，我們提出了一種基于高斯混合模型（GMM）的非凸正則化方案，以有效利用

基于權重正則化的方法實驗

在本節中，我們專注于將我們的框架應用于基于權重正則化的持續學習方法，并在任務增量學習（TIL）場景中評估我們的LaMuS框架，因為基于權重正則化的方法非常適合TIL場景。

結合回放的功能正則化方法實驗

在本節中，我們通過結合功能正則化與回放的方法來展示我們的框架，并在類別增量學習（CIL）這一更具通用性和挑戰性的場景中評估LaMuS框架。

結論

本文提出了LaMuS框架，該框架通過整合多個短期記憶網絡與長期記憶網絡來解決穩定性與可塑性的平衡問題。廣泛的分析表明，使用多個記憶網絡通過從不同角度捕獲多樣化的知識表示更為有效。這表明分布式記憶表示不僅在生物系統中有益，在人工神經網絡中也是如此。

CRediT作者貢獻聲明

劉尚格：撰寫 – 審稿與編輯，撰寫 – 原始草稿，方法論，調查，概念化。王磊：撰寫 – 審稿與編輯，方法論，調查，概念化。嚴瑞：撰寫 – 審稿與編輯，驗證，方法論。霍靜：撰寫 – 審稿與編輯，形式分析，概念化。李文斌：撰寫 – 審稿與編輯，撰寫 – 原始草稿，方法論，調查，概念化。高陽：監督，方法論，

利益沖突聲明

作者聲明他們沒有已知的競爭性財務利益或個人關系可能影響本文報告的工作。

致謝

本工作部分得到了中國科學技術協會青年精英科學家資助計劃（2023QNRC001）、國家自然科學基金（62192783, 62276128）和江蘇省自然科學基金（BK20221441）的支持。

熱點排行

新聞專題

聯系信箱：

粵ICP備09063491號

摘要

引言

相關工作