基于雙向多閾值LIF神經元的輕量高效脈沖UNet模型
《Neurocomputing》:Lightweight efficient spiking-UNet based on bidirectional multi-threshold LIF neuron
【字體:
大
中
小
】
時間:2026年03月01日
來源:Neurocomputing 6.5
編輯推薦:
脈沖神經網絡(SNNs)因事件驅動和生物可解釋性在邊緣圖像處理中潛力顯著,但傳統LIF/IF神經元單閾值觸發導致膜電位強度和負向信息丟失。本文提出雙向多閾值LIF(BMT-LIF)神經元模型,通過可學習的雙向多級閾值編碼有效緩解信息損失,并構建輕量化高效SNN-UNet(LES-UNet)架構,參數量較傳統U-Net減少94%,同時設計多閾值梯度貢獻機制實現直接訓練。實驗表明,在DRIVE圖像分割數據集上3步內F1達0.820,BSD68去噪數據集PSNR達28.76 dB,較傳統架構顯著提升推理速度與處理效果。
劉一軍|張炯豪|鄧澤坤|葉武健
廣東工業大學集成電路學院,廣州,510006,中國
摘要 脈沖神經網絡(SNNs)在資源受限的邊緣圖像處理中展現出巨大潛力,這得益于它們基于事件驅動的特性以及與生物系統的相似性。然而,現有的SNNs主要采用Leaky-Integrate-and-Fire(LIF)或Integrate-and-Fire(IF)神經元模型,這些模型的單閾值觸發機制和單向正脈沖發射機制忽略了膜電位強度和負膜電位信息,從而導致SNNs內部嚴重的信息丟失。受生物神經元分層響應和雙向調節機制的啟發,本文提出了一種雙向多閾值LIF(BMT-LIF)神經元模型。基于這種BMT-LIF神經元,構建了一個輕量級高效的Spiking-UNet(LES-UNet)網絡。BMT-LIF神經元實現了膜電位的學習型雙向多級閾值編碼,顯著減少了信息丟失問題。LES-UNet采用簡化的編碼器-解碼器架構,僅包含兩個下采樣和上采樣步驟,與傳統U-Net相比參數數量減少了約94%。此外,本文還提出了一種多閾值梯度貢獻機制,通過分別為BMT-LIF神經元的每個閾值計算替代梯度并進行加權求和,實現了LES-UNet的直接訓練。實驗結果表明,LES-UNet在DRIVE圖像分割數據集上僅需3個時間步長即可達到0.820的F1分數;在高斯噪聲強度為25的BSD68圖像去噪數據集上,僅需3個時間步長即可達到28.76 dB的PSNR。與傳統U-Net和其他Spiking-UNet架構相比,LES-UNet在保持圖像處理性能的同時,具有更快的推理速度。因此,所提出的LES-UNet在輕量級架構、推理時間和圖像處理效果方面具有明顯優勢。
引言 脈沖神經網絡(SNNs)與人工神經網絡(ANNs)的不同之處在于,它們通過離散的脈沖來傳遞信息,這些脈沖模仿了生物神經元的活動方式。由于其基于事件驅動的特性和生物學上的可解釋性,SNNs在資源受限的邊緣圖像處理應用中受到了廣泛關注[1],[2],[3],[4],[5],[6],[7],[8]。然而,現有的SNNs主要采用單閾值觸發和統一的正脈沖發射機制。雖然這種機制簡化了計算邏輯,但導致膜電位強度信息和負膜電位信息的丟失,從而限制了SNNs的圖像處理性能[9],[10]。
為了解決SNNs中的信息丟失問題,研究人員從多個角度改進了神經模型。InfLoR-SNN[11]提出了軟重置IF神經元和膜電位整流器來減少信息丟失;SPIDEN[12]采用自適應閾值IF神經元來優化發射時機,并將其應用于圖像去噪。然而,這些方法仍然局限于單閾值觸發模式,無法有效編碼膜電位強度。受生物神經元分層響應特性的啟發,多閾值神經元的概念應運而生。Spiking-UNet[14]采用了固定的前向多閾值設計,而Leaky Integrate and Fire(IF&B)神經元[15]實現了多閾值觸發的自適應脈沖發射。盡管這些方法初步實現了膜電位強度的編碼,但都忽略了負膜電位中包含的信息。實際上,生物神經系統中興奮性和抑制性信號的合作作用是復雜信息處理的基礎[16],表明負膜電位中的抑制性信息尤為重要。一些研究,如Ternary Spike[17]和TS-MLE[18],試圖引入負脈沖以豐富信息容量,但這些方法未能實現多級強度編碼、負信息利用和神經元的動態適應的協同優化。
近年來,SNNs與U-Net[19]的融合架構在圖像生成和分割等任務中展現了潛力。SUM[20]和SDDPM[21]在圖像生成方面取得了突破性成果,而Spiking-UNet[22]通過圖像分割實現了能效高的頻譜檢測。Spike-UNet[23]則針對低功耗SAR相干變化檢測進行了優化。然而,這些研究保留了傳統U-Net的深度架構,缺乏輕量化設計,導致參數冗余和計算延遲。此外,所采用的神經模型缺乏多閾值分層響應和負膜電位信息的處理。
常見的SNN訓練方法包括ANN-SNN轉換和直接訓練。前者通過將預訓練的ANN轉換為SNN并匹配激活率來實現SNN訓練[24],[25],[26],但這種方法需要更長的推理時間步長才能達到與ANN相當的性能。后者使用替代梯度函數來近似脈沖步長函數,實現了SNN的端到端直接優化[27],[28],[29],顯著減少了所需的推理時間步長。因此,本文采用直接訓練方法。
在本文中,我們提出了一種雙向多閾值LIF(BMT-LIF)神經元模型和輕量級高效的Spiking-UNet(LES-UNet)。通過BMT-LIF神經元對膜電位的細粒度編碼,LES-UNet實現了高效的圖像特征提取能力。此外,我們提出了一種多閾值梯度貢獻機制,實現了LES-UNet的直接訓練。主要貢獻如下:
• 受生物神經元分層響應和雙向調節機制的啟發,我們提出了一種BMT-LIF神經元模型,該模型采用學習型雙向多閾值編碼,顯著減少了SNNs中的信息丟失。
• 我們基于BMT-LIF神經元開發了LES-UNet。其簡化的編碼器-解碼器設計相比傳統U-Net和其他Spiking-UNet架構減少了94%的參數數量,同時BMT-LIF的細粒度膜電位編碼保持了強大的特征提取能力。
• 我們提出了一種多閾值梯度貢獻機制,用于支持LES-UNet的直接訓練。通過分別為BMT-LIF神經元的每個閾值計算替代梯度并進行加權聚合,該方法顯著減少了推理時間步長,同時保持了有效的反向傳播。
• 在BSD68和CBSD68圖像去噪數據集以及DRIVE和CamSeq01圖像分割數據集上的實驗表明,所提出的LES-UNet在更少的時間步長內取得了更好的性能,充分驗證了其在推理時間和圖像處理效果方面的優勢。
部分內容 BMT-LIF神經元的設計 目前SNNs中主要使用的脈沖神經元模型是Leaky-Integrate-and-Fire(LIF)模型[30]或Integrate-and-Fire(IF)模型[31],這兩種模型都模擬了生物神經元的電荷積累和脈沖傳輸過程。其中,LIF神經元基于IF神經元,引入了膜電位泄漏機制,利用泄漏時間常數來模擬生物神經元細胞膜的天然電荷泄漏特性。
圖像去噪 為了驗證LES-UNet在圖像去噪任務中的性能,我們在三個基準數據集BSD200、BSD68和CBSD68上進行了實驗。
BSD200數據集包含200張彩色自然場景圖像。我們將BSD200數據集的圖像轉換為灰度版本,作為BSD68的訓練和驗證集,而原始彩色圖像用于CBSD68的訓練。實驗過程中人工添加了具有不同標準差的高斯噪聲以模擬多種
結論 為了解決現有脈沖神經元模型中的信息丟失問題,本文提出了一種受生物神經元分層響應和雙向調節機制啟發的BMT-LIF神經元模型。BMT-LIF神經元實現了膜電位的學習型雙向多級閾值編碼,有效減少了膜電位強度和負信息的丟失。此外,基于BMT-LIF神經元構建了LES-UNet。
CRediT作者貢獻聲明 劉一軍: 撰寫 – 審稿與編輯、資源管理、方法論、資金獲取、概念構思。張炯豪: 撰寫 – 原始草稿、可視化、驗證、軟件開發、方法論、數據分析、數據管理、概念構思。鄧澤坤: 撰寫 – 審稿與編輯、指導、方法論、數據分析、資金獲取、概念構思。葉武健: 撰寫 – 審稿與編輯、指導、數據分析、概念構思。
利益沖突聲明 作者聲明他們沒有已知的財務利益或個人關系可能影響本文的研究工作。
致謝 本研究部分得到了廣東省發展和改革委員會芯片設計綜合服務與創新平臺項目(項目編號2022271)以及廣東工業大學(項目編號263114079)的支持。
劉一軍 1999年獲得北京師范大學計算機科學學士學位,2002年獲得廣東工業大學計算機科學碩士學位,2003年和2005年分別獲得英國曼徹斯特大學計算機科學碩士和博士學位。他目前是廣東工業大學集成電路學院的教授,研究興趣包括
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號