利用硬件非理想特性構建在ACIM上的魯棒低精度集成系統
《IEEE Transactions on Very Large Scale Integration (VLSI) Systems》:Exploiting Hardware Nonidealities for Robust Low-Precision Ensembles on ACIM
【字體:
大
中
小
】
時間:2026年03月02日
來源:IEEE Transactions on Very Large Scale Integration (VLSI) Systems 3.1
編輯推薦:
器件變異在模擬計算內存(ACIM)系統中的利用策略。研究通過在ACIM芯片上部署兩個4位深度神經網絡副本,結合軟投票機制提升預測可靠性。實驗表明,當器件變異系數σ≥0.10時,4位集合模型性能超越8位單模型基準,最高提升1.28pp。硬件評估顯示,采用SRAM架構的ACIM系統,雙副本方案面積縮減9%,但延遲增加30%,能耗上升2.1%。研究證實該機制在不同存儲器技術(RRAM/FeFET)下的有效性,揭示了器件變異與計算性能的動態平衡關系。
摘要:
設備差異是模擬計算內存(ACIM)系統面臨的一個根本性挑戰。我們沒有將其視為錯誤,而是將其戰略性地利用為計算多樣性的來源。我們通過在同一ACIM芯片上編程兩個低精度深度神經網絡(DNN)副本來利用這種由自然過程引起的差異。然后,通過一種軟投票機制來匯總它們的輸出,以獲得更可靠的預測結果。為了量化系統級別的權衡,我們擴展了NeuroSim V1.4框架,以同時評估準確性、面積、延遲和能耗。在VGG-8/CIFAR-10數據集上,當導電率變化從0.05增加到0.25時,4位模型的集成精度相對于4位單一模型(SM)提高了0.46個百分點(pp)。值得注意的是,在σ為0.05時,集成模型的精度甚至超過了無差異基線0.303個百分點。與8位SM基線相比,當σ≥0.10時,4位模型的集成精度可以與其相當或更高,在σ為0.25時,精度提高了1.28個百分點。使用基于SRAM的ACIM架構進行的硬件評估表明,兩個副本的集成模型芯片面積比8位基線小9.0%,但延遲增加了30%,能耗增加了2.1%。我們進一步觀察到,在RRAM和FeFET基ACIM中,其準確性與其非理想特性之間存在一致的權衡關系。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號