一種適用于智能邊緣設備的45.2微瓦實時ASL手勢識別系統,該系統采用分層自相似二進制神經網絡實現
《IEEE Transactions on Very Large Scale Integration (VLSI) Systems》:A 45.2-μW Real-Time ASL Gesture Recognition System With Hierarchical Self-Similar Binary Neural Network for Smart Edge Devices
【字體:
大
中
小
】
時間:2026年03月02日
來源:IEEE Transactions on Very Large Scale Integration (VLSI) Systems 3.1
編輯推薦:
提出了一種適用于智能邊緣設備的超低功耗實時高精度手語識別系統LRASL,通過六階段先進手部區域分割引擎AHRSE將輸入壓縮至32×32二進制手勢,并采用硬件共享的分層自相似二進制神經網絡引擎HSBNNE,有效解決相似手勢識別難題,在28nm CMOS下實現45.2μW功耗和33.3ms延遲。
摘要:
美國手語(ASL)由于其廣泛的應用潛力而受到了越來越多的關注。本文介紹了一種專為智能邊緣設備設計的超低功耗、實時高精度的ASL識別系統(LRASL)。該系統通過六階段先進的手部區域分割引擎(AHRSE)和硬件共享的層次化自相似二值化神經網絡引擎(HSBNNE)在準確性和功耗之間取得了平衡。AHRSE將640×480 RGB565格式的輸入數據經過六階段處理后壓縮為32×32的二值化手勢數據,實現了98.7%的尺寸縮減,并將HSBNNE的識別準確率提高了1.3%。值得注意的是,提取后的二值化ASL手勢中仍存在相似的手勢,這增加了識別難度并提高了硬件的功耗/資源需求。為了解決這一問題,本文提出了一種新型的微型層次化自相似二值化神經網絡(HSBNN)模型,該模型具有共享層和雙自相似專家分支結構;贖SBNN模型構建的HSBNNN能夠從粗略到詳細地識別ASL手勢(無論是相似的還是不同的手勢),其識別準確率為95.8%,同時僅消耗3.96百萬操作(MOPs)和2.86 KB的參數。自相似專家分支結構實現了硬件資源的最大化重用,降低了硬件開銷和功耗。該系統采用TSMC 28納米CMOS工藝實現,當工作在800 kHz時鐘頻率和0.6 V供電電壓下時,功耗僅為45.2 μW,延遲為33.3毫秒。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號