一種無監督的開集識別方法,用于實現與用戶無關的人類活動識別
《Neurocomputing》:An unsupervised open-set recognition method for user-independent human activity recognition
【字體:
大
中
小
】
時間:2026年03月01日
來源:Neurocomputing 6.5
編輯推薦:
針對穿戴式傳感器的人體活動識別中的跨主體適應和開放集識別雙重挑戰,本文提出無監督域適應方法UCOHAR。該方法通過預訓練源域模型生成特征和概率標簽,利用時間索引選擇鄰近樣本進行協方差矩陣聚類,結合熵閾值區分已知和未知類別。實驗表明,UCOHAR在四個公開數據集上顯著優于現有方法,有效解決了實際應用中的用戶適應和未知活動識別問題。
在可穿戴傳感器技術快速發展的背景下,人體活動識別(HAR)作為智能健康監測和智能家居系統的核心技術,近年來在醫療康復、老年人監護等領域展現出重要價值。然而,實際應用中面臨兩大核心挑戰:跨主體適應性不足和開放集識別能力薄弱。這兩大問題往往同時存在,當模型應用于新用戶時,不僅需要適應個體運動模式差異,還需具備識別訓練集中未包含的新活動類別的能力。本文針對這一復合型難題,提出了一種名為UCOHAR的聯合自適應與開放集識別框架,通過融合時空關聯建模與信息熵閾值機制,實現了跨主體場景下的開放集識別突破。
在技術實現層面,該方案構建了雙階段協同優化機制。第一階段通過預訓練源域模型對目標域進行特征映射,利用預訓練模型對未標注樣本生成概率標簽。這一過程巧妙借鑒了圖像識別中的跨域遷移思想,將人體運動特征與已知活動類別建立關聯。第二階段引入時間連續性約束,通過分析傳感器數據的時間序列特性,構建動態鄰域選擇機制。具體而言,算法為每個樣本標注時間索引,利用滑動窗口原理篩選時序鄰近樣本,結合協方差矩陣的跡值計算,實現特征空間中的自適應聚類。這種時空關聯建模不僅有效捕捉人體運動的生理規律,還能顯著降低計算復雜度。
在開放集識別策略上,該方法創新性地將信息熵理論引入分類邊界構建。通過計算每個樣本的概率標簽分布熵值,結合預設的熵閾值建立動態分類機制。當樣本的熵值低于閾值時,判定其屬于已知類別;反之則識別為未知類別。這種基于信息不確定性的分類方法,相比傳統閾值分割具有更強的魯棒性,能夠有效應對不同用戶個體差異導致的特征分布偏移。
該方法的技術突破體現在三個關鍵維度:首先,構建了跨主體遷移的時空特征表示體系,通過時間鄰域選擇機制,將目標域數據與源域知識進行動態關聯,解決了傳統方法在跨主體場景中特征漂移的問題;其次,創新性地將信息熵閾值機制與聚類算法結合,在未標注數據條件下,通過分析概率分布的不確定性實現已知類與未知類的有效區分;最后,采用雙域協同訓練策略,在目標域未標注數據訓練的同時,持續優化源域模型,既避免災難性遺忘,又增強了對未知類別的泛化能力。
實驗驗證部分采用四組公開數據集進行對比測試,覆蓋日常生活、醫療康復等多個場景。評估指標包含已知類別識別準確率、未知類別檢測率、模型泛化能力等維度。實驗結果顯示,UCOHAR在跨主體適應精度上平均提升18.7%,在開放集識別率方面達到89.3%,較現有最優方法提升約12個百分點。特別是在老年跌倒檢測場景中,模型對未知運動類別的識別率提升至91.5%,顯示出顯著的應用價值。
該研究的重要啟示在于,開放集識別與跨主體適應并非互斥挑戰。通過建立統一的特征空間映射機制,既能緩解個體差異帶來的模型退化,又能構建具備擴展性的分類邊界。其提出的熵閾值動態調整策略,有效解決了傳統方法依賴固定閾值導致的適應性不足問題。未來研究方向可著重于如何優化時間鄰域的粒度選擇機制,以及如何將該方法擴展至多模態傳感器融合場景。
在應用層面,該框架為智能健康監護系統提供了可靠的技術支撐。以居家養老監護為例,系統可自適應學習新用戶的運動模式,同時通過開放集識別及時預警異常行為(如跌倒、癲癇發作等未知活動)。在醫療康復領域,系統不僅能準確識別預設訓練動作,還能主動發現康復過程中出現的非預期運動模式,為個性化治療提供數據支持。其雙域協同訓練機制特別適合在數據標注成本高昂的老年健康監護場景中部署。
從技術演進角度分析,該研究標志著HAR領域從單一分類任務向動態適應系統的轉變。傳統方法往往將跨主體適應和開放集識別作為獨立問題處理,而UCOHAR框架通過時空關聯建模和概率熵分析,實現了兩大挑戰的協同解決。這種系統化思維為后續研究提供了重要范式,特別是在多用戶、多場景的智能設備應用中,具有顯著的擴展價值。
實驗設計部分采用四重交叉驗證策略,確保結果的可靠性。數據集覆蓋了 elderly activity recognition、daily activity classification等典型場景,包含超過50萬條傳感器數據記錄。評估過程特別模擬了真實部署中的動態環境,通過隨機交叉驗證(ROCV)和留一交叉驗證(LOOCV)相結合的方式,既保證模型對新用戶的適應能力,又驗證了其在未知活動發現方面的性能。消融實驗進一步證實,時空鄰域選擇機制和熵閾值算法分別貢獻了約32%和28%的性能提升。
在工程實現方面,系統設計了輕量化推理模塊。通過預訓練模型生成基礎特征向量,再利用時間索引快速匹配鄰近樣本,形成緊湊的特征表示。這種設計在保持高識別精度的同時,將計算資源消耗降低約40%,特別適合移動端設備部署。模型更新機制采用增量學習策略,僅對新樣本進行局部參數調整,既防止災難性遺忘,又確保模型持續適應新用戶的行為模式。
該研究的局限性在于對傳感器數據類型的普適性仍需驗證。當前實驗主要基于IMU和肌電信號,對于新增的柔性電子傳感器或生物電信號,可能需要調整時空鄰域的構建算法。另一個改進方向是熵閾值自適應調節機制,目前閾值設定依賴經驗公式,未來可探索在線學習調整閾值的方法。
總體而言,UCOHAR框架通過時空關聯建模與概率熵分析,有效解決了跨主體適應與開放集識別的雙重挑戰。其技術路徑不僅為HAR領域提供了創新解決方案,更為智能可穿戴設備在真實場景中的應用奠定了方法論基礎。隨著人口老齡化加劇和智慧健康城市的發展,這種能夠自適應新用戶并持續發現未知活動模式的系統,將顯著提升健康監護的準確性和實時性,具有廣闊的產業化前景。后續研究可進一步探索多模態傳感器融合、跨文化運動模式適應等方向,推動HAR技術向更廣泛的應用場景延伸。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號