利用遷移學習和基于物理的融合技術,實現緩慢移動且體積較小的水下目標的少量樣本識別
《Ocean Engineering》:Few-shot recognition of slowly moving and small underwater targets with transfer learning and physics-informed fusion
【字體:
大
中
小
】
時間:2026年02月28日
來源:Ocean Engineering 5.5
編輯推薦:
水下緩慢移動小目標識別中,基于物理信息的少數樣本學習框架FUSTR-Net通過多域特征交互融合、方位散射特性引導分類和靜態-動態域自適應策略,顯著提升目標識別準確率,實驗驗證其即使在樣本量降至40時仍保持73.32%的高識別精度。
嚴武|楊陽|范俊|王斌
教育部海洋智能裝備與系統重點實驗室,上海交通大學,上海200240,中華人民共和國
摘要
對于緩慢移動且體積較小的水下目標進行少樣本識別具有挑戰性,因為這些目標尺寸小、速度低,在現實環境中出現頻率低,并且特征不明顯,這進一步增加了識別的難度。在主動感知水下小型目標時,由于海水的阻礙,數據采集成本高昂且困難;此外,由于聲納系統的分辨率和精度較低,可利用的特征也有限。盡管深度神經網絡能夠學習到具有區分性的表示,但來自小型目標的回波樣本稀缺,限制了網絡的性能。通過充分利用多種特征類型以及關鍵的物理先驗,可以減輕少樣本情況下的識別精度下降問題。本文提出了FUSTR-Net,這是一種基于物理知識的遷移學習方法,用于緩慢移動和小型水下目標的少樣本識別。FUSTR-Net整合了時間、頻率和時間-頻率域的表示,并將方位角相關的散射信息作為潛在先驗。為了解決訓練集和測試集分布不匹配的問題,使用多核最大均值差異算法最小化了特征空間中的跨域距離,從而減少了樣本差異引起的偏差,并提高了對移動目標的泛化能力。實驗中收集了包括無人水下航行器(UUV)和潛水員在內的代表性小型目標的靜態和動態數據,并構建了用于評估的靜態和動態數據集。當每個類別的訓練樣本數量減少到40個時,FUSTR-Net在移動目標識別任務上的準確率仍能達到92.24%;即使樣本數量進一步減少到20個,準確率仍保持在73.32%。這些結果表明,結合多域特征和物理先驗可以有效緩解數據稀缺問題,并在少樣本條件下提升識別能力。
引言
水下小型目標識別(USTR)已成為水下聲學領域的一項重要任務,特別是在軍事監視、水下救援和自主導航等場景中,對智能感知的需求不斷增長(Aslam等人,2024年)。目前,小型目標主要通過高頻成像聲納進行檢測。雖然高頻聲納具有較短的探測范圍和較強的散射能力,但結構和材料信息往往被忽略。與大型目標或船舶輻射噪聲相比(Hummel等人,2024年),小型水下目標(如UUV和潛水員)產生的回波信號較弱,信噪比(SNR)較低,使得準確檢測和識別尤為困難。海洋環境的復雜性和標記數據的有限性(Chungath等人,2023年;Wang等人,2022年)進一步加劇了這些問題,從而阻礙了傳統機器學習方法的直接應用。
該領域的早期研究主要依賴于從聲學信號中手工提取的特征。這些方法利用領域知識設計了時間、頻率或時間-頻率域的特征(例如能量熵和小波系數)(Li等人,2016年;Qiao等人,2021年;Wei等人,2023年)。盡管在特定條件下這些特征具有可解釋性和有效性,但作為主要表示方式時,它們難以泛化且需要手動調整,限制了實際應用中的可擴展性和魯棒性。此外,手工設計的特征提取流程通常繁瑣,不適合自動化或自適應系統。
深度學習的興起為水下目標識別提供了新的動力(Jiang等人,2024年;Williams等人,2016年;Xu等人,2023年;Zhou等人,2023年)。特別是卷積神經網絡(CNN)和變換器,具有強大的表示學習能力,能夠從原始輸入中自動提取高級特征(Doan等人,2020年)。深度學習已成為聲學信號識別的主要工具。然而,對于小型水下目標來說,獲取足夠的標記數據進行訓練仍然是一個主要瓶頸(Ghavidel等人,2022年)。與一般的音頻任務不同,收集水下聲學樣本成本高昂且耗時。在大多數現實場景中,這導致樣本數量有限,嚴重限制了依賴大規模數據集的深度網絡的性能。
為了解決上述問題,最近的研究嘗試結合手工特征和深度特征,旨在在一定程度上保持可解釋性的同時提高表示能力(Ke等人,2020年;Zhang等人,2022年;Zhang等人,2023年)。不同的融合策略產生了截然不同的識別結果。大致上,這些方法分為兩類:第一類方法并行提取手工特征和深度特征,然后將其連接或加權求和以獲得最終表示(Feng等人,2024年;Zhang等人,2021年);第二類方法采用串行設計,先計算手工特征,再將其輸入網絡進行深度提取。這是因為神經網絡對輸入數據具有一定的敏感性。如果對輸入數據進行預處理以增強顯著成分并抑制干擾,網絡可以更穩定、更高效地學習深度表示,尤其是在少樣本條件下。此外,注入關鍵先驗以指導網絡訓練非常重要。
即使在同一類型的小型水下目標中,它們的物理屬性也存在差異。例如,UUV的尺寸從小到大不等,且通常是金屬制成的。潛水員是生物實體,其裝備包括干式或濕式潛水服、氧氣面罩和鰭。幾何形狀、內部結構和材料的差異導致主動聲納回波隨方位角變化。因此,方位角是影響識別準確性的關鍵因素。傳統流程通常將目標方位角作為預處理步驟來輔助識別,但這種方法高度依賴于方位角估計的準確性,如果估計失敗,識別效果會下降。研究表明,在訓練過程中將方位角信息作為潛在變量引入可以顯著提高識別性能(Oh等人,2020年;Zhao等人,2024年)。然而,結合關鍵方位角信息的機制應根據具體問題進行定制。
在探測移動小型目標時,主動聲納受到截面限制、姿態和入射角快速變化以及高頻波束范圍狹窄的影響。因此,有效的回波僅出現在非常小的角度窗口內。觀測時間短以及每個方位角下的回波稀疏導致樣本總量不足。相比之下,靜態目標數據在多個方位角和范圍內更容易獲取,可以構建完整的散射特性以輔助檢測和決策。這種全角度信息可以通過測量或基于物理的模擬獲得。使用靜態數據進行訓練是一個合理的選擇,但由于運動引起多普勒效應、輻射噪聲增加和頻譜變化(Xiang等人,2023年),同一目標的移動和靜態數據可能會表現出不同的分布(Gao等人,2023年;Sun和Boukerche,2018年),這種不匹配會導致特征偏移,需要加以緩解(Yang等人,2024a)。
為了解決方位角敏感性和移動目標識別中的少樣本問題,本研究提出了一種基于少樣本的水下小型目標識別網絡(FUSTR-Net),包括一個“特征提取”主干網絡和一個“分類”頭部,具有明確的模塊化過渡以確保信息流動。在主干網絡中,嵌入了一個多域交互式特征融合模塊(MDIF),將時間-頻率表示作為主線,并設置了時間和頻率域分支。通過差異加權實現跨域交互,MDIF抑制了冗余相關性,增強了互補敏感性,從而產生了更具區分性的多域特征。在分類器中,一個全方向散射引導的分類器(OSGC)在貝葉斯框架內將方位角作為先驗,通過聯合學習類別條件概率子網絡和方位角概率子網絡來明確整合方位角相關的散射信息到最終決策中。為了應對移動目標樣本的稀缺問題,采用了靜態到移動域的適應策略,其中靜態目標構成源域,移動目標構成目標域。特征對齊損失最小化了兩個域之間的分布差異,實現了從靜態場景到移動場景的知識遷移?傊,所提出的FUSTR-Net充分利用了時間和頻率信息的互補性,在整個分類過程中結合了方位角先驗,保持了在少樣本條件下對移動小型目標識別的魯棒性能。本研究的主要貢獻如下:
(a)提出了一個用于水下移動小型目標少樣本識別的遷移學習框架FUSTR-Net。其創新之處在于集成了多域交互式特征融合、在分類階段顯式注入方位角相關散射先驗以及靜態到移動域的對齊策略?蚣苤鞲删W絡包含MDIF模塊,以獲得更具區分性的表示。分類器采用OSGC,使方位角散射差異能夠主動影響最終決策。為了解決移動樣本稀缺問題,建立了從靜態對象到移動對象的特征遷移機制,從而減少了樣本分布不一致性引起的偏差。
(b)為水下小型目標識別任務構建了專門的數據集,涵蓋了靜態和移動目標。
(c)在構建的數據集上進行的廣泛實驗證明了所提出的FUSTR-Net的有效性。
相關工作
相關研究
在水下聲學小型目標識別中,常見的做法是將回波轉換為時間頻率表示,然后使用深度神經網絡進行分類。這種選擇是由于時間域中信息結構的信噪比通常較低、顯著性較弱,以及序列長度較長,不利于高效學習。Li等人(2022年)提出了頻譜圖變換器模型(STM),并系統地比較了多種特征提取方法,
小型目標的物理特性分析
本節分析了小型目標的物理特性。目標類型之間的差異主要源于尺寸、材料和測試條件的不同。本研究重點關注了四種代表性水下小型目標:UUV、潛水推進器(DPV)、潛水員和標準半球形鼻圓柱體。目標的尺寸和材料參數在表1中進行了總結。這四種目標在規模上具有可比性。
方法論
本節介紹了所提出的FUSTR-Net,這是一種基于遷移學習的架構,如圖3所示。FUSTR-Net包括三個子模塊:多域特征提取、全方向散射引導的分類器和特征遷移。在移動目標識別的遷移學習設置中,靜態目標樣本作為源域,移動目標樣本作為目標域。模型以目標的時間域信號作為輸入進行訓練
實驗
所有計算實驗都在配備有Intel i7-12700 CPU、NVIDIA RTX 2080Ti GPU和32 GB RAM的個人計算機上進行。網絡訓練、驗證和測試在Python環境中使用PyTorch深度學習框架和CUDA 11.8進行加速。優化器使用AdamW,批量大小為32。初始學習率設置為0.0001,如果連續20個周期內準確率沒有提高,則減半。識別
結論
本文提出了一種新穎的FUSTR-Net架構,用于在主動聲學條件下進行高效的水下移動小型目標識別。該方法強調有效利用多域物理特征、整合散射線索以及易于獲取的靜態數據,以增強樣本有限的移動目標的識別能力。具體而言,MDIF模塊在特征提取過程中實現了多域特征的深度交互融合,從而增強了
CRediT作者貢獻聲明
嚴武:撰寫——原始草案、方法論、研究、形式分析。楊陽:撰寫——審閱與編輯、驗證、監督、資金獲取。范。概念化。王斌:項目管理。
利益沖突聲明
作者聲明他們沒有已知的財務利益或個人關系可能影響本文所述的工作。
致謝
本工作得到了中國聲學科學技術實驗室穩定支持基金(項目編號JCKYS2024604 SSJS005)的支持。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號