《Digital Signal Processing》:MCRF-Net: a low visible airport runway instance segmentation method based on improved YOLOv8s-seg
編輯推薦:
低可見度場景下機場跑道實例分割方法研究,提出MCRF-Net改進YOLOv8s-seg模型,創新C2MSB模塊融合CSP與Mix結構塊優化模糊區域捕捉,CGB模塊增強上下文信息融合,CRA-Up機制平衡全局上下文與計算效率,FAC2f模塊提升去噪能力。實驗表明在BARS數據集上mAP提升3.81%,優于主流模型。
王爾深|程玉明|徐松|于騰立|曲平平|娜拉|陳云豪
沈陽航空航天大學電子與信息工程學院,中國沈陽,110136
摘要
作為飛機著陸的基礎設施,機場跑道的精確實例分割至關重要。然而,在低能見度場景下對機場跑道進行實例分割面臨許多挑戰,例如光線不足、特征提取困難以及目標尺度的實時變化。為此,我們提出了一種基于YOLOv8s-seg的實例分割方法MCRF-Net。首先,改進了主干網絡中的CSP瓶頸結構(包含2個卷積層C2f),并將Mix結構塊和瓶頸模塊融合在一起,形成了C2f和Mix結構塊的集成(C2MSB),從而優化了模糊區域的捕捉和紋理恢復,并有效處理了低能見度圖像的模糊分布。其次,引入了上下文引導塊(CGB)來替代主干網絡和頸部網絡的原始卷積層,以增強模型融合上下文信息的能力;為了在恢復空間分辨率的同時考慮自注意力的計算效率,設計了通道縮減注意力機制(CRA-Up),該機制通過結合池化和雙線性插值來平衡特征分辨率和效率;最后,提出了一種新的C2f模塊(FAC2f),用于替換模型頸部網絡中的所有C2f模塊,以提高模型的去噪能力。在BARS數據集上的實驗結果表明,與原始模型相比,MCRF-Net的mAP、mAP@0.5和mAP@0.75值分別提高了3.81%、0.65%和2.76%;并且與當前主流的實例分割模型相比,MCRF-Net的準確性表現更好。
引言
在現代航空運輸系統中,安全檢測和識別機場跑道對于飛行安全和更好的機場運營至關重要[1]。飛機著陸是最復雜且不確定的階段。在此過程中,飛行高度和速度會下降。飛行員面臨身體和心理壓力以及視覺疲勞。他們必須控制著陸滑行姿態,并持續觀察跑道的位置[2]。成功著陸需要正確的俯仰角和下降率。飛機必須與跑道中心線對齊并穿過著陸點[3]。對于自主著陸而言,獲得可靠和精確的目標姿態參數至關重要。傳統的著陸引導方法包括儀表著陸系統(ILS)[4]、全球導航衛星系統(GNSS)[5]、精密進近雷達(PAR)[6]和慣性導航系統(INS)[7]。ILS基于精密著陸雷達,廣泛用于有人駕駛飛機的自主著陸。該系統通過雷達跟蹤無人機的位置,并通過數據鏈路將這些數據傳輸給無人機,然后飛行控制系統完成自動著陸[8]。然而,ILS的準確性依賴于雷達測量,并且嚴重依賴地面設備。這種依賴性降低了無人機的自主性[9]。GNSS提供更穩定和準確的信號,其技術成熟,廣泛用于無人機定位。GNSS不需要復雜的地面設備,適用于大面積區域,并且與雷達兼容。它具有良好的長期準確性,但短期準確性較差,容易受到干擾和信號丟失的影響。INS基于慣性原理,通過慣性元件獲取運動狀態,具有良好的自主性和快速的數據更新能力,并覆蓋較大的測量范圍。然而,INS存在累積誤差。航空運輸是全球化時代的關鍵基礎設施,它支持全球經濟活動并連接不同地區的社會。根據IATA 2024年年度報告[10],2024年共有4060萬次航班。航空運輸的安全性和可靠性影響著人們的生命、財產以及貿易的順利進行。為了提高飛機安全性和性能,航空業已經使著陸過程更加自動化,這有助于減少飛行員和無人機的認知和疲勞風險[11]。在能見度較低的情況下,如霧天、暴雨和夜間,清晰的跑道識別[12]對于著陸和滑行[13]至關重要。
為了解決上述問題,本研究采用YOLOv8s-seg作為基礎網絡框架,并實施了針對性的改進。優化的YOLOv8s-seg模型在低能見度場景下保持了具有競爭力的參數數量,同時顯著提高了分割準確性。本研究專注于低能見度場景下機場跑道的實例分割任務,并使用BARS[14]公共機場跑道數據集驗證了先進的YOLOv8s-seg算法。主要貢獻如下:
•我們提出了C2MSB(C2f和Mix結構塊的集成)模塊:通過在主干網絡中CSP瓶頸(包含2個卷積層C2f)的瓶頸處插入混合結構塊,結合Mix結構塊的特征提取、多尺度注意力集成、深度可分離卷積優化以及三級殘差連接的動態塊狀特征融合,我們可以在控制計算成本的同時平衡全局和局部細節的恢復,提高多尺度特征表達能力和計算效率。
•在本研究中,使用上下文引導塊(CGB)替代主干網絡和頸部網絡的原始卷積層,以增強模型捕獲關鍵信息的能力,并在控制參數數量的同時提高機場跑道實例的分割準確性。
•為了平衡全局上下文提取和自注意力計算的效率,使模型能夠快速處理大規模、低能見度的模糊圖像,本研究在主干網絡的SPPF模塊之前引入了通道縮減注意力機制(CRA),并在其平均池化之后添加雙線性插值以放大輸入特征并恢復空間分辨率。
•我們在頸部網絡C2f模塊的瓶頸處兩個原始卷積層之間插入了頻率譜動態聚合(FSDA)模塊,構建了FAC2f模塊,從而提高了YOLOv8s-seg在低能見度圖像中的降噪能力。
相關研究
相關工作
實例分割技術作為計算機視覺的瑰寶,具有目標級定位和像素級解析的雙重任務特性,在機場跑道感知場景中展現出獨特的價值[15]。在低能見度場景下,傳統的視覺檢測方法往往難以有效工作,因此需要先進的圖像處理和模式識別技術來提高機場跑道的檢測和分割準確性。當前的學術研究整體結構
近年來,計算機視覺領域在對象檢測(OD)和實例分割(IS)方面取得了顯著進展。隨著深度學習技術的快速發展,以YOLO(You Only Look Once)[29]為代表的單階段檢測器已成為實時目標檢測的主流解決方案。YOLO因其高效的推理速度和高準確性而受到青睞。實例分割作為計算機視覺的核心任務之一,需要同時進行類別
實驗設置和評估標準
在本研究中,我們基于公開可用的機場跑道實例分割數據集BARS[14]訓練和評估了改進后的模型。公開可用的機場跑道實例分割數據集BARS包含10256張機場跑道圖像,這些圖像使用FAA認證的X-Plane仿真平臺收集,涵蓋了世界上幾乎所有的地形,并基于現實場景設計。BARS數據集從各個機場收集跑道圖像
結論
為了解決低能見度場景下視覺輔助著陸系統中跑道實例分割的挑戰,引入了公開可用的數據集BARS。該數據集涵蓋了各種天氣條件和地理環境,基于現實情況設計,能夠高精度地劃分跑道區域。
在跑道實例分割任務中,提出了創新的MCRF-Net來解決不均勻模糊的問題
代碼、數據和材料的可用性
由于隱私原因,支持本文發現的數據并未公開。作者聲明
王爾深(第一作者):概念構思、方法論、代碼編寫、調查、形式分析、初稿撰寫;程玉明:數據整理、代碼編寫、形式分析、初稿撰寫、審閱與編輯;徐松:可視化、調查;于騰立:資源提供、監督;曲平平:代碼編寫、驗證;娜拉:可視化審閱;陳云豪:調查審閱;王爾深(通訊作者):概念構思、資金獲取、資源提供、監督、撰寫
利益沖突聲明
作者聲明以下可能被視為潛在利益沖突的財務利益/個人關系:如果還有其他作者,他們聲明沒有已知的可能會影響本文所述工作的財務利益或個人關系。