具有頻率感知能力的全球-局部選擇性注意力網絡,用于激光焊接點檢測
《Neurocomputing》:Frequency-aware and global-local selective attention network for laser welding spot detection
【字體:
大
中
小
】
時間:2026年03月02日
來源:Neurocomputing 6.5
編輯推薦:
激光焊接點檢測中,針對小尺寸焊點、模糊邊界和復雜光照問題,提出FGSNet框架。該框架通過通道 shuffle卷積保留淺層紋理,全局-局部門控注意力平衡語義與局部結構,自適應多尺度特征融合對齊表征,結合小波自注意力模塊增強高頻邊緣細節,最終實現高效精確的分割檢測。實驗表明其IoU達84.19%,F-score91.41%,優于傳統方法。
龔玲|張帆|段連|趙玉倩|段建
中南大學精密制造極端服役性能國家重點實驗室自動化學院,中國長沙410083
摘要
激光焊接技術在高精度制造中起著關鍵作用,然而,微小的焊點尺寸、模糊的邊界以及劇烈的光照變化等問題始終影響著檢測的可靠性。為了解決這些問題,本研究提出了FGSNet,這是一種高效的分割框架,旨在通過統一的特征交互策略來提升激光焊接點的識別能力。FGSNet將五個互補的組件整合到一個連貫的流程中。在特征編碼階段,通道混合卷積模塊被用來有效保留細粒度的淺層紋理,而全局-局部門控注意力模塊則通過平衡全局語義和局部結構線索來協同過濾背景干擾。為了緩解尺度變化,自適應多尺度特征融合模塊執行強大的跨層交互,以保持結構的一致性。為了解決邊界模糊的問題,引入了頻率感知的細化策略通道混合注意力融合模塊,在解碼器中加入小波自注意力模塊,明確利用小波變換來強化高頻邊緣細節。通過這種協調機制,FGSNet逐步細化了不規則焊接點的紋理、語義、多尺度和頻率信息。在工業激光焊接數據集上的實驗表明,FGSNet的IoU達到了84.19%,F分數達到了91.41%,在復雜光照條件下的邊緣保留和魯棒性方面優于主流方法。
引言
激光焊接技術以其高精度、高效性和適應性而聞名,廣泛應用于航空航天、汽車和電子等行業[1]。與傳統的方法(如電弧焊或電子束焊)相比,激光焊接具有精確的熱控制能力,減少了缺陷。然而,焊接點通常很小、形狀不規則,并且容易受到復雜成像條件的影響[2],這使得自動檢測變得具有挑戰性。缺陷如弱焊點、氣孔、裂紋和穿透不足[3],[4]會顯著影響部件的機械強度。傳統的檢測方法(如機器視覺[5]、聲發射和紅外熱成像[6])在速度、準確性和對復雜環境的魯棒性方面存在局限性。來自照明變化和反射表面的不均勻照明進一步降低了檢測精度。
深度學習的快速發展為激光焊接點檢測帶來了有希望的解決方案。卷積神經網絡(CNN)以其強大的特征提取能力而聞名,在這一領域取得了顯著的成功[7]。UNet架構通過其多尺度特征融合機制,在檢測小尺度激光焊接點方面表現出高精度[8]。CycleGAN通過生成器和判別器之間的對抗訓練,即使在沒有配對數據的情況下也能生成與真實圖像風格相似的偽樣本,從而豐富了數據集的多樣性并提高了模型的泛化能力[9]。ResNet通過利用殘差連接進一步增強了網絡的穩定性,并有效地捕捉了激光焊接點區域的邊緣和紋理細節[10]。
盡管CNN在焊接點識別方面取得了進展,但仍存在關鍵挑戰。由不同照明條件和反射表面引起的不均勻照明會掩蓋焊點特征并降低精度,而焊接點的小尺寸和不規則形態以及在雜亂背景中的存在使得精確定位變得困難。解決這些問題需要提高模型對照明變化的魯棒性,并加強細尺度特征表示,以滿足工業檢測的精度要求。最近的研究展示了頻域分析[11]和協同注意力機制[13]、[14]在解析高度變化場景中的潛力。
為了解決這些問題,本研究提出了FGSNet,這是一個針對激光焊接點檢測設計的頻率感知的全局-局部選擇性注意力網絡。FGSNet結合了五個互補模塊:通道混合卷積(CSC)、全局-局部門控注意力(GLGA)、自適應多尺度特征融合(AMFF)、小波自注意力模塊(WSAM)和通道混合注意力融合(CHAF),這些模塊共同增強了淺層紋理、加強了多尺度特征交互,并細化了語義表示。如圖1所示,與僅在空間域操作的常規架構不同,FGSNet明確將高頻小波組件整合到注意力機制中,使網絡能夠恢復細邊緣、抑制照明引起的偽影,并實現更具區分性的特征聚焦。在工業數據集上的全面實驗表明,FGSNet在復雜成像條件下的準確性和魯棒性明顯優于現有方法。
與現有的分割模型相比,主要貢獻如下:
(1)FGSNet旨在通過建立分層特征交互流程來處理小目標和弱邊緣。我們整合了五個專用模塊,逐步增強淺層紋理,對齊多尺度特征,并細化頻率感知邊界。
(2)CSC通過分組卷積和通道混合有效地增強了淺層紋理,而GLGA通過門控融合將全局語義與局部細節相結合,以抑制背景干擾。AMFF隨后執行自適應跨尺度對齊和融合,減少空間錯位并減輕小目標的消失。
(3)CHAF注入拉普拉斯金字塔頻率注意力以增強對細微邊界敏感的線索,而WSAM在解碼器中執行小波域分解和基于注意力的高頻邊緣細節重建。這些頻率感知組件共同改善了低對比度和不均勻照明條件下的輪廓描繪,這是其與僅基于空間增強的流程的關鍵區別。
(4)所提出的方法在激光焊接點檢測數據集上進行了驗證。實驗結果表明,在背景復雜性和激光焊接點尺寸較小的挑戰性條件下,其具有高準確性和穩定性。
相關工作
相關研究
目前,基于機器視覺的表面激光焊接點檢測方法大致可以分為兩類:傳統的基于視覺的方法和基于深度學習的方法。
整體架構
FGSNet建立了一個統一的特征增強框架,該框架整合了紋理保留、語義整合和頻率感知的細化。該架構的結構確保了模塊之間的邏輯依賴性,使淺層細節和深層語義逐步得到細化和有效融合,如圖2和算法1所示。編碼過程從CSC模塊開始,該模塊提取
數據集
本研究使用的數據集是從實際工業生產線收集的,用于激光焊接過程中的光學組件(25 Gbps TOSA)[40]。圖8展示了真實的激光焊接系統和組件的結構,包括激光焊接設備、光學組件本身以及焊接點的示意圖。圖像采集使用了高分辨率的工業相機
與現有方法的比較
我們將所提出的方法與幾種經典和最先進的語義分割方法在之前描述的激光焊接點檢測數據集上進行了比較。為了確保公平性,所有方法都在相同的設置和策略下進行了訓練。我們選擇了一組代表性的基線模型進行比較,包括UNet [18]、PSPNet [19]、DeepLabV3+ [20]、HRNet [21]、FastFCN [22]、CAWANet [23]、BiSeNetV2 [24]、SegFormer [41]、PIDNet [42] 和 SeaFormer [43]。所提出的FGSNet
局限性
盡管FGSNet在整體性能上表現出色,但在復雜場景中仍存在挑戰。當原始圖像受到嚴重照明偽影的影響時,基于GAN的預處理模塊可能無法保留精細的結構細節,從而影響后續的分割。如圖17所示,失敗主要是由于強烈的背景偽影導致檢測遺漏,以及多個焊接點的干擾降低了分割效果
結論
本研究提出了FGSNet,這是一個旨在解決實際激光焊接點檢測中精度與速度之間權衡的高效分割網絡。該架構的卓越性能歸功于五個核心模塊的協同整合,它們形成了一個連貫的處理流程。具體來說,通道混合卷積(CSC)作為輕量級的骨干,最小化了參數冗余,同時確保了高效的特征提取。為了應對
CRediT作者貢獻聲明
趙玉倩:可視化。段連:資源獲取。段建:資金籌集。張帆:寫作 – 審稿與編輯。龔玲:寫作 – 原始草稿。
利益沖突聲明
作者聲明他們沒有已知的財務利益或個人關系可能影響本文所述的工作。
致謝
本研究由中南大學精密制造極端服役性能國家重點實驗室項目資助(項目編號ZZYJKT2024-09)。
龔玲目前正在中南大學攻讀碩士學位。他的研究興趣包括圖像處理、計算機視覺和模式識別。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號