增強薄弱環節,協調強勢部分:一種用于跨機器故障診斷的聯邦增強型迭代學習框架
《Neurocomputing》:Strengthen the weak, align the strong: A federated enhanced iterative learning framework for cross-machine fault diagnosis
【字體:
大
中
小
】
時間:2026年03月01日
來源:Neurocomputing 6.5
編輯推薦:
Xiaoxi Hu等提出Federated Enhanced Iterative Learning(FedEIL)框架,通過迭代聯邦通信和自適應權重融合算法解決工業故障診斷中的非獨立同分布數據與本地缺失標簽問題,在保護隱私前提下提升跨設備診斷精度。
Xiaoxi Hu|Hengjun Wang|Yuhan Huang|Junyi Li|Huan Wang|Yiming He
摘要
在工業故障診斷中,隱私法規和商業機密性阻礙了跨客戶的數據共享,導致不同企業之間存在分散的數據孤島。聯邦學習(FL)提供了一種有前景的解決方案,它可以在不交換原始數據的情況下實現協作模型訓練,從而克服了數據不可訪問性的根本障礙。然而,實際部署面臨兩個關鍵挑戰:(i)非獨立同分布(non-IID)的特征分布和(ii)客戶端本地缺失標簽的故障模式。這些挑戰限制了傳統并行聯邦聚合的有效性,因此需要一種更加交互式的客戶端間通信方式。為此,我們提出了一個聯邦增強迭代學習(FedEIL)框架,用于跨機器故障診斷,該框架采用了一種迭代聯邦通信方案,增強了信息交換,并減輕了由非獨立同分布引起的特征偏移。此外,我們提出了一種漸進加權融合(PWF)算法,該算法能夠自適應地調整聚合權重,以增強特征提取和全局泛化能力,從而在客戶端本地缺失標簽的故障類型下提高識別性能。在多個工業數據集上的實驗表明,所提出的框架在保持數據隱私的同時,實現了更高的跨機器準確率,優于現有的先進FL方法,證明了其在物聯網(IoT)場景中的優越性。
引言
在現代工業物聯網(IoT)中,不同企業、工廠和邊緣設備產生了大量的故障相關數據[1]。然而,由于嚴格的隱私法規、專有所有權和商業機密性,這些數據無法在組織間直接共享[2]。這種企業間的數據孤島迫使大多數企業僅使用自己的本地資源進行模型訓練,從而降低了模型性能[3]。
聯邦學習(FL)通過允許在不交換原始數據的情況下進行協作模型訓練,為解決數據孤島問題提供了有前景的解決方案[4]、[5]、[6]。通過FL,每個參與者可以共同構建一個全局診斷模型,捕捉更全面的故障模式,同時確保數據隱私。例如,Mehta等人[7]設計了一個用于旋轉機械復合故障診斷的FL框架。He等人[8]提出了一個用于機器級電機的聯邦跨機器診斷框架。Becker等人[9]展示了FL在邊緣端基于自動編碼器的故障診斷中的可行性。Zhang等人[10]引入了一種用于聯邦領域泛化的調整策略。Wang等人[11]在云-邊緣協作下結合了知識和無偏語義屬性,以減輕統計偏差。Hu等人[12]將監督對比學習納入聯邦過程,以更好地對齊本地和全局表示。Li等人[13]提出了一種基于模型和實例級別共識的聯邦學習方案,以提高模型性能,并在實驗室軸承數據集上進行了驗證。Yu等人[14]提出了一個基于卷積自動編碼器的聯邦框架,用于軸承故障診斷,旨在減輕客戶端與云聚合器之間的傳輸負擔。這些研究為在確保隱私和安全性的同時應用FL進行工業故障診斷提供了寶貴的見解。
然而,在實際的工業應用中部署現有的FL方法仍然面臨兩個持續存在的挑戰:
1.非獨立同分布(non-IID)的特征分布:不同企業之間的設備類型、操作條件和控制邏輯的不可避免差異導致了數據分布的不一致性[15],從而降低了診斷模型的性能。
2.異構性偏差。在現實世界的工業部署中,參與聯邦故障診斷的客戶端在注釋完整性方面往往存在不一致性:一些客戶端具有相對全面的故障類別覆蓋范圍,而資源受限的客戶端缺乏某些類別的數據。這種異構性偏差使得全局聚合偏向于具有更完整標簽覆蓋范圍的客戶端,從而削弱了具有缺失類別的客戶端的泛化能力,最終降低了聯邦學習在多種工業故障類型下的診斷性能。
為了克服這些挑戰,本文提出了一種新的聯邦增強迭代學習(FedEIL)框架,用于跨機器故障診斷,該框架采用了一種迭代聯邦通信模式,而不是傳統的并行聯邦聚合。這種架構允許在不同的客戶端之間流動本地權重,以增強信息交換并減輕由非獨立同分布引起的特征偏移。為了應對異構性偏差,我們提出了一種漸進加權融合(PWF)算法,通過自適應地調整參與聯邦聚合的模型的權重來增強特征提取和全局泛化能力?傮w而言,在聯邦訓練的早期階段,性能較弱的客戶端的模型權重會被增強,以鼓勵它們的數據特征為共同特征做出貢獻,這被稱為熱身階段。隨著訓練周期的增加,具有更高診斷性能和優化一致性的模型的權重逐漸增加,這被稱為過渡階段。在多個工業數據集上的實驗表明,所提出的框架在保持數據隱私的同時,實現了更高的跨機器準確率,為多企業協作下的跨機器工業故障診斷提供了實用且有效的技術途徑。
本文的主要創新點如下:
1.提出了一種新的FedEIL框架,用于跨機器故障診斷,該框架考慮了客戶端展示非獨立同分布數據分布和異構性偏差的更現實的協作場景。
2.設計了一種PWF算法,用于在聯邦訓練下自適應控制模型權重聚合,該算法通過減少梯度沖突和整合新興故障信息,同時減輕了跨客戶分布差異的負面影響,并提高了在客戶端本地缺失標簽條件下識別故障的能力。
3.廣泛的實驗表明,所提出的框架在聯邦環境中實現了更高的跨機器診斷準確率,有效處理了非獨立同分布數據分布和異構性偏差場景。
本文的結構如下:第2節描述了所提出的FedEIL框架。第3節介紹了數據集和評估指標。第4節介紹了實驗設置、實驗結果和分析。最后,第5節總結了本文并概述了未來的研究方向。
章節片段
提出的FedEIL框架
為了解決非獨立同分布數據分布和異構性偏差的挑戰,我們提出了一個基于FedEIL的診斷框架,該框架能夠在保持數據隱私的同時實現知識的自適應傳播。本節介紹了該框架的設計動機和實現細節。然后,介紹了所提出的FedEIL框架和PWF算法的詳細信息。
數據集描述
為了模擬跨異構工業環境的聯邦故障診斷并評估所提出的FedEIL框架,我們使用了三個不同的真實世界振動信號數據集來構建了三個非獨立同分布的客戶端。具體來說,我們采用了CWRU [16]、SEU [17]、[18] 和JNU [19] 數據集,每個數據集代表一個具有獨特機器類型、傳感器布局和故障特征的客戶端。
CWRU數據集由凱斯西儲大學收集,其中包含了
實驗設置
實驗是在一個配備了Linux操作系統(內核版本:3.10.0-1160.90.1.el7.x86_64)的高性能計算平臺上進行的。硬件配置包括一個運行在2.10 GHz的Intel(R) Xeon(R) Gold 6230R CPU、一個NVIDIA A100 GPU和251 GB的系統內存。軟件環境包括Python 3.9.21和PyTorch 2.4.1+cu124。
實驗任務設置
為了評估所提出的FedEIL框架在客戶端本地缺失標簽故障場景下的泛化能力,我們
結論
本研究提出了一個基于FedEIL的故障診斷框架,專門用于跨機器場景,重點關注非獨立同分布數據分布和異構性偏差這兩個關鍵挑戰。通過在FedEIL中引入迭代聯邦機制,以及一個自適應的熱身階段和一個一致性感知階段,該框架有效地解決了分布偏移問題,并增強了模型檢測新故障模式的能力。在三個真實世界的軸承數據集上的廣泛實驗表明
CRediT作者貢獻聲明
Xiaoxi Hu:撰寫 – 審稿與編輯,撰寫 – 原稿,資源,方法論,調查。Hengjun Wang:撰寫 – 原稿,可視化,軟件,方法論,調查。Yuhan Huang:撰寫 – 審稿與編輯,監督。Junyi Li:可視化。Huan Wang:驗證,監督。Yiming He:撰寫 – 審稿與編輯,監督,方法論。
利益沖突聲明
作者聲明他們沒有已知的可能會影響本文報告工作的競爭性財務利益或個人關系。
致謝
本研究得到了廣西科學技術重大計劃(Guike AB22035008)的支持。
Xiaoxi Hu在中國北京交通大學獲得了交通信息工程與控制專業的博士學位。他目前是清華大學車輛與移動學院的博士后研究員。他是多個著名期刊的審稿人,包括TITS、TMECH、TSMC、TTE、TII(審閱了320篇TIM論文)、ISJ、MSSP、AEI、IF、RESS、EAAI、ESWA、MEA和MST。他還是IEEE國際智能會議的AE
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號