色色午夜天,韩色区,色www88

首頁今日動態人才市場新技術專欄中國科學人云展臺
BioHot
云講堂直播會展中心特價專欄技術快訊免費試用

生物通官微
陪你抓住生命科技
跳動的脈搏

生物通首頁 > 今日動態 > 正文

OPTIMAL：基于優化圖神經網絡和圖對比學習的無監督網絡入侵檢測模型

《Computer Networks》：OPTIMAL:Unsupervised Network Intrusion Detection Model Based on Optimized Graph Neural Network and Graph Contrastive Learning

【字體：大中小】 時間：2026年03月01日 來源：Computer Networks 4.6

編輯推薦：

　　基于圖神經網絡的網絡入侵檢測模型優化研究。摘要：針對現有無監督GNN模型檢測精度提升瓶頸，提出OPTIMAL模型。編碼器采用注意力機制篩選關鍵流量特征（如字節統計、時間特征），并改進E-GraphSAGE的鄰域聚合策略抑制長程干擾。解碼器輕量化DGI架構，去除冗余計算。實驗表明，在NF-BoT-IoT-v2等四組數據集上，模型在四類異常檢測算法中均優于SOTA方法， supervised編碼器檢測精度達99.90%。分隔符：

王玉龍|張宇峰|張珠玉|高麗婷|龐輝

河北建筑大學信息工程學院， Zhangjiakou，075000，河北，中國

摘要

大多數現有的基于圖神經網絡（GNN）的無監督網絡入侵檢測模型采用編碼器-解碼器架構。然而，它們的編碼器通常依賴于傳統的GNN模型，沒有結合針對網絡入侵檢測的特定領域優化。因此，當前基于GNN的無監督入侵檢測方法的檢測精度難以進一步提高。為了解決這個問題，本文提出了OPTIMAL模型，該模型由編碼器和解碼器組成。編碼器是一種專門為網絡入侵檢測的特點優化的GNN：它集成了一種注意力機制，根據特征的重要性為流量特征分配不同的權重，并改進了消息聚合公式以減少來自遠距離鄰居的干擾。解碼器采用了圖對比學習模型DGI，同時去除了原始設計中的一些冗余計算以加快學習過程。我們在四個公開可用的基準數據集上進行了廣泛的實驗來驗證所提模型的有效性。例如，在NF-BoT-IoT-v2和NF-ToN-IoT-v2數據集上，OPTIMAL的監督編碼器的檢測精度分別達到了99.90%和98.19%。在NF-UNSW-NB15-v2和NF-CSE-CIC-IDS2018-v2數據集上，完整的OPTIMAL模型在四種異常檢測算法下始終優于當前最先進的模型。所提模型的源代碼現已公開發布在：https://github.com/blueman001-cmd/OPTIMAL。

引言

隨著網絡技術的快速發展，互聯網已經滲透到人們生活的方方面面。然而，網絡的快速增長也伴隨著日益嚴重的安全威脅，對人們的生活構成了潛在風險[1]、[2]、[3]。

傳統的入侵檢測技術主要包括基于規則的檢測、統計分析和機器學習方法[4]、[5]、[6]。這些技術在處理已知威脅時在一定程度上是有效的，但它們也存在顯著的局限性。例如，基于規則的方法難以適應新的攻擊方式，統計分析在識別異常模式方面的能力有限，而傳統的機器學習方法嚴重依賴于大量標記數據，并且難以捕捉網絡數據中固有的復雜拓撲關系。

近年來，圖神經網絡（GNN）[7]因其能夠有效建模網絡結構和節點之間的依賴關系而受到越來越多的關注，為入侵檢測提供了新的研究方向和解決方案[8]、[9]、[10]。大多數現有的基于圖神經網絡的網絡入侵檢測模型都是監督式的[11]、[12]、[13]、[14]。然而，在現實世界的網絡環境中，網絡流量通常是未標記的，而對網絡流量進行標記需要大量的人力和資源。因此，在未標記的網絡環境中準確識別異常網絡流量已成為該領域亟待解決的問題[15]、[16]。現有的基于無監督圖神經網絡的入侵檢測模型大多基于編碼器-解碼器架構，其編碼器通常采用傳統的圖神經網絡模型，沒有針對網絡入侵檢測的特點進行特定優化[17]、[18]、[19]。因此，現有基于無監督圖神經網絡的入侵檢測模型的檢測精度難以進一步提高。

網絡入侵檢測領域具有哪些特點？通過分析常用的基準數據集和網絡攻擊受害者的攻擊過程，我們總結了兩個關鍵特點。

首先，網絡流量特征多種多樣，但并非所有特征都對異常流量檢測有相同的貢獻：以本研究中使用的四個基準數據集為例，每個數據集包含43個特征，這些特征可以大致分為：網絡身份特征（IP地址、端口、ID）、流量統計特征（字節、數據包數量）、時間特征（持續時間）和數據包長度分布特征（例如，最大/最小數據包長度）。從異常檢測機制的角度來看，流量統計特征和時間特征的影響最為顯著。攻擊行為的本質在于異常的通信模式，這兩種特征可以直接表征單位時間內的行為強度和會話建立模式。因此，它們能夠有效捕捉到攻擊的典型“流量形態”，例如DDoS攻擊的高頻小數據包和掃描行為的短暫探測爆發。相比之下，網絡身份特征的影響最小，甚至可能產生負面影響。這些特征描述的是“誰在通信”，而不是“通信是如何發生的”。在訓練過程中，模型可能會容易學習到數據集中某些固定IP或端口與攻擊行為之間的虛假相關性，從而導致強烈的環境依賴性和過擬合。我們在第5.8節通過實驗驗證了我們的觀點。

其次，受害者接收到的異常流量通常來自其直接鄰居，而不是遠距離的鄰居。如圖1所示，A代表受害者，B和D代表攻擊者，E代表正常節點。攻擊者通常采用兩種主要攻擊策略：直接攻擊和間接攻擊。從B到A的路徑代表直接攻擊過程，其中B直接向A發送異常流量。從D到A的路徑代表間接攻擊過程，其中D向C發送控制命令，然后C被操縱向A發送異常流量。無論攻擊是直接的還是間接的，異常流量最終都來自A的直接鄰居。從遠距離鄰居聚合信息可能會引入噪聲，并干擾模型準確識別來自直接鄰居的異常流量的能力。

為了提高編碼器對計算機網絡圖結構的特征提取能力，從而進一步提高無監督模型的檢測精度，本文根據網絡入侵檢測鄰域的上述兩個特點對傳統的圖神經網絡模型進行了優化。對于特點（1），我們設計了一個基于注意力的輸入層，為不同重要性的特征分配不同的權重，增加重要特征的權重同時減少冗余特征的權重，使模型能夠更有效地關注關鍵特征。對于特點（2），我們改進了傳統E-GraphSAGE模型的鄰居聚合過程，使得當圖卷積層的數量增加時，模型僅從附近的鄰居聚合信息，避免來自遠距離鄰居的干擾。

經過上述優化后，本文得到了一個具有強大特征提取能力的編碼器。在解碼器部分，我們采用了圖對比學習模型DGI。此外，通過對DGI模型中圖對比學習過程的分析，我們發現某些計算步驟是不必要的。因此，我們移除了原始DGI模型中的一部分冗余計算，提高了計算效率，從而得到了一個輕量級的DGI模型，作為我們提出的模型的解碼器。我們在四個公共基準數據集上進行了廣泛的實驗來驗證所提模型的有效性。

總結來說，本文的主要貢獻如下：

•

基于注意力的輸入層：我們設計了一個基于注意力的輸入層，為不同重要性的特征分配不同的權重，增加重要特征的權重同時減少冗余特征的權重，使圖神經網絡模型能夠更有效地關注關鍵特征。

•

改進的信息聚合過程：我們改進了傳統E-GraphSAGE模型的鄰居聚合過程，使得當圖卷積層的數量增加時，圖神經網絡僅從附近的鄰居聚合信息，避免來自遠距離鄰居的干擾。

•

輕量級DGI模型：

在原始DGI模型的基礎上，我們移除了冗余計算，減少了計算開銷并提高了計算效率，得到了一個輕量級的DGI模型。

•

有效的編碼器和無監督模型：

優化的圖神經網絡模型作為編碼器，輕量級DGI模型作為解碼器，形成了所提出的無監督網絡入侵檢測模型。在四個公共基準數據集上的廣泛實驗驗證了所提編碼器和無監督模型的有效性。

本文的其余部分組織如下。第2節回顧了基于圖神經網絡的入侵檢測模型的相關工作。第3節介紹了與GraphSAGE模型、E-GraphSAGE模型、DGI模型和異常檢測算法相關的背景知識。第4節介紹了所提出的無監督模型的詳細信息。第5節報告了實驗設置和結果。第6節總結了本文，第7節討論了模型的局限性，第8節提出了未來的工作。

背景知識

為了更好地理解后續模型設計和方法實現的基礎，本節介紹了與本研究密切相關的基礎知識，包括經典圖神經網絡模型GraphSAGE和E-GraphSAGE的信息聚合公式、圖對比學習模型DGI的學習過程，以及本文中使用的四種異常檢測算法的原理。

OPTIMAL模型描述

本節可以分為四個部分。第一部分介紹了如何構建基于邊的計算機網絡流量圖。第二部分介紹了為網絡入侵檢測領域優化的編碼器的詳細設計。第三部分描述了如何簡化圖對比學習模型DGI。第四部分介紹了所提出的無監督OPTIMAL模型的整體工作流程。

實驗

本節從多個角度介紹了實驗設計和分析。首先，我們介紹了實驗中使用的數據集，然后介紹了用于評估模型性能的指標和實驗環境，以及主要參數配置。隨后，在四個公共基準數據集上進行了監督學習和無監督學習實驗，以驗證所提出的編碼器模型和所提出的無監督模型的有效性。

總結

本文提出了一種方法，通過提高編碼器的特征提取能力來提高基于圖神經網絡（GNN）的無監督網絡入侵檢測模型的異常檢測精度。通過分析現有的基準數據集和網絡攻擊中受害者受攻擊的過程，我們確定了網絡入侵檢測的兩個特定領域特點。

局限性

所提出的方法存在幾個局限性。首先，編碼器設計強調局部鄰域交互，通過抑制長距離信息傳播，這可能對于涉及復雜多跳或橫向攻擊行為的入侵場景效果不佳。其次，解碼器的優化僅旨在降低模型復雜性和加速訓練，并不提高檢測精度。

未來工作

在未來的工作中，我們將專注于解碼器，并探索能夠有效提高檢測精度的解碼器架構，從而進一步改進我們的無監督入侵檢測模型。

CRediT作者貢獻聲明

王玉龍：概念化。 張宇峰：數據整理。 張珠玉：形式分析。 高麗婷：撰寫——初稿。 龐輝：撰寫——審閱與編輯。

利益沖突聲明

作者聲明他們沒有已知的競爭性財務利益或個人關系可能會影響本文報告的工作。

熱點排行

新聞專題

聯系信箱：

粵ICP備09063491號

摘要

引言

相關研究