《Computers and Electrical Engineering》:A novel lightGBM model for arabic spam detection integrated with XAI for enhanced explainability
編輯推薦:
本研究提出結合LightGBM與可解釋人工智能(XAI)的阿拉伯垃圾郵件檢測框架,通過SHAP和LIME量化模型可解釋性,在壓縮至20維的TF-IDF特征空間下實現93.01%準確率、94%精確率及93%召回率,驗證了特征壓縮與可解釋性并重的有效性。
Mohamed Aly Bouke | Omar Imhemed Alramli | Alsadg Ahmed Albadwi Abdalhafid | Azizol Abdullah
馬來西亞普特拉大學計算機科學與信息技術學院通信技術與網絡系,Serdang 43400,馬來西亞
摘要
阿拉伯語垃圾郵件檢測面臨技術挑戰,這些挑戰源于語言的多樣性、特征稀疏性以及可解釋分類系統的有限可用性。許多機器學習模型缺乏內在的可解釋性,從而降低了決策的透明度。本研究提出了一種垃圾郵件檢測流程,該流程將LightGBM與集成解釋層相結合。通過嵌入SHAP和LIME來直接將可解釋性納入評估過程,以量化解釋行為。該系統通過在壓縮的特征空間中操作來針對阿拉伯文本數據的特征。從最初的100維TF-IDF表示中,選擇了20個統計上最穩定的特征用于實驗設計。在這種配置下,模型實現了93.01%的準確率、94%的精確度和93%的召回率,以及93%的F1分數,保持了精確度和召回率的平衡。與表現出非對稱精確度-召回率行為的基線分類器相比,所提出的模型在阿拉伯文本上產生了穩定的分類性能。解釋層使用一致性度量來評估,該度量衡量LightGBM特征重要性與歸因分數之間的排名一致性。所得的一致性值(SHAP = 0.726,LIME = 0.3806)表明,SHAP解釋與模型內部特征排名具有更高的排名一致性,而LIME捕捉到了更多的局部變化。研究結果表明,在特征減少的情況下,預測性能仍然可以得到保持,并且解釋行為可以定量評估。
引言
垃圾郵件通常被理解為在互聯網上傳播的未經請求或無關的信息,它已經演變成一個普遍的問題,超出了單純的煩惱范疇。最初僅限于電子郵件,垃圾郵件已經擴散到各種數字平臺,包括社交媒體和消息應用程序。垃圾郵件的普遍性影響了用戶體驗,并構成了嚴重的網絡安全威脅。惡意垃圾郵件可能攜帶惡意軟件、網絡釣魚鏈接和其他有害元素,使得這個問題既令人煩惱又具有安全性風險[[1], [2], [3]]。
在這種背景下,當考慮阿拉伯語時,垃圾郵件檢測的挑戰變得更加嚴峻。阿拉伯語是一種復雜而豐富的語言,具有復雜的語法規則、眾多的方言以及從右向左書寫的文字系統。這些復雜性為垃圾郵件檢測任務增加了多層難度。此外,阿拉伯語資源相對稀缺,特別是用于機器學習(ML)應用的標記數據集,這使得開發有效的垃圾郵件過濾器變得更加具有挑戰性[[4], [5], [6], [7]]。在解決方案領域,人工智能顯著改變了垃圾郵件緩解策略,其中ML算法發揮了關鍵作用。這些ML模型分析大量數據集中的模式,從而能夠基于這些模式進行預測或決策[8,9]。
然而,針對阿拉伯語垃圾郵件的ML應用仍處于成熟階段,需要專門的研究來適應和優化這些算法以應對阿拉伯語的復雜性[[10], [11], [12]]。到目前為止,重要的是要注意,ML模型的有效分類能力往往是以犧牲可解釋性為代價的。這些模型,特別是像神經網絡這樣的復雜模型,經常因其“黑箱”性質而受到批評,其決策背后的邏輯仍然不清楚。在具有安全影響的情境中(如垃圾郵件檢測),缺乏可解釋性可能是一個關鍵缺點。了解為什么某條消息被歸類為垃圾郵件對于開發更強大的安全協議可能非常有用[[13], [14], [15]]。
為了解決這個問題,可解釋人工智能(XAI)作為一種關鍵方法出現,旨在提高ML模型的透明度、可理解性,最重要的是問責性。諸如Shapley加性解釋(SHAP)和局部可解釋模型不可知解釋(LIME)等技術被用來解構ML模型的決策過程[16]。這些技術通過揭示對決策影響最大的特征,增強了人們對模型的信任,并為迭代改進提供了途徑[[17], [18], [19]]。
因此,本文的主要目標是解決開發有效且可解釋的阿拉伯語垃圾郵件檢測ML模型的雙重挑戰。本文提出了一種新型模型,將Light梯度提升機(LightGBM)的預測能力與XAI技術提供的透明度相結合。這種集成方法旨在為阿拉伯語垃圾郵件檢測設定新的標準,平衡準確性和可解釋性。
本文的其余部分組織如下:第2節介紹研究目標。第3節回顧了垃圾郵件檢測和可解釋AI的相關工作。第4節描述了所提出的模型及其設計。第5節詳細介紹了方法論,包括預處理、特征提取和評估程序。第6節報告了實驗結果和比較分析。第7節總結了本文。
研究目標
基于前一節中概述的挑戰,阿拉伯語垃圾郵件檢測需要評估框架,這些框架同時考慮分類性能和可解釋性[[5], [6], [7]]。許多現有研究強調預測準確性,而沒有系統地測量解釋行為。本研究采用聯合評估視角,將可解釋性視為模型評估的一個組成部分。為了應對這些挑戰,本研究的目標是:
•開發
文獻綜述
阿拉伯語數字通信的迅速擴展加劇了垃圾郵件檢測和阿拉伯語文本分類的研究。與資源豐富的語言不同,阿拉伯語自然語言處理必須解決形態學豐富性、方言多樣性和正字法變異性問題,這些問題增加了特征稀疏性并使統計建模變得復雜。因此,阿拉伯語垃圾郵件檢測研究與預處理、特征表示和數據集構建的進步密切相關。
提出的模型
本節描述了所提出的阿拉伯語垃圾郵件檢測模型,如算法1所示。該模型結合了LightGBM [35,36]分類器和使用SHAP和LIME的集成可解釋性。目標是構建一個在同一框架內評估預測性能和解釋行為的分類流程。
LightGBM的主要目標是最小化函數損失。給定個數據點((x1,y1),(x2,y2),…, (xn,yn)),其中xi是特征,yi是標簽,
方法論
該方法論遵循一個結構化的流程,旨在在兩個并行目標下評估阿拉伯語垃圾郵件檢測:預測性能和可解釋性。整個研究框架如圖1所示,包括數據準備、特征工程、模型構建、可解釋性集成和評估。
結果與比較
模型有效性是通過系統基準測試來評估的,而不僅僅基于架構描述。所提出的LightGBM–XAI框架與LR、RF、SVM、KNN和MNB進行了多指標評估,以評估預測性能和可解釋性。
準確率被報告為一個總體性能指標,但由于類別不平衡,單獨考慮準確率是不夠的。因此,還包括了精確度和召回率以揭示非對稱錯誤
結論
本研究引入了一個基于LightGBM的阿拉伯語垃圾郵件檢測框架,該框架明確優先考慮穩定性、可解釋性和特征效率,而不是原始維度。實驗結果表明,在故意壓縮的特征空間內可以實現有競爭力的分類性能。僅使用最初100維TF-IDF表示中的20個排名特征,所提出的模型實現了93.01%的準確率、94%的精確度和93%的召回率
資金聲明
不適用。
利益聲明
作者之間沒有利益沖突。
數據可用性聲明
附加信息
本文沒有其他附加信息。