Mango-Mamba 和 VN-MangoLeaf:一種輕量級的 Mamba 模型以及用于芒果葉病分類的新數據集
《Computers and Electrical Engineering》:Mango-Mamba and VN-MangoLeaf: A lightweight Mamba model and New Dataset for Mango leaf disease classification
【字體:
大
中
小
】
時間:2026年03月02日
來源:Computers and Electrical Engineering 4.9
編輯推薦:
芒果葉病害檢測中提出輕量級混合架構MangoMamba,通過多尺度Mamba混合器和大型核注意力機制實現線性計算復雜度,在越南芒果數據集(7000張圖像)上達到98.71%準確率,并可在智能手機上實現1.46ms的實時推理。
Thien B. Nguyen-Tat|Binh Pham-Thanh
越南胡志明市信息技術大學
摘要
芒果葉病對果實品質和產量構成了重大威脅,因此需要高度準確、實時的檢測系統。然而,現有的深度學習方法,尤其是基于Transformer的模型,通常受到計算復雜性的限制(復雜度呈二次方增長),這限制了它們在資源受限的邊緣設備上的應用。為了解決這一挑戰,本研究提出了MangoMamba,這是一種專為移動設備優化設計的輕量級混合架構。該模型在一個分層的四階段框架中集成了多尺度Mamba混合器和大核注意力機制,實現了線性計算復雜度,同時保留了全局感受野。實驗評估在MangoLeafBD數據集和新整理的VN-MangoLeaf數據集上進行,后者包含7000張越南芒果品種的圖像。結果表明,MangoMamba在兩個數據集上的分類準確率分別達到了99.75%和98.71%。重要的是,該模型僅具有580萬個參數,在T4 GPU上的推理延遲為每張圖像1.46毫秒,大約是最近ViX-MangoEFormer架構的80倍快。此外,通過一個能夠在標準智能手機上進行離線推理(延遲100-300毫秒)的功能性Android應用程序,驗證了該方法的實用性。這些發現證實了MangoMamba在智能農業應用中建立了準確性和效率之間的新平衡。
引言
芒果(Mangifera indica L.)的種植是全球農業經濟的重要組成部分,但由于葉部病原體的存在,它面臨著巨大的生產風險。如果管理不當,炭疽病、白粉病和紅銹病等疾病可能導致產量損失超過20%-30% [1]。傳統的疾病管理依賴于病理學家的手動視覺檢查,這一過程勞動密集、主觀性強,并且難以在大果園或資源有限的地區擴展 [2]。因此,開發自動化、準確且實時的疾病檢測系統已成為智能農業的優先事項。
深度學習的最新進展顯著提高了植物疾病診斷的自動化水平。卷積神經網絡(CNNs)[3] [4] 和基于Transformer的架構 [5] [6] 在基準數據集上取得了高分類準確率。然而,由于自注意力機制的存在,這些模型在邊緣設備(如智能手機、嵌入式傳感器)上的實際部署受到計算限制(計算復雜度為),這導致高內存消耗和延遲,使其不適合在互聯網連接不可靠的農村環境中進行實時應用 [2]。
此外,最近的研究展示了先進混合架構在解決性能和計算挑戰方面的潛力。例如,Qin等人[8]提出了CropCapsNet,它將增強的膠囊網絡與Squeeze-and-Excitation Inception模塊結合在一起。這種方法有效地捕捉了多尺度特征,用于作物疾病分類,通過克服傳統CNN中的空間信息損失而實現了顯著的準確率。同樣,Truong等人[9]提出了SC-MambaFew,利用Mamba架構結合選擇性空間通道注意力進行軸承故障診斷。他們的研究強調了基于Mamba的混合架構在少樣本學習場景中高效建模長距離依賴性的能力。然而,盡管這些開創性工作驗證了混合模型的有效性,但它們并沒有明確針對嚴格資源受限的邊緣硬件上芒果葉疾病的微妙、細粒度視覺特征優化Mamba-注意力機制。此外,這些架構研究在跨領域泛化方面對抗地理偏見的問題(這是全球農業的一個關鍵要求)基本上尚未得到解決。本研究基于這些進展來填補這一特定空白。
為了解決計算復雜度高的問題,同時確保高診斷精度,狀態空間模型(SSMs),特別是Mamba架構[10],已成為一個有前途的替代方案。Mamba引入了一種選擇性掃描機制,允許以線性計算復雜度建模長距離依賴性()。最近對Mamba在計算機視覺領域的改進,如MambaVision [11] 和Vision Mamba [12],證明了SSMs在性能上可以與Transformer媲美,同時顯著降低了推理成本。盡管取得了這些進展,但對于輕量級農業疾病分類的混合Mamba-注意力架構的特定優化仍然缺乏探索,F有的輕量級模型往往為了速度犧牲了準確性,或者無法捕捉區分形態相似的芒果葉疾病所需的多尺度特征 [13]。
此外,現有的芒果葉病數據集在地理多樣性方面存在關鍵差距。大多數公共數據集,包括MangoLeafBD [1] 和MLD24 [14],主要來自孟加拉國。這種地理偏見限制了模型在應用于不同芒果品種和疾病流行率地區的泛化能力,例如在越南,紅銹病等病原體更為常見 [15]。
為了填補這些空白,本研究提出了MangoMamba,這是一種專為邊緣設備上高效芒果葉疾病分類設計的輕量級架構。該架構集成了多尺度Mamba混合器以實現線性復雜度的全球上下文建模,并結合了大核注意力(LKA)機制進行局部特征細化。此外,還引入了VN-MangoLeaf數據集以解決區域數據稀缺問題,并通過課程學習策略增強了跨領域泛化能力。
本研究的主要貢獻總結如下:
- 1.
開發了一種專門的混合架構MangoMamba,結合了選擇性狀態空間模型的效率和大核注意力的空間精度。這種設計實現了線性計算復雜度,與基于Transformer的模型相比顯著降低了推理延遲。
- 2.
引入了VN-MangoLeaf數據集,其中包含從越南果園收集的7000張圖像。該數據集通過包含特定于地區的類別(如紅銹病)來減輕地理偏見,使模型評估更加穩健。
- 3.
實施了一種三階段課程學習方法,以促進具有不同類別分布的數據集之間的有效知識轉移,增強了模型對形態變化的魯棒性。
- 4.
廣泛的實驗驗證表明,所提出的模型在MangoLeafBD數據集上的準確率為99.75%,在VN-MangoLeaf數據集上的準確率為98.14%,同時保持每張圖像大約1.5毫秒的推理時間,驗證了其適用于實時移動部署。
數據集概述
數據集概述
現有的用于芒果葉病檢測的公共數據集,如MangoLeafBD [1] 和MLD24 [14],為研究社區提供了寶貴的基準。然而,這些數據集主要來自孟加拉國,這限制了模型在具有不同環境條件和病原體分布的其他地理區域的泛化能力。為了解決這種地理偏見和區域數據多樣性不足的問題,本研究引入了消融研究
為了驗證所提出的MangoMamba架構的有效性,并證明每個組件的合理性,在MangoLeafBD數據集上進行了全面的消融研究。實驗使用了一致的超參數進行了四次獨立運行,以確保統計可靠性。結果總結了Mixer核心、增強模塊(ECA、GRN、SwiGLU)和窗口策略的影響,見表4。
結論
本研究提出了MangoMamba,這是一種輕量級混合架構,有效平衡了芒果葉病檢測的分類準確性和計算效率。通過結合多尺度Mamba混合器和大核注意力,該模型在MangoLeafBD數據集上的準確率達到99.75%,在新整理的VN-MangoLeaf數據集(7000張圖像)上的準確率為98.71%。該模型參數數量僅為580萬個,文件大小為22.2 MB
CRediT作者貢獻聲明
Thien B. Nguyen-Tat:撰寫——審閱與編輯、可視化、監督、方法論、概念化。Binh Pham-Thanh:數據整理、撰寫——原始草稿、可視化、軟件。
數據和代碼的可用性
利益沖突聲明
作者聲明沒有利益沖突。
致謝
本研究得到了VNUHCM-信息技術大學科學研究支持基金的支持。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號