《Intelligence-Based Medicine》:DSCBAM-Net: A dual-attention deep learning framework for retinal vessel segmentation and feature-driven vascular analysis
編輯推薦:
視網膜血管的精確分割是眼科影像分析的基礎,但薄血管、低對比度血管的識別仍是挑戰。本研究提出DSCBAM-Net,一個輕量化的雙注意力深度學習框架,集成通道與空間注意力機制和多尺度擴張卷積特征編碼,以增強血管表征。該架構采用混合損失函數解決類別不平衡,并在分割后提取形態學特征,用于視網膜靜脈阻塞(RVO)的檢測與嚴重程度分級。在合并數據集上取得了0.82的Dice分數,在DRIVE、STARE和CHASE-DB1數據集上表現出優異的跨數據集性能,為視網膜血管分析及下游診斷任務提供了高效、可解釋的解決方案。
在探索眼睛這扇“靈魂之窗”的奧秘時,視網膜扮演著至關重要的角色。這塊位于眼底的光敏組織,不僅負責捕捉視覺信息,其內密布的血管網絡更是反映全身健康狀況的“鏡子”。血管的形態、寬度、彎曲度等細微變化,常常是糖尿病視網膜病變、青光眼、年齡相關性黃斑變性等多種眼部疾病乃至系統性疾病的早期信號。因此,精準地勾勒出視網膜血管的“地圖”——即視網膜血管分割,成為醫學影像分析中一項不可或缺的基礎任務。
然而,繪制這幅精細的血管地圖絕非易事。視網膜血管形態復雜,從粗大的主干到細如發絲的毛細血管,對比度差異懸殊,再加上眼底圖像常存在光照不均、背景噪聲等問題,使得傳統方法往往“力不從心”。盡管深度學習,尤其是U-Net及其變體,已在該領域取得顯著進展,但一個核心矛盾依然突出:如何在保持高分割精度的同時,降低模型的計算負擔,使其能在臨床實際環境中快速、高效地部署?此外,許多模型在識別薄血管和低對比度血管時表現不佳,導致分割結果出現斷裂或遺漏,這直接影響了下游疾病分析的準確性。更令人遺憾的是,多數研究止步于分割本身,未能將分割出的血管形態特征與具體的臨床診斷(如視網膜靜脈阻塞的風險評估)緊密聯系起來,造成了分析與決策之間的“斷鏈”。
為了破解這些難題,Rajatha和D.V. Ashoka在《Intelligence-Based Medicine》上發表了他們的研究成果。他們開發了一個名為DSCBAM-Net的輕量化雙注意力深度學習框架,旨在實現高效、精確的視網膜血管分割,并進一步將分割結果用于特征驅動的血管分析,特別是視網膜靜脈阻塞的檢測與分級。他們的核心目標是:設計一個在計算效率和分割性能間取得優異平衡的模型,并打通從像素級分割到可解釋性臨床風險評估的完整通路。
研究人員為開展這項研究,主要應用了以下幾項關鍵技術方法:首先,他們構建了一個合并數據集,整合了DRIVE、STARE、CHASE-DB1、HRF、ARIA、FIVES這六個公開視網膜數據集,共計1076張圖像,以增強模型的泛化能力。其次,他們設計了一套包括CLAHE對比度增強、伽馬校正、綠色通道增強和輕度銳化的預處理流水線,以提升血管可見度。再次,他們采用了包括水平/垂直翻轉、旋轉、仿射變換、亮度對比度調整、彈性變形在內的豐富數據增強策略。在模型架構上,他們提出了DSCBAM-Net,其核心創新在于:1) 在編碼器中引入擴張卷積以擴大感受野,捕獲多尺度上下文信息;2) 集成SCSE(空間與通道擠壓激勵)注意力塊,對特征進行通道和空間維度的自適應重校準;3) 在編碼器路徑中嵌入輕量化的雙CBAM(Convolutional Block Attention Module)注意力模塊,實現多尺度的通道與空間注意力聚焦。最后,他們設計了一個復合混合損失函數,融合Dice損失、Focal-Tversky損失和Top-k損失,以應對前景(血管)與背景的類別不平衡問題,并強調難分割的血管像素。
研究結果
1. 消融研究與基線模型對比
在合并數據集上對多種骨干網絡(ResNet, DenseNet, EfficientNet, InceptionNet, U-Net)及U-Net變體(CBAM-UNet, SA-UNet, TransUNet等)進行對比實驗。結果顯示,標準U-Net在參數量(7.8M)和每輪訓練時間(30秒)上具有優勢,且取得了較好的Dice分數(0.6028)。在眾多注意力增強的U-Net變體中,TransUNet取得了最高的Dice分數(0.6533),但其參數量(19.8M)和訓練時間(220秒/輪)也最高。這凸顯了開發一個既輕量又高性能的模型的必要性。
2. DSCBAM-Net的架構與性能
提出的DSCBAM-Net架構包含三個階段。第一階段是血管分割網絡,其編碼器-解碼器結構集成了擴張卷積、SCSE塊和雙CBAM-Lite模塊,以增強對薄血管的特征學習。該模型在合并數據集上取得了0.82的Dice分數,展現出卓越的分割性能。在跨數據集測試中,DSCBAM-Net在DRIVE、STARE和CHASE-DB1數據集上分別取得了0.879、0.890和0.883的Dice分數,證明了其強大的泛化能力。
3. 血管形態學特征提取與RVO分析
第二階段,從分割出的血管掩碼中提取了六項定量的形態學特征作為生物標志物,包括:血管密度、骨架長度、分形維度、管徑變異、非灌注比率和不對稱指數。第三階段,利用這些特征訓練了一個多層感知機(MLP)分類器,用于視網膜靜脈阻塞的檢測與嚴重程度分級。該模塊能夠輸出RVO存在的概率,并根據概率閾值將其分級為輕度、中度或重度,同時提供基于特征貢獻度的解釋性報告,增強了臨床決策的可信度。
研究結論與討論
本研究成功提出了DSCBAM-Net,一個專為視網膜血管分割設計的輕量、高效且性能強大的深度學習框架。該模型通過巧妙融合擴張卷積、SCSE注意力和雙CBAM-Lite注意力機制,顯著提升了對薄血管和低對比度血管的捕獲能力,同時在參數量和計算時間上保持了優勢,解決了高性能與高計算成本之間的傳統矛盾。
更重要的是,本研究超越了單一的分割任務,構建了一個從精準分割到可解釋性診斷的完整分析流水線。通過提取血管的形態學特征并用于RVO的風險分層,研究展示了如何將分割結果轉化為具有臨床意義的生物標志物,為自動化、定量化的眼科疾病篩查與評估提供了新思路。模型中集成的可解釋性層,能夠闡明各項形態學特征對最終分類決策的貢獻,有助于增加臨床醫生對人工智能輔助診斷系統的信任。
綜上所述,DSCBAM-Net不僅為視網膜血管分割任務提供了一個新的技術解決方案,其“分割-特征提取-風險評估”的一體化設計理念,也為其他醫學影像分析領域(如神經影像、皮膚鏡圖像分析)中連接低層視覺任務與高層臨床決策提供了有益的范本。這項工作朝著開發更智能、更可靠、更貼近臨床需求的醫療人工智能工具邁出了堅實的一步。