《Scientific Reports》:CSWin-MDKDNet: cross-shaped window network with multi-dimensional fusion and knowledge distillation for medical image segmentation
編輯推薦:
為解決醫(yī)學(xué)圖像分割中局部細(xì)節(jié)與全局上下文難以兼顧的挑戰(zhàn),研究人員提出CSWin-MDKDNet模型。該研究引入了多維選擇性融合(MDSF)模塊和知識(shí)蒸餾損失(KD-loss),顯著提升了分割精度。在多個(gè)公開(kāi)數(shù)據(jù)集上取得了最優(yōu)性能,為計(jì)算機(jī)輔助診斷提供了新工具。
醫(yī)學(xué)圖像分割是計(jì)算機(jī)輔助診斷系統(tǒng)中的關(guān)鍵步驟,其精度直接影響到疾病檢測(cè)、手術(shù)規(guī)劃和療效評(píng)估的準(zhǔn)確性。然而,傳統(tǒng)的分割方法往往在捕捉精細(xì)的局部結(jié)構(gòu)與理解復(fù)雜的全局上下文之間難以兩全,如同在迷宮中同時(shí)尋找每一塊磚石的紋路和整座建筑的藍(lán)圖,這使得算法在實(shí)際應(yīng)用中面臨瓶頸。特別是在處理器官邊界模糊、病變形態(tài)多變或圖像對(duì)比度低的復(fù)雜醫(yī)學(xué)影像時(shí),現(xiàn)有模型的性能仍有提升空間。為了突破這一瓶頸,一項(xiàng)發(fā)表在《Scientific Reports》上的研究帶來(lái)了新的解決方案。
為了應(yīng)對(duì)上述挑戰(zhàn),該研究團(tuán)隊(duì)開(kāi)發(fā)了一種名為CSWin-MDKDNet的新型網(wǎng)絡(luò)架構(gòu)。其核心思路是結(jié)合Transformer的優(yōu)勢(shì),從特征融合與模型優(yōu)化兩個(gè)維度進(jìn)行創(chuàng)新。在技術(shù)方法上,研究人員主要應(yīng)用了幾個(gè)關(guān)鍵技術(shù):首先,構(gòu)建了基于十字形窗口(CSWin)的Transformer主干網(wǎng)絡(luò),以高效建模遠(yuǎn)程依賴關(guān)系。其次,設(shè)計(jì)了多維選擇性融合(MDSF)模塊,該模塊通過(guò)通道與空間注意力機(jī)制,對(duì)編碼器不同層次提取的多尺度特征進(jìn)行自適應(yīng)精煉與融合,旨在強(qiáng)化重要特征并抑制冗余信息。最后,引入了知識(shí)蒸餾損失(KD-loss),在訓(xùn)練過(guò)程中利用教師網(wǎng)絡(luò)的深層特征指導(dǎo)學(xué)生網(wǎng)絡(luò)的中間層,以緩解深層網(wǎng)絡(luò)中常見(jiàn)的特征退化問(wèn)題,使模型學(xué)習(xí)到更緊湊、更具判別性的特征表達(dá)。研究在三個(gè)公開(kāi)的醫(yī)學(xué)圖像數(shù)據(jù)集上進(jìn)行了評(píng)估,包括用于多器官分割的Synapse(腹部CT)、用于心臟分割的ACDC(心臟MRI)以及用于皮膚病損分割的ISIC2018數(shù)據(jù)集。
研究結(jié)果
- •
模型整體性能優(yōu)越:通過(guò)在Synapse、ACDC和ISIC2018三個(gè)數(shù)據(jù)集上的綜合實(shí)驗(yàn),CSWin-MDKDNet模型在所有評(píng)價(jià)指標(biāo)上均表現(xiàn)出色。其分割結(jié)果在視覺(jué)上更貼合專家標(biāo)注的邊界,定量指標(biāo)也達(dá)到了當(dāng)前最優(yōu)水平。
- •
在多器官CT分割上達(dá)到高精度:在Synapse多器官CT數(shù)據(jù)集上,該模型的平均DSC(Dice相似系數(shù))達(dá)到了81.82%,顯著優(yōu)于對(duì)比的先進(jìn)方法。這證明了該模型在處理不同形狀、大小和對(duì)比度的多個(gè)腹部器官時(shí)的強(qiáng)大泛化能力和魯棒性。
- •
在心臟MRI分割中表現(xiàn)突出:在ACDC心臟MRI數(shù)據(jù)集上,模型取得了91.76%的DSC,展現(xiàn)了其在捕捉心臟腔室復(fù)雜結(jié)構(gòu)方面的卓越性能,對(duì)于心臟功能的定量分析具有重要價(jià)值。
- •
在皮膚鏡圖像分割中驗(yàn)證有效性:在ISIC2018皮膚鏡圖像數(shù)據(jù)集上,模型獲得了91.64%的DSC,表明其方法同樣適用于二維的皮膚病損分割任務(wù),進(jìn)一步證明了所提框架的普適性。
消融實(shí)驗(yàn)驗(yàn)證組件有效性
通過(guò)系統(tǒng)的消融研究,論文逐一驗(yàn)證了各個(gè)核心組件的貢獻(xiàn)。實(shí)驗(yàn)表明,移除MDSF模塊或KD-loss都會(huì)導(dǎo)致模型性能在不同程度上下降,這證實(shí)了多維選擇性融合對(duì)于有效整合多尺度上下文信息的關(guān)鍵作用,以及知識(shí)蒸餾損失對(duì)于減輕深層特征冗余、提升特征質(zhì)量的必要性。
結(jié)論與討論
本研究提出的CSWin-MDKDNet成功解決了醫(yī)學(xué)圖像分割中平衡局部細(xì)節(jié)與全局上下文的核心難題。通過(guò)創(chuàng)新的十字形窗口Transformer架構(gòu)、多維選擇性融合模塊以及知識(shí)蒸餾損失函數(shù)的協(xié)同作用,該模型能夠更精確地分割出醫(yī)學(xué)圖像中的目標(biāo)區(qū)域。其在多個(gè)權(quán)威數(shù)據(jù)集上取得的領(lǐng)先性能,不僅證明了其方法的有效性,也彰顯了其在復(fù)雜醫(yī)學(xué)影像分析任務(wù)中的強(qiáng)大潛力。
這項(xiàng)工作的意義在于,它從網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)和優(yōu)化目標(biāo)兩個(gè)層面提供了新的思路。MDSF模塊為如何更智能地融合多層次特征提供了范例,而KD-loss則為緩解深層神經(jīng)網(wǎng)絡(luò)中的特征退化問(wèn)題提供了實(shí)用的解決方案。這些創(chuàng)新不僅提升了特定任務(wù)的分割精度,其設(shè)計(jì)理念也可遷移至其他醫(yī)學(xué)圖像分析乃至更廣泛的計(jì)算機(jī)視覺(jué)任務(wù)中。該研究為開(kāi)發(fā)更準(zhǔn)確、更可靠的計(jì)算機(jī)輔助診斷工具奠定了堅(jiān)實(shí)的技術(shù)基礎(chǔ),有望在未來(lái)助力臨床醫(yī)生提升診斷效率和一致性,最終惠及患者。