《Frontiers in Oncology》:Ultrasound-based artificial intelligence for breast lesion classification
編輯推薦:
本綜述聚焦人工智能(AI)在乳腺超聲領域的最新進展,特別是其在病灶良惡性分類與分級診斷中的應用。文章不僅探討了機器學習(ML)、深度學習(DL)和卷積神經網絡(CNN)等核心技術,還系統分析了影像組學、可解釋人工智能(XAI)以及以S-Detect為代表的商業化計算機輔助診斷(CAD)系統的現狀。作者指出,盡管AI在研究中展現了高精度潛力,但其從實驗室邁向臨床仍面臨重大挑戰,包括缺乏對非腫塊型病灶(約占惡性病變的15–20%)的診斷研究、生成式AI(GenAI)臨床驗證不足,以及商業CAD系統多中心有效性數據有限。全文強調,必須通過前瞻性多中心試驗、解決數據異質性以及將XAI與臨床工作流深度融合,才能實現AI向穩健、可推廣的臨床工具的切實轉化。
人工智能照亮乳腺超聲診療之路
在全球范圍內,乳腺癌是女性中最常見的惡性腫瘤。及時、準確的篩查對于改善患者預后至關重要。乳腺超聲,作為一種無電離輻射、適用于致密型乳腺的重要診斷工具,其應用價值日益凸顯。然而,傳統的超聲診斷高度依賴操作者經驗,并存在解讀的主觀差異性。人工智能(AI)的興起,特別是其在醫學影像分析領域的應用,為解決這些問題帶來了革命性的希望。
AI技術的全景概覽
人工智能通過其分支技術,如機器學習(ML)和深度學習(DL),正在徹底改變醫學影像的分析模式。與需要手動提取特征的ML相比,DL及其核心架構——卷積神經網絡(CNN)能夠從原始數據中自動學習多層次、抽象的特征,尤其適用于圖像識別任務。CNN通過卷積、池化等操作,高效提取并保留了圖像的空間關系,使其在乳腺超聲圖像分析中表現出色。近年來,生成式AI(GenAI)嶄露頭角,它不僅能生成高質量的合成圖像以擴充訓練數據集,還能用于圖像去噪和增強,直接提升圖像質量與診斷信心。影像組學(Radiomics)則通過從圖像中高通量提取定量特征,結合AI算法,將圖像信息轉化為可量化的“生物標志物”,為病灶分類和預后預測提供了新的客觀依據。
AI在乳腺超聲中的具體應用
在乳腺超聲實踐中,AI的應用主要圍繞兩大核心任務:病灶檢測與良惡性分類。基于B型超聲(B-US)的圖像,AI模型能夠自動分析病灶的形態、邊緣、回聲等特征。更為先進的研究則結合了剪切波彈性成像(SWE)等新技術,通過量化組織硬度等生物力學特性,進一步提升診斷的客觀性。
大量的研究表明,AI模型在區分良惡性病灶方面可以達到與經驗豐富的放射科醫生相當甚至更高的準確性。例如,一些研究報道,基于CNN的模型在區分良惡性病灶時,其曲線下面積(AUC)可超過0.90。然而,這些令人矚目的結果大多來自單中心、回顧性的研究,其普適性仍需在更廣泛、更多樣化的臨床環境中加以驗證。
一個特別值得關注的領域是非腫塊型病灶的診斷,這類病灶約占乳腺惡性腫瘤的15%至20%,形態不典型,是超聲診斷的難點。研究表明,基于MobileNet等輕量級DL模型,能夠有效提升對此類不典型病灶的診斷能力,展現了AI在處理復雜病例中的潛力。
可解釋AI:打開算法“黑箱”
深度學習模型雖強大,但其決策過程常被視為“黑箱”,這阻礙了臨床醫生對其的信任和采納。可解釋人工智能(XAI)技術的發展旨在解決這一問題。例如,梯度加權類激活映射(Grad-CAM)等技術能夠生成“熱力圖”,直觀地顯示模型在做決策時關注的圖像區域。這不僅能驗證模型的決策是否基于正確的影像學特征(如病灶邊緣、微鈣化),而非圖像偽影,還能幫助研究人員發現和修正算法中的偏差。SHAP(沙普利加性解釋)等基于博弈論的方法,則可以量化每個輸入特征對最終預測的貢獻度。盡管XAI提高了模型的透明度,但如何將其生成的解釋與臨床醫生的專業術語和認知框架無縫對接,仍是未來研究的關鍵。
商業CAD系統:從研究到臨床的橋梁
以S-Detect和KOIOS DSTM為代表的商業化計算機輔助檢測與診斷(CAD)系統,標志著AI技術向臨床實際應用邁出了重要一步。這些系統通常內置于超聲設備或作為獨立工作站,能夠在圖像采集時或之后,為放射科醫生提供實時或離線的“第二意見”。研究顯示,這類系統,特別是對于經驗較少的醫生,能夠顯著提高診斷特異性,減少不必要的穿刺活檢,并改善不同觀察者之間和同一觀察者自身診斷的一致性。
例如,S-Detect軟件通過自動或手動勾畫病灶感興趣區域(ROI),并分析其內部特征,能提供良惡性的可能性評估。多項研究證實,在S-Detect的輔助下,放射科醫生對乳腺病灶的分類準確性,尤其是在BI-RADS 4a這類不確定性病灶的管理上,得到有效提升。KOIOS系統則重新定義了基于BI-RADS的風險評估層級,其決策支持有助于優化活檢建議,提高活檢陽性率。
然而,這些商業系統也面臨挑戰。它們的診斷性能可能因設定的BI-RADS風險閾值不同而波動,并且對致密型乳腺組織的診斷效能可能有所下降。最重要的是,缺乏大規模、前瞻性的多中心研究數據來全面評估其在各種真實臨床場景下的有效性和穩定性。
跨越鴻溝:挑戰與未來方向
盡管前景廣闊,但將AI從研究原型轉化為穩健可靠的臨床工具,仍存在顯著障礙,這構成了當前最主要的“轉化鴻溝”。
首先,是數據與泛化性的挑戰。目前絕大多數高精度AI模型都是在單一機構、特定設備和患者群體的回顧性數據上訓練和驗證的。當這些模型應用于不同醫院、不同型號的超聲設備或不同人種的患者時,其性能可能出現顯著下降,這種現象被稱為“域偏移”。解決這一問題的關鍵在于推動高質量、多中心、前瞻性數據集的構建,并采用聯邦學習等技術在不集中數據的前提下進行模型訓練,以及開發域自適應算法來提升模型的魯棒性。
其次,是臨床驗證與評估標準的缺失。未來的研究需要超越單純的診斷準確性指標(如AUC、靈敏度、特異度),轉而關注更具臨床意義的終點。例如,AI輔助是否能真正減少不必要的短期隨訪和良性活檢率?是否能提高放射科醫生的診斷信心和讀片一致性?是否能縮短從篩查到治療的時間?只有通過設計嚴謹的前瞻性臨床試驗來回答這些問題,才能證明AI的臨床效用和價值。
最后,是整合與信任的建立。成功的臨床部署要求AI系統能夠無縫集成到現有工作流程中,這涉及到用戶界面設計、與醫院信息系統的對接以及標準化報告框架的適應。同時,建立明確的醫療法律和倫理框架,以界定AI輔助診斷中的責任與問責,并確保算法決策的公平性與無偏性,對于獲得醫生和患者的廣泛信任至關重要。
結論
人工智能為乳腺超聲的精準診斷開啟了一扇新的大門。從傳統的影像組學特征分析,到強大的深度學習自動特征提取,再到旨在提升透明度的可解釋AI,技術正在飛速演進。商業CAD系統的出現,標志著AI開始從實驗室走向診室。然而,要跨越從“表現出潛力”到“成為臨床常規”之間的鴻溝,我們必須正視并系統性地解決數據異質性、臨床驗證 rigor、工作流整合以及倫理法規等一系列挑戰。未來的道路需要工程師、臨床醫生、醫院管理者和監管機構的緊密協作,共同推動人工智能在乳腺超聲乃至整個醫學影像領域,實現其提升人類健康的終極使命。