《Frontiers in Oncology》:Ultrasound viscosity imaging empowers BI-RADS: toward precise breast lesion diagnosis and analysis of HER2 status
編輯推薦:
本文探討了超聲粘度成像(UVI)在乳腺病灶良惡性鑒別及人類表皮生長因子受體2(HER2)狀態無創評估中的應用價值。研究發現,將UVI衍生的最優粘性參數(V2.max)與乳腺影像報告和數據系統(BI-RADS)結合,能顯著提升診斷性能。此外,研究首次揭示了病灶周圍粘度參數與HER2陽性狀態之間的潛在關聯,為無創評估關鍵治療靶點提供了新思路。
引言
乳腺癌是全球女性健康面臨的一項重大挑戰。早期篩查和個性化治療對于改善患者預后至關重要。目前,組織活檢雖然是區分乳腺病灶良惡性的金標準,但其侵入性不適于大規模篩查。作為主流的篩查手段,乳腺X線攝影也存在局限性,例如醫療資源受限以及在致密型乳房中敏感性顯著降低。超聲乳腺攝影作為補充,顯示出相當的臨床價值。其中,超聲彈性成像被推薦作為BI-RADS的輔助手段,通過測量剪切波速度來間接推斷組織彈性,從而提高傳統超聲的敏感性和特異性。
然而,傳統超聲彈性成像基于生物組織表現為純彈性固體的假設。實際上,生物組織具有粘彈性特性,剪切波傳播速度會隨頻率增加而增加(即頻散現象),這不可避免地在臨床實踐中引入偏差。超聲粘度成像(UVI)的發展解決了這一局限。它通過獲取多個頻率下的組織剪切波速度,并擬合到諸如Voigt模型的流變學模型中,從而計算定量的粘性參數(VPs),提供了對組織生物力學性質更全面的評估。先前研究已證實VPs與肝纖維化、炎癥反應以及慢性腎病密切相關,突顯了其在評估實質器官病理方面的臨床潛力。
截至目前,僅有有限數量的研究探討了UVI在區分乳腺病灶良惡性方面的價值。Jia等人的多中心研究系統地分析了UVI,創新性地將選出的最優粘性參數作為輔助評分來調整BI-RADS類別,證明了UVI的潛力。然而,該研究存在局限,例如沒有開發新的、可解釋的診斷模型,也未有研究分析VPs與人類表皮生長因子受體2(HER2)狀態之間的相關性。因此,有必要對UVI在評估乳腺病灶方面的價值進行進一步研究。
材料與方法
研究對象:這項回顧性研究納入了2024年12月至2025年5月期間在醫院接受常規超聲乳腺攝影和UVI檢查,并隨后獲得芯針活檢或手術病理結果的258名女性患者,共計274個乳腺病灶。病灶被隨機以7:3的比例分為推導隊列和驗證隊列。其中89個病灶進行了HER2檢測,并根據免疫組織化學(IHC)/熒光原位雜交(FISH)結果分為陽性組和陰性組。
圖像采集與分析:由兩名經驗豐富的超聲醫師使用邁瑞Resona A20s超聲系統進行圖像采集。所有操作均標準化,患者取仰臥位。首先進行常規超聲成像,并根據病灶特征(如大小、形態、邊緣、鈣化)分配定量BI-RADS評分。隨后切換至UVI模式,調整取樣框,在患者屏氣、探頭穩定接觸皮膚的情況下采集圖像。圖像需滿足運動穩定性指數≥4星和可靠性指數≥95%的標準。使用系統內置的Shell軟件包在灰度超聲圖像上勾畫病灶輪廓,分析病灶核心以及周圍1毫米和2毫米的邊緣區域,基于Voigt模型和剪切波頻散(SWD)模型計算VPs。所有VP值均為三次連續測量的平均值。
病理學評估:收集所有患者的芯針活檢和手術切除病理報告,包括病理診斷和HER2狀態結果。根據病理診斷將病灶分為良性或惡性。對于HER2評估,IHC評分為3分定義為HER2陽性,0或1分為陰性,2分病例需進一步進行FISH檢測。所有評估均由兩名經驗豐富的病理醫生獨立完成。
亞組分析:病灶大小和患者年齡是疾病評估的基本參數。本研究將最大直徑≤20毫米的病灶定義為小病灶,年齡≤45歲的患者定義為年輕組。基于這些標準,評估模型在不同亞組(按病灶大小和患者年齡分層)中的診斷性能。
統計分析:使用Boruta算法從推導隊列的40個VPs中篩選出用于區分良惡性病灶的最優VP。隨后構建了兩個二元邏輯回歸模型:原始BI-RADS模型(BI-RADS-O)和BI-RADS結合最優VP的模型(即粘度修正的BI-RADS模型,BI-RADS-V)。通過受試者工作特征曲線下面積(AUC)、校準曲線、Brier評分、Hosmer-Lemeshow(H-L)檢驗、凈重分類改善(NRI)、綜合判別改善(IDI)和決策曲線分析(DCA)等多個領域評估模型性能。使用廣義估計方程進行敏感性分析以評估患者內病灶聚類的影響。在推導隊列中完成所有分析后,在驗證隊列中驗證BI-RADS-V的泛化能力。最后,對所有VPs進行單變量邏輯回歸分析,探索其與HER2狀態的關聯。
可重復性分析:使用每個病灶的三次連續測量值,通過雙向隨機效應模型計算絕對一致性的組內相關系數(ICC)來評估關鍵超聲粘度參數的觀察者內可重復性。
結果
人口統計學特征:在推導隊列和驗證隊列中,惡性組的年齡、病灶直徑和BI-RADS評分均顯著高于良性組(p < 0.05)。在推導隊列中,除V1.mean、A’V1.mean、A’V2.mean、Dmin、D1.min、D2.min、A’D1.min和A’D2.min外,所有VPs均顯示出統計學顯著差異(p < 0.05)。而在驗證隊列中,僅有21個VPs(包括Vmax)顯示出顯著差異。
最優VP的選擇:除A’V2.sd外,幾乎所有VP都表現出強多重共線性。基于Boruta算法的變量重要性分析證實,在初始的40個候選VP中,有20個對區分乳腺病灶良惡性具有重要價值,包括V2.max、A’V2.max和V1.max。其中,V2.max(定義為基于Voigt模型的病灶周圍2毫米邊緣內的最大粘度值,單位Pa·s)具有最高的重要性評分,因此被選中與BI-RADS一起構建組合診斷模型(BI-RADS-V)。
預測模型的開發與性能評估:模型性能指標總結顯示,BI-RADS-V的AUC顯著高于BI-RADS-O(0.96對0.91;DeLong檢驗,p < 0.001)。此外,BI-RADS-V展現出更高的敏感性(89.8%對80.5%)和特異性(88.7%對82.3%)。NRI(0.282)和IDI(0.179)進一步量化了其顯著改善。H-L檢驗表明兩個模型的預測概率與觀測概率之間均無顯著偏差(p > 0.05)。BI-RADS-V的校準曲線更接近對角線參考線,且獲得了更低(更優)的Brier評分(0.076對0.116)。DCA顯示,在廣泛的閾值概率范圍內,BI-RADS-V的凈收益曲線始終高于BI-RADS-O,凸顯了其更優的臨床效用。敏感性分析證實了BI-RADS-V模型的穩健性。在驗證隊列中,BI-RADS-V表現出最小的性能退化,AUC為0.94,敏感性為91.5%,特異性為83.8%,校準良好且Brier評分為0.102。
亞組性能分析表明,BI-RADS-V在所有預設的患者亞組中均保持較高的診斷效能(AUC > 0.90)。具體而言,在病灶大小亞組中,≤20毫米病灶的AUC為0.93,>20毫米病灶的AUC為0.99,差異具有統計學意義(p = 0.007)。大病灶組的敏感性和特異性也更高。在年齡亞組分析中,≤45歲組的AUC為0.98,>45歲組為0.95,差異無統計學意義(p = 0.356),敏感性和特異性結果也相當。
HER2狀態與VPs的關聯:單變量分析發現五個VPs在名義水平上(p < 0.05)在HER2陽性和陰性組間存在顯著差異,其中四個(V1.max, V2.max, A’V1.max 和 A’V2.max)與HER2陽性狀態顯著相關。在對40個VPs進行多重比較的Bonferroni校正后(顯著性閾值設為p < 0.00125),只有V2.max仍與HER2狀態顯著相關(p < 0.001),其比值比(OR)為1.75,顯示出最強的關聯。
觀察者內可重復性:對于關鍵粘度參數V2.max的觀察者內可重復性分析顯示出極佳的可靠性,絕對一致性的ICC為0.908,表明經驗豐富的超聲醫師對此參數的測量具有高度一致性。
討論
本研究得出了兩個主要結論:首先,將BI-RADS與最優VP(V2.max)相結合,能夠增強對乳腺病灶良惡性的鑒別能力,并展現出優異的泛化性。其次,據我們所知,這是首批提示VPs與HER2狀態存在相關性并探索其潛在解釋的研究之一。
Boruta算法的重要性評分顯示,源自Voigt模型的VP排名高于基于SWD模型的VP,在20個被歸類為“重要”的參數中,有13個源自Voigt模型。這種差異可能歸因于復雜的Voigt模型在表征組織粘度方面優于基于線性擬合的SWD模型。本研究所選的最優參數V2.max與先前Jia等人研究所用的A’V2.max存在差異。這種差異或許可以用惡性乳腺病灶在剪切波彈性成像中的“僵硬環征”來解釋。該征象在病理上反映了病灶周圍區域因結締組織增生和腫瘤細胞浸潤而改變的力學特性,從而導致剪切波速度升高。相比之下,病灶核心通常表現出較低的剪切波速度,這可能與波衰減增加有關。A’V2.max的性能較差可能是由于其組成性質——整合了病灶和周圍組織的粘度特征,其數值可能受到病灶核心低剪切波速度的干擾,最終降低了其相對于更具體的V2.max的診斷效用。此外,本研究的變量篩選策略(Boruta算法)能有效處理復雜的變量交互作用和多重共線性,從而產生了更穩健可靠的變量選擇。研究還證實了UVI的技術穩健性,關鍵參數V2.max具有極佳的觀察者內可重復性,這是該定量生物標志物臨床轉化的關鍵前提。
將最優VP(V2.max)與BI-RADS整合到邏輯回歸模型中產生的BI-RADS-V,其診斷準確性顯著高于原始BI-RADS-O。重要的是,BI-RADS-V不僅提高了敏感性,還顯著提升了特異性,從而緩解了傳統超聲在乳腺病灶診斷中特異性低的公認局限。顯著的NRI和IDI進一步驗證了BI-RADS-V的診斷優勢。模型校準評估也證實了BI-RADS-V優于BI-RADS-O,其校準曲線更接近對角線參考線,H-L檢驗結果更優,Brier評分更低。這些指標共同肯定了BI-RADS-V更高的可靠性。DCA顯示,在廣泛的臨床相關閾值概率范圍內,BI-RADS-V始終能帶來比BI-RADS-O更大的凈收益,凸顯了其更優的臨床效用。BI-RADS-V在驗證隊列中也表現出強大的泛化能力,其AUC穩定,敏感性和特異性穩健,校準良好且Brier評分低。BI-RADS-V的優越性能可解釋為惡性乳腺病灶因細胞和細胞外基質結構的生物力學變化而導致的粘性特性增加。與BI-RADS-O相比,BI-RADS-V納入了對粘性特性的額外分析,能夠更全面地評估乳腺病灶。此外,VP作為客觀定量指標的引入有助于提高診斷的穩定性。
為更全面地評估BI-RADS-V,我們評估了其在不同患者亞組中的診斷性能。盡管在年齡組間未觀察到顯著的性能差異,但BI-RADS-V在年輕患者隊列中獲得了更高的AUC。潛在機制可能涉及年輕患者中侵襲性更強的三陰性乳腺癌亞型比例較高。三陰性乳腺癌以高度纖維化的基質微環境為特征,已知這會賦予組織更高的粘度。這種增加的粘度可能與良性病灶的粘度形成更明顯的對比,從而有助于UVI的識別。根據病灶大小觀察到顯著的性能差異,BI-RADS-V對較大病灶表現出更優的診斷準確性。我們推測,這種差異背后的機制是較大病灶中通常存在更晚期的基質重塑和纖維化,這會賦予更大的粘性特性。亞組分析證實了BI-RADS-V在年齡和病灶大小亞組中的高診斷性能,同時突出其在年輕患者和大病灶患者中的最佳性能。這證明了模型的穩健性,更重要的是,表明該模型在這些特定人群和臨床背景下尤其具有應用前景。
HER2是乳腺癌的一個重要治療靶點,其過度表達與腫瘤侵襲性增強和不良預后密切相關。盡管針對HER2的靶向治療顯著改善了患者生存率,但其目前的檢測標準方法(IHC和FISH)具有侵入性、成本高且不適用于重復監測。這種固有的局限性凸顯了對無創技術評估HER2狀態的迫切臨床需求。在此背景下,我們的研究提供了初步證據,表明UVI可能提供一種新的解決方案。值得注意的是,我們的分析顯示HER2狀態與四個Voigt模型衍生的VPs之間存在顯著相關性(p < 0.05),其中V2.max顯示出最強的關聯。這種現象可能與HER2介導的缺氧有關,已知缺氧會促進細胞外基質中膠原蛋白的產生,并可能因此導致粘度升高。重要的是,我們觀察到與HER2相關的VPs特別與病灶周圍基質的粘度特性相關。Gan等人曾報道,HER2陽性癌癥中的基質變化(包括膠原增生)在空間上是異質的,在浸潤前沿和腫瘤巢周圍最為明顯。因此,我們假設UVI有可能通過量化由不均勻結締組織增生引起的特征性瘤周粘度改變,從而有助于HER2狀態的無創評估。
本研究存在一些局限性。首先,其單中心、回顧性設計以及納入計劃進行活檢或手術的患者(“疑似惡性”病例)可能會引入選擇偏倚,并限制研究結果在真實篩查人群中的普遍性。其次,統計分析是在病灶水平進行的,未考慮少數患有多發病灶患者之間可能的非獨立性,這可能影響了結果。第三,關于UVI測量的可重復性,雖然確認了極佳的觀察者內可靠性,但未評估不同操作者之間的觀察者間可重復性。第四,我們專注于組合模型的價值,未評估VP單獨的判別能力。最后,HER2狀態的探索性分析雖然是假設生成性的,但未針對多重比較或其他臨床病理因素進行調整,并且所觀察到的相關性背后的組織學基礎尚不清楚。因此,未來需要納入多樣化臨床人群和分子亞型的大規模、多中心研究來推動乳腺UVI領域的發展。
總結
總之,在我們的研究中,將UVI與BI-RADS系統相結合與診斷準確性的提高相關,并顯示出良好的泛化性。此外,觀察到的病灶周圍粘性特征與HER2狀態之間的關聯,提示其作為分子亞型無創指標的潛力。這些發現支持繼續研究UVI在乳腺病灶的個性化評估中的應用。