《Journal of Bone Oncology》:From imaging to omics: deep learning is bridging MRI and liquid biopsy in bone tumor diagnosis
編輯推薦:
本文聚焦于骨腫瘤診斷的精準醫學前沿,系統綜述了如何通過多模態深度學習框架,將能提供高分辨率解剖信息的磁共振成像(MRI)與可無創獲取腫瘤分子特征的液體活檢(liquid biopsy)技術(包括循環腫瘤DNA(ctDNA)、微小RNA(miRNA)等)進行深度融合。文章詳述了該整合策略在骨肉瘤、尤文肉瘤等原發性骨腫瘤的早期診斷、亞型分類、療效監測(如化療反應評估)、預后預測(如轉移風險、生存期)及微小殘留病灶(MRD)檢測等方面的應用潛力和初步臨床證據,并探討了所面臨的挑戰與未來發展方向。
1. 引言
原發性骨腫瘤,如骨肉瘤和尤文肉瘤,因其生物學異質性、影像學特征重疊及分子圖譜多樣,始終是腫瘤學中最復雜的診斷挑戰之一。傳統診斷方法,如組織活檢和解剖成像,提供的信息往往有限或碎片化。磁共振成像(MRI)在腫瘤形態和灌注動力學評估中扮演核心角色,但其解讀很大程度上依賴于放射科醫師的經驗,且缺乏對驅動腫瘤行為的分子改變的洞察。與此同時,液體活檢通過分析循環腫瘤DNA(ctDNA)、RNA、外泌體等生物流體成分,已成為腫瘤學領域的變革性工具,為評估腫瘤負荷、突變譜、克隆演變乃至微小殘留病灶(MRD)提供了微創手段。然而,單獨的液體活檢數據通常缺乏空間背景信息,且在早期疾病中檢測靈敏度受限。深度學習,作為人工智能的一個子集,為此提供了新的范式。它擅長識別跨數據類型的復雜、高維模式。最近的多模態深度學習進展使得影像數據(如MRI)與通過液體活檢獲得的基因組、轉錄組或表觀基因組信息得以整合,從而構建出對腫瘤更全面、系統級的視圖。這種多模態融合方法有望解鎖超越單一成像或組學技術的診斷能力。本綜述探討了通過深度學習驅動的多模態框架,將MRI與液體活檢協同整合的現狀與前景。
2. MRI在骨腫瘤評估中的應用
磁共振成像在評估骨腫瘤方面作用關鍵,常用于區分良惡性病變、描繪骨內范圍、評估軟組織侵犯以及指導分期和手術計劃。良性病變通常邊界清晰、信號均勻、強化程度低,而惡性腫瘤往往邊界不清、在T1加權像上顯示不均勻的骨髓替代、在T2/STIR序列上呈高信號,并具有侵襲性的灌注或擴散特征。MRI對于局部分期、評估皮質突破、神經血管受累和跳躍性轉移也至關重要。基于U-Net(尤其是3D U-Net變體)的架構已用于骨磁共振圖像(及類似的CT/PET研究)中的病灶自動勾畫,這些方法報告了較高的分割精度(Dice系數約為0.85–0.9),實現了可重復且高效的腫瘤體積估算,用于后續的影像組學分析。一項使用EfficientNet-B0模型對超過1000個經組織學確認的骨病變常規T1和T2加權磁共振圖像進行分析的里程碑式工作,在外部驗證中取得了約0.79–0.82的曲線下面積(AUC)值,其性能與經驗豐富的放射科醫師(準確率約76%)相當。MRI衍生的影像組學特征(紋理、形狀、強度等)與深度學習特征相結合,越來越多地用于預測臨床相關結局,如轉移風險或總生存期。例如,在前列腺癌骨轉移中,多參數MRI影像組學結合臨床數據(如PSA水平、Gleason評分)在治療前預測骨轉移狀態方面取得了約0.92的AUC。
3. 液體活檢與多組學在骨腫瘤中的應用
骨腫瘤的液體活檢是一個新興但尚不成熟的領域。循環腫瘤DNA(ctDNA)指的是死亡腫瘤細胞釋放到血液中的短DNA片段,通常占細胞游離DNA(cfDNA)總量的不到1%。cfDNA清除半衰期僅數小時,意味著其水平可實時反映腫瘤負荷,這是監測和早期檢測的關鍵優勢。數字PCR(ddPCR)可實現低至約0.01%突變等位基因頻率的檢測,非常適合追蹤已知的熱點突變或融合。CAPP-Seq能夠量化極罕見的變異。靶向二代測序(NGS)panel,包括腫瘤知情MRD檢測(如Signatera),通過分析患者腫瘤組織,選擇數十至數千個個體化體細胞變異,然后在連續血漿樣本中進行追蹤,以超高特異性監測MRD。新一代液體活檢方法現已超越單純檢測突變;它們分析cfDNA中的片段化模式和表觀遺傳標記,以推斷基因表達或組織來源。一個顯著的例子是EPIC-Seq(表觀遺傳表達推斷cfDNA測序),它靶向選定基因的啟動子區域,并使用啟動子片段熵(PFE)和核小體缺失區域(NDR)深度等片段組學指標,從cfDNA推斷轉錄活性。液體活檢應用在乳腺癌、肺癌、結直腸癌、前列腺癌和血液系統惡性腫瘤中已顯示出重要前景,特別是在突變檢測、耐藥性監測和MRD評估方面。相比之下,在原發性骨腫瘤(如骨肉瘤、尤文肉瘤、平滑肌肉瘤)中的應用仍處于起步階段,但新興研究令人鼓舞。在骨肉瘤中,靶向NGS研究揭示了ctDNA中的TP53、ATRX、DLG2和MET突變以及染色體拷貝數增加(如8q),其水平與腫瘤負荷和臨床病程相關。軟組織肉瘤液體活檢綜述表明,簡單核型腫瘤(如尤文肉瘤、胃腸道間質瘤、促結締組織增生性小圓細胞腫瘤)適合ddPCR或突變靶向檢測,而復雜核型惡性腫瘤(如骨肉瘤、平滑肌肉瘤)則需要更廣泛的panel,目前更具挑戰性,但初步NGS panel已在約75–86%的平滑肌肉瘤隊列樣本中檢測到ctDNA。循環miRNA和長鏈非編碼RNA(lncRNA)已在骨肉瘤中得到評估。例如,幾種致癌miRNA(如miR-21、miR-221、miR-214等)在患者血清中升高并與不良預后相關,而腫瘤抑制miRNA則常常減少。最近骨肉瘤的液體活檢生物標志物主要集中在循環核酸(miRNA、lncRNA、環狀RNA(circRNA)、ctDNA)和細胞/囊泡成分(循環腫瘤細胞(CTC)和細胞外囊泡(EV))。這些panel仍處于探索階段,但已有幾個panel在人類隊列中顯示出診斷和預后價值。循環miRNA已成為診斷、分期、轉移和治療反應的微創標志物。例如,miR-497和miR-125b在骨肉瘤中通常下調,其較低水平與晚期、遠處轉移、不可切除疾病和化療反應差相關。其他microRNA,包括miR-21、miR-27a、miR-199a-5p和miR-195家族成員,已被報道在骨肉瘤中失調。血清lncRNA,包括91H和UCA1,在骨肉瘤中升高并與腫瘤體積增大、晚期和不良預后相關,而循環circRNA在血液中表達改變,似乎與疾病負荷和結局相關。攜帶腫瘤特異性突變或拷貝數變異(CNV)的ctDNA可在部分骨肉瘤患者中檢測到,盡管靈敏度仍然有限;cfDNA的片段組學分析可能會提高可靠性。經典的血清標志物如乳酸脫氫酶(LDH)和堿性磷酸酶(ALP)仍在臨床使用,但缺乏特異性,目前被視為分子檢測的補充。骨肉瘤細胞的EV攜帶腫瘤來源的RNA和蛋白質,提供了穩定的生物標志物“貨物”,而CTC在預后方面顯示出潛力,但在技術上仍具挑戰性。在尤文肉瘤中,針對融合轉錄本(如EWSR1–FLI1)的ddPCR檢測正在評估中,用于復發監測。在平滑肌肉瘤中,更廣泛的NGS panel已證明了可行性。總體而言,骨腫瘤的液體活檢仍處于早期階段,但結合ctDNA、片段組學、miRNA/lncRNA/circRNA panel、EV“貨物”和CTC指標的多層次方法,很可能提供臨床轉化所需的靈敏度和特異性。主要挑戰包括分析物豐度低、腫瘤異質性高以及檢測缺乏標準化。
4. 多模態深度學習:架構與融合策略
骨腫瘤因其顯著的生物學異質性、重疊的影像學表現和多樣的分子圖譜,成為腫瘤學中最復雜的診斷挑戰之一。傳統的、依賴單一影像學或分子譜的診斷范式通常只能提供零碎且不完整的見解。MRI在描繪腫瘤形態、局部范圍、骨髓受累和軟組織侵犯方面不可或缺,而液體活檢方法則通過循環腫瘤DNA(ctDNA)、RNA和表觀基因組信號提供動態分子信息。然而,每種模態單獨使用都無法捕捉骨腫瘤生物學的完整空間-分子復雜性。因此,通過多模態深度學習整合這些互補數據流,已成為一種變革性策略,能夠在骨腫瘤學中實現更全面、無創和個體化的診斷與預后框架。圖1概括了這一多模態流程的整體概念框架,展示了MRI衍生的影像組學特征與液體活檢衍生的組學數據在深度學習融合架構中的順序整合。圖神經網絡(GNN)和基于Transformer的模型等深度學習架構特別適合多模態融合。GNN擅長建模關系和結構化數據,可將從MRI提取的影像組學特征、ctDNA改變和臨床參數表示為互連的節點,并將空間、生物或分子相互作用編碼為邊。這種基于圖的范式能夠捕捉跨異構數據源的復雜依賴關系,而基于注意力的GNN變體通過識別信息量最大的影像-分子關系,進一步增強了可解釋性。相比之下,Transformer利用自注意力機制動態權衡和整合跨模態的高維特征。在骨腫瘤中,多參數MRI序列(包括T1加權、T2加權、擴散加權和對比增強成像)可與ctDNA突變譜、拷貝數改變或甲基化特征相融合。這種在統一架構中學習模態內和模態間依賴關系的能力,使得基于Transformer的模型在腫瘤亞型分類、治療反應預測和結局分層方面尤其強大。其他惡性腫瘤的影像基因組學研究為多模態融合策略的可行性和轉化相關性提供了令人信服的證據。例如,在膠質母細胞瘤中,MRI衍生的影像組學特征與IDH突變狀態和MGMT啟動子甲基化相關;在肺癌中,CT和PET影像組學特征與EGFR和KRAS改變相關。類似地,乳腺癌研究表明,將MRI特征與基因表達譜結合可以提高治療反應和復發風險的預測。這些發現驗證了一個核心前提:當通過適當的深度學習框架進行分析時,影像表型可以反映潛在的分子過程,這為在骨腫瘤中的應用提供了重要的概念指導。盡管骨腫瘤學的多模態深度學習仍處于早期階段,但新興研究提供了令人鼓舞的初步證據。探索性研究已整合了MRI衍生的特征(如腫瘤邊緣特征、強化動力學、瘤內異質性和瘤周水腫)與液體活檢生物標志物(包括TP53突變、拷貝數變異模式和DNA甲基化特征)。這些融合模型已顯示出在提高骨肉瘤患者診斷準確性、區分侵襲性表型以及預測化療反應方面的潛力。此外,將MRI與連續的ctDNA測量相結合,能夠實現對微小殘留病灶的縱向監測和早期復發檢測,為重復組織活檢提供了無創替代方案。除了診斷和監測,多模態深度學習框架在骨腫瘤中還有更廣泛的臨床應用前景。通過將結構、空間和分子信息在單一模型中對齊,這些方法可支持個體化預后判斷、指導治療強度,并促進臨床試驗的患者分層。例如,GNN等空間感知架構可以將腫瘤位置和范圍與組學數據結合,以優化生存預測;而基于Transformer的融合模型可以捕捉跨模態的全局依賴關系,以增強亞型鑒別能力。隨著多模態數據集的擴展和跨學科合作的成熟,通過深度學習整合MRI和液體活檢,有望成為骨腫瘤精準腫瘤學的基石,為腫瘤生物學提供更豐富、更準確且更具臨床操作性的見解。
5. 臨床應用與影響
MRI與液體活檢數據(特別是ctDNA)的融合,在骨腫瘤的臨床管理中具有變革潛力。當通過深度學習模型(尤其是多模態架構)整合時,這種聯合方法提升了診斷精度、治療監測和結局預測。由于良惡性病變的影像學特征重疊,骨腫瘤的早期準確診斷 notoriously 困難。此外,亞型區分(如區分骨肉瘤與尤文肉瘤或軟骨肉瘤)需要侵入性活檢和專業病理學。在此,整合MRI影像組學和ctDNA譜的多模態深度學習模型提供了一種創傷更小、更精確的解決方案。例如,從多參數磁共振圖像(如T1、T2、DWI序列)中提取的影像組學特征可用于量化腫瘤異質性、邊緣銳利度和骨膜反應,這些特征因腫瘤類型而異。同時,液體活檢可通過突變譜、拷貝數變異和甲基化特征提供分子線索。兩者結合,使得模型能夠學習與腫瘤生物學相關的細微模式。最近在其他實體瘤(如膠質母細胞瘤和肺癌)中的工作表明,此類融合模型在亞型分類和預測高風險疾病方面優于單一模態系統。對于骨腫瘤,初步數據提示了類似的潛力:早期研究表明,ctDNA可以檢測到TP53、RB1和ATRX突變,這可能有助于區分侵襲性骨肉瘤表型。通過在配對的MRI和ctDNA數據上訓練深度學習模型,有可能創建即使在早期也能標記不典型或高級別腫瘤的決策支持系統,從而實現及時干預。預測和監測化療反應仍然是骨腫瘤管理的基石,尤其是在骨肉瘤患者中。傳統上,化療后的腫瘤壞死被用作反應的回溯性標志物,但這需要手術切除,且僅在治療完成后才能獲得。相比之下,多模態深度學習模型可以在治療期間提供實時、無創的評估。MRI可以捕捉治療期間腫瘤體積、血管分布和細胞結構的動態變化,這些變化與治療效果相關。深度學習模型可以訓練來檢測與組織學壞死相關的、超出人類視覺能力的細微影像特征。幾項使用卷積神經網絡(CNN)和基于Transformer網絡的研究表明,僅使用MRI掃描預測骨肉瘤患者手術前的腫瘤壞死具有前景。當與連續的ctDNA測量(捕捉腫瘤特異性變異或甲基化變化的減少)融合時,這些模型變得更加強大。此外,通過ctDNA進行微小殘留病灶(MRD)檢測可作為復發風險的替代指標。例如,縱向ctDNA譜已用于尤文肉瘤和橫紋肌肉瘤患者,在影像學檢測到復發前數月預測復發。這些發現表明,MRI加ctDNA模型可以支持個體化監測策略,減少過度治療和晚期復發風險。骨腫瘤的預后模型傳統上依賴于臨床變量,如腫瘤大小、位置、組織學分級和對化療的反應。然而,這些發現對腫瘤生物學的洞察有限。整合影像和組學數據允許開發更具生物學依據的預后模型,對治療計劃和臨床試驗分層均有意義。在膠質母細胞瘤和乳腺癌中,結合MRI與基因表達或蛋白質組數據的多模態深度學習模型已被用于將患者分層為具有顯著改善準確性的生存風險組。將類似的模型應用于骨腫瘤,在聯合MRI影像組學和ctDNA分子譜上進行訓練,可能導致個體化生存預測。這些模型可以識別侵襲性分子亞型,例如那些攜帶染色體碎裂或高基因組不穩定性的亞型,這些與骨肉瘤較差結局相關。此外,如圖神經網絡等空間感知模型可以將來自影像的腫瘤位置和范圍與組學數據結合,以優化預測。這種個體化預后判斷可以指導關于治療強度、手術切緣和納入實驗性治療試驗的決策,為骨腫瘤治療帶來新的精準水平。通過深度學習整合影像和分子數據,臨床醫生得以獲得關于每個腫瘤行為的統一、數據豐富的視圖。MRI提供結構和空間洞察,而ctDNA和其他組學方法提供分子背景。兩者結合,賦能了更準確、動態和個體化的診斷、監測和預后方法。隨著更多多模態數據集的可用,這些融合模型的真實世界部署可能顯著減少診斷延遲、優化治療選擇并改善生存結局,標志著骨腫瘤臨床管理的范式轉變。從未來的臨床視角來看,整合MRI和液體活檢數據的多模態深度學習框架可以嵌入到原發性骨腫瘤的現實診斷和監測工作流中。在這種路徑中,出現可疑骨病變的患者將首先接受標準化的多參數MRI和基于血液的液體活檢采樣。然后,從磁共振圖像提取的影像組學特征和來自循環核酸或細胞外囊泡的分子特征,可以通過多模態深度學習模型聯合分析,以實現活檢前風險分層和腫瘤表征。在治療期間,連續的MRI和液體活檢評估可以支持基于融合的治療反應監測和微小殘留病灶的早期檢測。在確定性治療后,整合的ctDNA和MRI監測可能有助于更早識別復發并指導個體化隨訪策略。盡管該工作流程具有潛力,但它闡釋了一條可行的轉化路徑,通過該路徑,多模態人工智能系統可以在骨腫瘤管理中增強臨床決策,同時最大限度地減少侵入性操作。
6. 挑戰與局限性
多模態建模中最緊迫的問題之一是輸入數據的異質性。MRI采集方案在不同機構間差異顯著,包括磁場強度、脈沖序列、分辨率和對比劑設置。這些不一致性給影像組學特征帶來了變異性,并限制了跨隊列的可比性。類似地,ctDNA檢測也缺乏標準化;不同平臺(如靶向NGS panel、全基因組亞硫酸氫鹽測序或數字PCR)可能產生不同的靈敏度、測序深度和生物信息學輸出。此外,標注仍然是一個主要瓶頸。通過MRI進行腫瘤分割通常是手動完成的,需要專家放射科醫師,且跨數據集缺乏統一性。在分子領域,對具有臨床意義的ctDNA突變進行標記需要廣泛的驗證,且常常不完整。這造成了嘈雜和稀疏的數據環境,阻礙了模型的穩健性。為緩解這些問題,諸如協調的影像協議(如QIBA標準)和ctDNA分析的通用生物信息學流程等舉措正在獲得關注。盡管如此,實現真正可互操作的多機構數據集仍是一項進行中的工作。另一個關鍵問題是當前深度學習模型的泛化能力有限。與肺癌或乳腺癌等常見癌癥相比,骨腫瘤較為罕見,導致用于訓練復雜多模態模型的數據集相對較小。這常常導致過擬合,即模型在訓練集上表現良好,但在未見數據上表現不佳。此外,骨腫瘤特異性的組學數據,特別是來自液體活檢來源的,在公共存儲庫中很稀疏。許多現有研究依賴于從更廣泛的肉瘤數據集或其他實體瘤進行外推,這可能無法捕捉骨肉瘤或尤文肉瘤等骨癌的獨特分子譜。為克服此問題,已出現幾種策略。遷移學習,即在大型數據集(例如來自其他癌癥)上預訓練的模型在較小的骨腫瘤隊列上進行微調。影像的數據增強技術包括通過生成對抗網絡(GAN)進行合成圖像生成。聯邦學習允許模型在多個機構上進行訓練而數據無需離開本地服務器,這同時解決了隱私問題和數據集大小問題。現有的合作倡議,如國際軟組織肉瘤聯盟(INSTRuCT)兒童肉瘤網絡,闡明了多國數據共享框架如何加速罕見腫瘤的研究。盡管并非專門為多模態人工智能開發設計,但此類聯盟為聯邦學習方法提供了一個結構性模型,能夠在保護患者隱私和遵守法規的同時,實現多機構模型訓練。盡管有這些進展,開發針對骨腫瘤的大型、經過整理和標注的多模態數據集,對于穩健的模型訓練和外部驗證仍然至關重要。深度學習模型,尤其是那些涉及復雜數據融合架構的,常常被批評為“黑箱”。可解釋人工智能(XAI)領域正在通過開發諸如用于影像的顯著圖(saliency maps)和Grad-CAM等工具來解決這一問題,這些工具可以突出顯示影響模型決策的MRI區域。用于組學數據的特征歸因方法(如SHAP、LIME)用于識別哪些突變或甲基化模式最具預測性。盡管XAI工具有助于闡明模型“思考”的過程,但將影像特征與特定分子事件明確關聯起來仍然復雜,并且需要生物學驗證。最終,可解釋且可信的模型對于臨床采用至關重要。