為解決這些難題,由清華大學(xué)戴瓊海院士、吳天陰教授、徐楓教授與廣州醫(yī)科大學(xué)附屬第一醫(yī)院何建行教授領(lǐng)銜的研究團(tuán)隊(duì),在《Nature Communications》發(fā)表了題為"A lung CT vision foundation model facilitating disease diagnosis and medical imaging"的研究。該研究構(gòu)建了迄今規(guī)模最大的肺CT數(shù)據(jù)集LungCT-28M(包含105,184次掃描、2800萬圖像),并在此基礎(chǔ)上開發(fā)了基于去噪擴(kuò)散概率模型(DDPM)的視覺基礎(chǔ)模型LCTfound。這一模型通過自監(jiān)督學(xué)習(xí)方式,將影像參數(shù)(如窗寬、窗位)與臨床信息作為條件引導(dǎo),實(shí)現(xiàn)了從疾病診斷到影像質(zhì)量提升的多任務(wù)統(tǒng)一處理框架。關(guān)鍵技術(shù)方法包括:1) 基于五中心485,885例CT掃描構(gòu)建LungCT-28M預(yù)訓(xùn)練數(shù)據(jù)集,通過自然語言處理(NLP)模型自動(dòng)提取診斷標(biāo)簽;2) 采用融合Transformer模塊的U-Net架構(gòu)(參數(shù)量200M),以DDPM策略進(jìn)行條件擴(kuò)散預(yù)訓(xùn)練;3) 針對(duì)不同下游任務(wù)設(shè)計(jì)適配器,如多層感知機(jī)(MLP)用于分類任務(wù),冷擴(kuò)散方法用于低劑量CT增強(qiáng);4) 在多中心數(shù)據(jù)集上驗(yàn)證8類任務(wù)性能,包括縱隔腫瘤分割、非小細(xì)胞肺癌(NSCLC)預(yù)后預(yù)測(cè)、虛擬CT血管成像(CTA)、稀疏視圖重建等。LCTfound促進(jìn)疾病診斷與預(yù)后評(píng)估在NSCLC預(yù)后預(yù)測(cè)任務(wù)中,LCTfound在LUNG1數(shù)據(jù)集上展現(xiàn)出最優(yōu)的生存分層能力(P<0.001)。通過梯度加權(quán)類激活映射(Grad-CAM)可視化顯示,模型注意力集中于病變區(qū)域,印證其臨床相關(guān)性。對(duì)于新輔助化療免疫治療的病理反應(yīng)預(yù)測(cè),LCTfound在內(nèi)部和外部測(cè)試集上的曲線下面積(AUROC)均領(lǐng)先于MAE、RadImageNet等基線模型。