《Nature Cancer》:M-PACT leverages cell-free DNA methylomes to achieve robust classification of pediatric brain tumors
編輯推薦:
本文介紹了一項名為M-PACT(基于甲基化的中樞神經系統腫瘤預測算法)的創新研究。研究人員針對兒童中樞神經系統(CNS)腫瘤腦脊液(CSF)液體活檢中游離DNA(cfDNA)量少、突變負荷低、依賴基因組變異等挑戰,開發了一種深度神經網絡分類器。該模型利用低輸入量(亞納克級)的cfDNA甲基化組數據,不僅能對腫瘤進行高精度分類(在胚胎性CNS腫瘤隊列中準確率達88%-92%),還能實現細胞組分去卷積并靈敏檢測拷貝數變異(CNV)。這項研究為低輸入、低腫瘤負荷樣本的無創診斷和監測提供了藍圖,有望推動液體活檢在神經腫瘤臨床實踐中的應用。
兒童腦腫瘤是兒童癌癥相關死亡的主要原因,其診斷和監測一直是臨床面臨的重大挑戰。傳統的診斷方法依賴于組織活檢,但許多腫瘤因其高風險位置(如腦干)而無法進行手術干預。此外,并非所有病例都能獲得足夠的組織樣本,尤其是在轉移或復發的情況下。近年來,液體活檢,尤其是分析腦脊液中的循環腫瘤DNA(ctDNA),為中樞神經系統(CNS)腫瘤的無創診斷帶來了希望。然而,現有技術面臨多重瓶頸:腦脊液中ctDNA含量極低(常為亞納克級)、cfDNA甲基化譜覆蓋稀疏(CpG位點捕獲不足)、腫瘤負荷低,并且第一代臨床檢測主要依賴基因組變異(如拷貝數變異或特定突變)作為生物標志物,這限制了其在腫瘤基因組平衡或缺乏已知驅動突變病例中的應用。為了突破這些限制,Smith等人開展了一項研究,旨在開發一種不依賴于特定遺傳改變、能夠從微量cfDNA中提取強大診斷信息的通用方法。他們的研究成果發表在《Nature Cancer》雜志上。
研究人員主要應用了以下幾種關鍵技術方法:首先,他們優化了酶促甲基化測序(EM-seq)技術,用于從低輸入的腦脊液cfDNA樣本生成全基因組甲基化譜。其次,他們利用包含84種CNS腫瘤和13種非腫瘤實體的龐大DNA甲基化陣列參考隊列,構建了一個基于網絡回歸擴散的模型,用于對測序中未捕獲的甲基化值進行高精度插補。接著,他們通過模擬不同腫瘤比例和CpG稀疏度的組合,生成了大量用于訓練和驗證分類器的體外模擬樣本。最后,他們開發并集成了名為M-PACT(methylation-based predictive algorithm for CNS tumors)的深度神經網絡分類器,該分類器結合了CpG插補、腫瘤富集算法和基于甲基化的去卷積技術。研究的樣本隊列主要來自多個中心的兒童CNS腫瘤患者(n=156)和非惡性供體(n=58)的腦脊液cfDNA。
M-PACT:一種用于CNS腫瘤液體活檢的甲基化分類器
為了應對cfDNA甲基化組中CpG稀疏度高的問題,研究團隊首先創建了一個基于網絡的回歸擴散模型,用于插補測序未捕獲的甲基化值。該插補網絡在包含914個樣本的中樞神經系統腫瘤DNA甲基化陣列參考隊列上訓練,即使僅提供10萬個CpG位點的值也能實現高精度插補。研究人員通過引入不同水平的腫瘤負荷來模擬真實世界樣本,生成了大量包含不同腫瘤比例和CpG稀疏度組合的體外模擬樣本。三個神經網絡(包括一個通用模型和兩個專注于低腫瘤比例與稀疏CpG回收的模型)被集成到一個三層集合模型中,形成了M-PACT。通過β回歸減去來自九種非惡性細胞類別的甲基化特征,增強了腫瘤信號和分類概率。成功進行DNA甲基化分類后,通過將甲基化譜分解為惡性和非惡性部分,估算了腫瘤負荷。
酶促甲基化測序(EM-seq)可從CSF液體活檢中準確捕獲全基因組CNV
研究人員將優化的EM-seq方法應用于cfDNA測序,即使cfDNA輸入量極低(中位數:0.5納克),也能捕獲數百萬個CpG位點。他們將EM-seq應用于268個cfDNA樣本,結果表明EM-seq能夠實現與低覆蓋度全基因組測序(lcWGS)相當的穩健CNV檢測。通過正交比較EM-seq和lcWGS數據,他們發現兩種平臺在全基因組CNV譜上表現出高度一致性,并且基于CNV估計的ctDNA分數在兩種方法間顯著相關。這些發現證明EM-seq能夠實現可靠的、基于CNV的ctDNA檢測。
使用cfDNA對M-PACT進行胚胎性CNS腫瘤分類的基準測試
研究團隊使用ctDNA陽性的腦脊液樣本對M-PACT進行基準測試。M-PACT表現出高分類準確率,73/79(92%)的cfDNA樣本與患者來源的腫瘤組織甲基化陣列分類結果匹配。值得注意的是,大多數正確分類的樣本cfDNA輸入量都在亞納克范圍,突顯了EM-seq/M-PACT工作流程的穩健性。樣本錯誤分類主要由較低的ctDNA分數驅動。
M-PACT在兒童CNS腫瘤液體活檢中的驗證
研究團隊隨后將EM-seq/M-PACT工作流程應用于一個獨立的驗證隊列,該隊列包含來自48名胚胎性CNS腫瘤患者的58個CSF樣本。M-PACT在51/58(88%)的cfDNA樣本中實現了正確分類。為了將研究擴展到胚胎亞型之外,他們還在一個包含高級別膠質瘤、室管膜瘤、生殖細胞腫瘤、脈絡叢腫瘤、腦膜瘤和具有BCOR改變的高級別神經上皮腫瘤的獨立隊列中評估了M-PACT的分類準確性。M-PACT正確分類了22/29(76%)的cfDNA甲基化組。
M-PACT在cfDNA分類中的跨平臺應用
研究團隊評估了M-PACT在納米孔測序、全基因組亞硫酸氫鹽測序(WGBS)和甲基化陣列分析等不同表觀遺傳分析平臺上的兼容性。他們為基準測試隊列中正確分類的21個cfDNA樣本生成了樣本匹配的納米孔測序數據。CNV譜在EM-seq和納米孔平臺之間高度一致。使用M-PACT,18/21(86%)的納米孔譜圖被正確分類。當在cfDNA甲基化陣列譜圖上正交比較M-PACT與金標準海德堡腦腫瘤分類器(MNP)的性能時,MNP正確分類了15/24(62.5%)的CSF樣本,而M-PACT成功分類了20/24(83.3%)。
基于甲基化的二元分類增強了ctDNA檢測靈敏度
盡管利用cfDNA甲基化組可以通過M-PACT進行精細的腫瘤分類,但二元結果(即腫瘤陽性與腫瘤陰性)可能提高ctDNA檢測的靈敏度。為此,研究人員開發了一種算法,將CSF來源的cfDNA甲基化組與患者匹配的腫瘤組織甲基化陣列譜圖、非惡性對照CSF和非惡性對照腦組織進行比較,進行加權相關分析。在所有CNV陽性的cfDNA樣本中,二元分類算法在159/166(96%)的樣本中檢測到ctDNA,而M-PACT的檢測率為146/166(88%)。
對腫瘤和非惡性cfDNA甲基化組進行去卷積分析
除了腫瘤樣本,研究團隊還為從58名未診斷惡性腫瘤的捐贈者(非惡性CSF)收集的CSF樣本生成了EM-seq譜圖。M-PACT正確地將所有剩余的40個樣本分類為非惡性CSF。非惡性cfDNA甲基化組與各種參考細胞類別聚集在一起。應用細胞去卷積方法,可以估計九種非惡性參考細胞類別的相對比例。同樣的去卷積方法應用于基準測試隊列中正確分類的ctDNA陽性CSF樣本,可以估計基于甲基化的細胞分數。
M-PACT流程在真實世界CSF液體活檢中的臨床效用
為了評估EM-seq/M-PACT的轉化潛力,研究人員將分子cfDNA結果與兒童CNS腫瘤人群的疾病軌跡進行了整合。他們首先評估了從獨立捐贈者術中收集的一系列五個CSF樣本。來自CSF的全基因組CNV和M-PACT分類結果與腫瘤組織一致。這些結果表明M-PACT在診斷時間點具有實用性。在一些兒童CNS腫瘤中,基因組缺乏可辨別的CNV,這使得它們與依賴CNV的第一代液體活檢檢測不兼容。為了評估表觀基因組基礎的ctDNA檢測在此類病例中的潛力,研究團隊將EM-seq/M-PACT應用于一系列從腫瘤基因組平衡的參與者收集的CSF樣本。值得注意的是,M-PACT準確分類了來自被診斷為MB, SHH、MB, G4和ATRT, SHH的患者的CNV陰性cfDNA譜圖,且概率很高。治療結束后,僅憑臨床和影像學特征區分復發與繼發性惡性腫瘤具有挑戰性。為了在此背景下評估EM-seq/M-PACT,他們分析了從診斷不確定是復發還是繼發性CNS腫瘤的參與者收集的CSF。EM-seq/M-PACT證實了繼發性膠質母細胞瘤(GBM)的特征性遺傳改變,并從術中CSF中進行了高置信度分類。在一系列縱向CSF的MB患者中,一名參與者沿著已知的MB, G3/4生物學連續體表現出亞組轉換。此外,研究人員還評估了M-PACT性能和ctDNA分數在顱腦和腰椎采集的CSF之間是否存在差異。在兩個解剖位置觀察到了高度可比的M-PACT概率分數。
綜上所述,這項研究建立了M-PACT這一高度靈敏的工作流程,克服了兒童神經腫瘤CSF液體活檢中的關鍵挑戰。該方法能準確分類多樣化的CNS腫瘤實體,并具有區分原發性和繼發性惡性腫瘤的附加價值。除了分類,該工作流程還支持基于甲基化的細胞去卷積和敏感的拷貝數變異檢測。這為將DNA甲基化腫瘤分類從組織轉化為液體活檢奠定了重要基礎,為未來的臨床實施提供了藍圖。為了全面評估該CSF液體活檢工作流程的臨床效用,需要在前瞻性臨床試驗中進行驗證。