《International Journal of Genomics》:Single-Cell RNA-seq Reveals Deubiquitination Genes as Prognostic Markers in Hepatocellular Carcinoma
編輯推薦:
本研究通過整合單細胞RNA測序(scRNA-seq)與批量RNA測序數據,系統分析了去泛素化(DUB)基因在肝細胞癌(HCC)中的表達模式及其臨床意義。研究發現,DUB高活性腫瘤細胞表現出增強的炎癥反應、IFN-γ信號通路及免疫細胞浸潤特征,并構建了基于78個DUB相關基因的預后模型(DAS),該模型在TCGA和ICGC隊列中均顯示出優異的生存預測能力(1年、3年AUC>0.9),為HCC患者風險分層和個性化治療提供了新策略。
摘要
背景
肝細胞癌(HCC)預后較差,而去泛素化(DUB)作為重要的翻譯后調控機制,其在HCC進展中的作用尚不明確。
方法
研究整合了13例初治HCC腫瘤的單細胞RNA測序(scRNA-seq)數據,以及374例TCGA和243例ICGC批量RNA測序隊列。采用AUCell量化每個細胞的去泛素化酶(DUB)活性,利用clusterProfiler進行通路富集分析。通過LASSO-Cox機器學習流程構建基于DUB的風險特征,并借助時間依賴性ROC分析進行內部和外部交叉驗證。
結果
惡性細胞相對于免疫區室(髓系細胞、B細胞)表現出差異化的DUB轉錄。DUB高活性腫瘤亞群顯示炎癥和IFN-γ信號通路增強,與活躍的免疫浸潤一致;78個基因的預后指數在發現隊列和驗證隊列中均能有效分層患者生存。
結論
本研究揭示了去泛素化在HCC進展中的作用及其作為預后生物標志物的潛力。開發的模型可作為患者分層和個性化治療策略的有價值工具,但需進一步實驗驗證確認這些發現。
1. 引言
肝細胞癌(HCC)是全球癌癥相關死亡的第二大原因,治療選擇有限且預后較差。HCC的高度異質性給治療開發和臨床結果預測帶來挑戰。泛素化是一種重要的翻譯后修飾,調控蛋白質周轉和細胞代謝,而去泛素化(DUB)則通過去除底物蛋白的泛素鏈維持蛋白質穩態。泛素化與DUB之間的平衡失調與包括HCC在內的多種腫瘤的發生發展密切相關。盡管泛素化在HCC中已得到廣泛研究,但DUB的作用、機制及臨床意義仍待深入探索。單細胞RNA測序(scRNA-seq)技術的進步為在單細胞水平解析HCC分子機制提供了新機遇。本研究聚焦DUB相關基因在HCC中的作用,旨在闡明其在腫瘤發生發展中的具體貢獻,并通過生物信息學分析識別潛在的生物標志物,以改善HCC患者的預后預測和指導治療策略。
2. 方法
2.1. scRNA-seq數據的獲取與處理
研究整合了13例HCC樣本的scRNA-seq數據,使用Seurat R包進行數據處理和細胞聚類。采用Harmony R包校正批次效應,并通過一系列Seurat流程(NormalizeData, FindVariableFeatures, ScaleData, RunPCA, FindNeighbors, FindClusters, RunUMAP)實現細胞亞群的精確聚類和分子表征。使用AUCell計算單細胞水平的DUB活性,依據中位值將細胞分為高評分組和低評分組。
2.2. 批量RNA測序數據分析
從TCGA和ICGC數據庫獲取HCC患者的轉錄組數據,使用sva R包的ComBat函數校正批次效應。采用基因集變異分析(GSVA)進行通路富集分析,從MSigDB數據庫獲取高質量基因集。DUB相關基因從GeneCards數據庫檢索并基于相關性評分編譯。
2.3. 預后模型構建
首先進行單變量Cox回歸分析識別與患者生存相關的關鍵基因。采用10折交叉驗證策略評估101種機器學習算法組合,包括逐步Cox回歸、Lasso、Ridge、偏最小二乘Cox回歸(plsRcox)、CoxBoost、隨機生存森林(RSF)、梯度提升機(GBM)、彈性網絡(Enet)、監督主成分(SuperPC)和生存支持向量機(survival-SVM)。選擇一致性指數(C-index)最高的模型作為最佳預后工具,并通過ROC曲線分析和PCA驗證模型預測性能。
2.4. 統計分析
所有數據分析使用R軟件(版本4.2.0)進行。采用Kaplan-Meier生存分析和log-rank檢驗評估生存差異。連續變量比較使用t檢驗或Wilcoxon秩和檢驗,分類變量使用卡方檢驗或Fisher精確檢驗。應用錯誤發現率(FDR)校正控制多重檢驗誤差,Pearson相關分析評估變量間關系。
3. 結果
3.1. 樣本整合、細胞聚類與注釋
研究整合了13例人HCC scRNA-seq樣本,通過Harmony整合后獲得統一數據集。Seurat識別出19個 distinct 細胞簇,通過16個常見標記基因(EPCAM, PECAM1, VWF, COL1A1, ACTA2, LYZ, CD68, KIT, MS4A2, NKG7, NCR1, MS4A1, CD79A, CD3E, CD8A, FOXP3)表達譜進行細胞類型注釋。最終將細胞簇分類為HCC細胞、髓系細胞、NK/T細胞、成纖維細胞、內皮細胞、B細胞和肥大細胞。
3.2. DUB基因活性評分
從GeneCards數據庫篩選245個DUB基因,使用AUCell計算活性評分。依據中位評分將細胞分為高評分組和低評分組。DUB高評分細胞主要富集在HCC細胞和髓系細胞中,而低評分細胞主要見于B細胞。其他細胞類型呈現高低評分細胞混合分布。
3.3. DUB高評分與低評分細胞的轉錄組差異
通路富集分析顯示,與DUB低評分細胞相比,DUB高評分細胞中多數腫瘤相關通路上調,包括移植物排斥、炎癥反應、干擾素γ反應、NF-κB介導的TNF-α信號和IL6-JAK-STAT3信號通路。下調通路包括KRAS信號通路、骨骼肌分化、膽汁酸代謝和早期雌激素反應相關信號通路。相關性分析揭示,在DUB低評分細胞中,肥大細胞與NK/T細胞顯著相關,內皮細胞與成纖維細胞相關;而在DUB高評分細胞中,NK/T細胞與成纖維細胞強相關。Ro/e分析顯示B細胞在DUB低評分組顯著富集。
3.4. 兩組細胞間通訊差異
細胞通訊分析表明,DUB高評分組的細胞通訊數量顯著低于低評分組,但通訊強度更高。DUB低評分組的七種細胞亞型表現出更活躍的通訊行為。信息流比較顯示,SPP1、CD99和MK通路在DUB低評分細胞中顯著下調。
3.5. DUB相關基因的識別
PCA顯示ICGC和TCGA數據集樣本無顯著批次效應。單變量Cox回歸分析識別出78個顯著預后基因,其中52個與不良預后相關(如YBX1、RAN、CAP1),26個與良好預后相關(如CYP2C9、PON1、CFHR1)。KEGG富集分析顯示這些基因參與FcγR介導的吞噬作用和細菌侵襲等過程。GO分析揭示其在分泌顆粒腔、膠原細胞外基質和內肽酶活性等功能類別中富集。
3.6. 預后模型構建及與免疫微環境的關系
采用101種機器學習算法評估78個基因,基于C-index選擇StepCox[both] + RSF模型作為最佳預后工具。生存分析顯示,高風險組患者在TCGA和ICGC數據集中均表現出顯著較差的預后。ROC曲線分析表明,在TCGA-HCC中,1年、3年和5年AUC分別為0.95、0.94和0.95;在ICGC驗證集中,相應AUC為0.74、0.77和0.43;虮磉_模式有效區分不同風險評分樣本。相關性分析顯示,YBX1、PRDX1、SQSTM1、PTTG1、STMN1和FDPS等基因與風險評分呈顯著正相關,而PON1呈負相關。免疫微環境分析顯示,MHC I、MHC II、其他MHC、共刺激分子和共抑制分子相關基因在DUB低評分樣本中表達更高。
4. 討論
本研究揭示了HCC中DUB基因活性驅動的顯著變異。DUB高表達腫瘤細胞顯示腫瘤促進通路增強,且DUB高表達主要富集于髓系細胞和肥大細胞,而低表達細胞更多富集B細胞和NK細胞表型。構建的基于DUB表達水平的預后風險特征模型具有重要臨床預測價值。研究發現DUB高表達細胞中炎癥反應、干擾素γ反應、NF-κB介導的TNF-α信號和IL6-JAK-STAT3信號通路上調,提示更高程度的免疫細胞浸潤,表明DUB基因可能參與肝細胞的免疫殺傷和免疫逃逸機制。細胞通訊分析表明DUB高表達細胞具有更強的相互作用強度,SPP1、MK和CD99等高表達提示更活躍的細胞通訊和免疫細胞活性。通過單變量Cox分析鑒定的78個DUB相關基因與細胞周期、轉錄調控、腫瘤細胞遷移、侵襲、代謝、抗氧化活性和免疫調節密切相關。DAS模型顯示出對HCC患者預后的優異預測能力,為基于預測結果的精確患者分層提供了基礎,有助于制定個性化治療策略。盡管存在主要依賴公共數據、缺乏臨床樣本驗證等局限性,但本研究創新性地整合了scRNA-seq和批量RNA測序數據,系統分析了DUB相關基因的表達譜及其在細胞間信號傳導和免疫調節中的作用,為后續實驗研究和機制探索提供了寶貴參考。
5. 結論
本研究探討了DUB相關基因在HCC中的作用及其作為預后生物標志物的潛力。發現DUB高表達與免疫相關通路上調和免疫細胞浸潤增加相關。開發的基于DUB表達水平的預后模型顯示出強大的患者生存預測能力,為HCC風險分層和個性化治療提供了有價值工具。盡管存在需實驗驗證等局限性,研究結果突出了DUB在HCC進展中的關鍵作用及其作為治療靶點的潛力。需要進一步研究驗證這些結果并完善預后模型。