
-
生物通官微
陪你抓住生命科技
跳動的脈搏
基于領域知識的方法促進了機器學習的發展,并實現了對癌癥相關RNA甲基化位點的功能特征分析
《BMC Bioinformatics》:Domain-derived knowledge enabled machine learning and functional characterization of cancer-associated RNA methylation sites
【字體: 大 中 小 】 時間:2026年02月24日 來源:BMC Bioinformatics 3.3
編輯推薦:
m6A-CAPred模型通過整合序列和基因組特征,有效預測癌癥相關N6-甲基腺苷修飾位點,驗證顯示其平均AUROC達0.885,且預測位點顯著富集于關鍵生物過程和癌癥通路。
N6-甲基腺苷(m6A)是真核生物mRNA中最豐富的轉錄后修飾類型,在多種生物過程中發揮著關鍵作用。m6A水平的失調與多種人類疾病有關,尤其是癌癥。盡管已有幾種計算工具可用于預測潛在的m6A位點,但尚無工具能夠以單堿基分辨率專門識別與癌癥相關(或促進癌癥發生的)m6A殘基。
為了解決這一不足,我們開發了m6A-CAPred,這是一個能夠以堿基分辨率準確預測與癌癥相關m6A位點的計算框架。我們的模型基于一個包含25種癌細胞系和23種正常組織樣本中經過實驗驗證的m6A位點的綜合數據集進行訓練,該模型采用了結合序列特征和精心整理的基因組特征的混合特征提取方法。
初步分析表明,僅使用序列信息時預測性能有限。然而,通過加入基因組上下文特征,m6A-CAPred的預測性能顯著提升(在獨立數據集上的平均AUROC值為0.885),成功區分了與癌癥相關的m6A位點和正常m6A位點的獨特特征。隨后,我們應用m6A-CAPred進行了全轉錄組范圍的預測,以篩選潛在的與癌癥相關的m6A位點。從33種TCGA癌癥項目中提取的體細胞變異數據進行獨立驗證,結果表明,癌癥相關的體細胞SNP密度清晰地區分了預測出的促進癌癥發生的m6A位點和正常m6A位點,進一步證實了該模型的生物學相關性。此外,與癌癥相關的m6A位點在功能重要的生物過程和癌癥相關通路中表現出顯著富集。
總體而言,我們希望m6A-CAPred能夠成為癌癥表觀轉錄組研究的寶貴資源,并在癌癥生物標志物發現方面具有潛在應用價值。實現我們模型的網絡服務器可免費訪問:www.rnamd.org/m6A-CAPred。
N6-甲基腺苷(m6A)是真核生物mRNA中最豐富的轉錄后修飾類型,在多種生物過程中發揮著關鍵作用。m6A水平的失調與多種人類疾病有關,尤其是癌癥。盡管已有幾種計算工具可用于預測潛在的m6A位點,但尚無工具能夠以單堿基分辨率專門識別與癌癥相關(或促進癌癥發生的)m6A殘基。
為了解決這一不足,我們開發了m6A-CAPred,這是一個能夠以堿基分辨率準確預測與癌癥相關m6A位點的計算框架。我們的模型基于一個包含25種癌細胞系和23種正常組織樣本中經過實驗驗證的m6A位點的綜合數據集進行訓練,該模型采用了結合序列特征和精心整理的基因組特征的混合特征提取方法。
初步分析表明,僅使用序列信息時預測性能有限。然而,通過加入基因組上下文特征,m6A-CAPred的預測性能顯著提升(在獨立數據集上的平均AUROC值為0.885),成功區分了與癌癥相關的m6A位點和正常m6A位點的獨特特征。隨后,我們應用m6A-CAPred進行了全轉錄組范圍的預測,以篩選潛在的與癌癥相關的m6A位點。從33種TCGA癌癥項目中提取的體細胞變異數據進行獨立驗證,結果表明,癌癥相關的體細胞SNP密度清晰地區分了預測出的促進癌癥發生的m6A位點和正常m6A位點,進一步證實了該模型的生物學相關性。此外,與癌癥相關的m6A位點在功能重要的生物過程和癌癥相關通路中表現出顯著富集。
總體而言,我們希望m6A-CAPred能夠成為癌癥表觀轉錄組研究的寶貴資源,并在癌癥生物標志物發現方面具有潛在應用價值。實現我們模型的網絡服務器可免費訪問:www.rnamd.org/m6A-CAPred。