C-COMPASS:基于神經網絡的細胞器多組學分析工具實現蛋白質和脂質空間分布定量解析
《Nature Methods》:C-COMPASS: a user-friendly neural network tool profiles cell compartments at protein and lipid levels
【字體:
大
中
小
】
時間:2025年12月05日
來源:Nature Methods 32.1
編輯推薦:
本研究針對細胞器蛋白質空間分布預測中多重定位模式難以量化、脂質缺乏特異性標記物無法定位的問題,開發了用戶友好的開源軟件C-COMPASS。該工具采用神經網絡回歸模型,成功實現了蛋白質在細胞器間的定量分布預測,并首次將空間分布分析拓展至脂質組學,為研究代謝擾動下細胞器重構提供了多組學整合分析方案。
在真核細胞中,細胞器的精確空間分布和功能特化是維持正常生命活動的關鍵。然而,傳統的細胞器分離技術面臨純度不足的挑戰,而現有的計算方法大多局限于單一細胞器的定性預測,難以準確捕捉蛋白質的多重定位特征。更令人困擾的是,由于缺乏特異性標記物,脂質在細胞器間的分布研究一直進展緩慢。
針對這些技術瓶頸,德國赫爾姆霍茲慕尼黑中心的Natalie Krahmer團隊在《Nature Methods》上發表了題為"C-COMPASS: a user-friendly neural network tool profiles cell compartments at protein and lipid levels"的研究論文,開發了一種基于神經網絡的空間多組學分析工具。
研究人員首先建立了完整的實驗分析流程:通過密度梯度超速離心分離細胞器組分,結合液相色譜-串聯質譜(LC-MS/MS)技術進行蛋白質和脂質的定量分析。C-COMPASS的核心創新在于采用五層神經網絡回歸模型,通過輸入層(對應分數數量)、兩個密集層(一個可調)、歸一化層(確保輸出總和為1)和輸出層的結構設計,實現了蛋白質在多個細胞器間分布比例的定量預測。
研究團隊通過標記蛋白質上采樣策略有效解決了類別不平衡問題。在人類白色脂肪細胞數據集上的測試表明,上采樣后預測精度從0.44提升至0.60,召回率從0.47提升至0.66。特別是對于標記蛋白較少的脂滴(LD)區室,F1分數從不足0.01顯著提高至0.50。與傳統支持向量機(SVM)方法相比,C-COMPASS在12個細胞器中的11個表現出更優的性能,整體F1分數達到0.84。
在HyperLOPIT數據集的應用中,C-COMPASS在對照條件下獲得了0.87-1.00的F1分數(加權平均0.96),在LPS處理條件下為0.66-1.00(加權平均0.93)。重要的是,該工具成功識別出59.5%的蛋白質存在多重定位,其中81%在原研究中被歸類為"未知"的蛋白質被重新定義為多重定位蛋白。
通過模擬數據集分析,研究發現當分數數量至少是細胞器數量的兩倍時,可獲得最佳預測效果。這一發現為優化實驗設計提供了重要指導,在保證分辨率的同時合理平衡工作負荷。
在FRG基因敲除小鼠模型中,研究人員利用C-COMPASS分析了人源化肝臟在不同代謝狀態(普通飲食、高脂高果糖飲食、禁食)下的細胞器重構。研究發現約半數蛋白質在不同條件下保持主要定位一致,而脂滴相關蛋白質表現出最高的重定位比例。特別值得注意的是,PLIN5在普通飲食條件下主要定位于脂滴,在高脂高糖喂養時向胞質重定位,禁食后又返回脂滴。
研究最具創新性的突破在于將空間分布分析成功拓展至脂質組學。通過蛋白質標記物訓練的神經網絡,C-COMPASS成功預測了411種脂質物種的細胞器分布。研究發現三酰甘油(TAG)主要定位于脂滴,心磷脂(CL)富集于線粒體,而神經酰胺主要在內質網合成。此外,研究還發現了脂肪酸鏈長和飽和度在不同細胞器間的顯著差異,如分泌途徑后期細胞器(內體、溶酶體和質膜)比早期細胞器(高爾基體)具有更長的碳鏈和更高的不飽和度。
C-COMPASS的推出標志著空間多組學分析進入了新時代。該工具不僅解決了蛋白質多重定位的定量預測難題,更突破了脂質空間分布研究的技術瓶頸,為全面理解細胞器在生理和病理條件下的動態重構提供了強大平臺。隨著該工具的廣泛應用,預計將在脂質組學、蛋白質組學和細胞器生物學領域催生更多重要發現。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號