<tt id="vwe5b"></tt>
      1. <tfoot id="vwe5b"><progress id="vwe5b"></progress></tfoot><abbr id="vwe5b"></abbr>

      2. 91人人妻,99偷拍,碰碰免费视频,亚洲中文字幕AV,丝袜a片,91纯肉动漫,中文无码日,伊人福利导航

        DECODE:一個適用于轉錄組、蛋白質組和代謝組數據的深度學習通用反卷積框架

        《Nature Methods》:DECODE: deep learning-based common deconvolution framework for various omics data

        【字體: 時間:2026年03月03日 來源:Nature Methods 32.1

        編輯推薦:

          當前的多組學研究因不同組學層缺乏統一的反卷積方法而面臨系統性偏差和流程碎片化的瓶頸。為了解決這一難題,研究人員開發了DECODE——一個適用于細胞類型和細胞狀態的通用深度學習反卷積框架。該框架可無縫應用于轉錄組、蛋白質組和代謝組數據,在多種挑戰性場景下均超越了現有最優方法,并首次實現了對代謝組數據的有效反卷積。這項發表于《Nature Methods》的研究為整合多組學隊列數據、在細胞層面進行深入分析提供了強大且統一的工具,是精準醫學和多組學研究領域的重要進展。

          
        在生命科學研究的宏偉畫卷中,理解復雜組織中各類細胞的構成與動態變化,猶如解開一幅精細的拼圖,是洞悉器官發育、疾病機制和治療響應的關鍵。細胞豐度,即各類細胞在組織中的比例分布,正是這幅拼圖的核心信息。然而,直接描繪這幅拼圖的金標準——單細胞測序技術,卻因其高昂的成本和對樣本處理的嚴苛要求,難以在大型隊列研究中廣泛鋪開。于是,科學家們發展出了“反卷積”這項強大的計算技術,它能夠利用已知的、有限的單細胞數據作為“圖樣”,從混合的組織水平數據中“反推”出各類細胞的比例,從而經濟高效地探究大規模樣本中的細胞異質性。
        理想很豐滿,但現實卻充滿了挑戰。目前的多組學反卷積領域,呈現出一種“各自為政”的割裂狀態。在轉錄組層面,MuSiC、CIBERSORTx等方法表現出色;在空間轉錄組學,RCTD、SPOTlight各擅勝場;在蛋白質組學,則有scpDeconv等專門工具。這些工具在各自的領域內固然有效,但它們大多基于特定組學數據(如轉錄組)的分布假設(如泊松或負二項分布)而設計,將其應用于其他組學數據時效果存疑,更遑論在代謝組學領域,至今仍缺乏專門的反卷積工具。這種“一種組學,一種方法”的現狀,帶來了兩大棘手難題:首先,當研究者希望比較不同組學層、不同隊列間的細胞豐度時,方法學的異質性會引入難以量化的系統偏差,損害整合分析的可信度;其次,多組學研究需要進行大量的跨方法參數調整和結果校準,導致工作流程碎片化,增加了分析復雜度和時間成本。更值得注意的是,代謝組學數據在所有組學類型中與臨床表型的相關性最高,卻因可檢測特征數量少、不同細胞類型間代謝特征相似度高,而成為反卷積的“無人區”。這些挑戰共同構成了大規模多組學研究可擴展性的重要技術瓶頸。因此,開發一個能夠適應不同組學模態多樣化數據特征的統一計算框架,成為推動精準醫學目標前進的關鍵一步。
        為此,研究人員在《Nature Methods》上發表了他們的解決方案:DECODE。這是一個適用于轉錄組、蛋白質組和代謝組數據的通用反卷積框架,能夠對細胞類型和細胞狀態進行反卷積,并在細胞水平上無縫整合跨組學的組織數據集。
        為開展這項研究,作者構建了一個包含四個階段的精密計算框架。第一階段,從單細胞數據中隨機抽樣生成用于模型訓練的“偽組織”樣本。第二階段,通過對抗性訓練來消除偽組織數據與目標組織數據之間的批次效應。第三階段,通過對比學習策略增強特征并去噪,使用基于注意力機制的降噪模塊分離噪聲特征與純化特征。第四階段,根據目標組織是否包含未知細胞類型,選擇不同的推理路徑輸出細胞豐度向量。研究使用了來自人類、小鼠的多個公開數據集,涵蓋了轉錄組、蛋白質組、代謝組和空間轉錄組學數據,構建了包括跨供體、跨疾病狀態、跨健康狀態、跨數據集、空間轉錄組、多細胞類型以及真實組織數據在內的七種評估場景,并將DECODE與包括TAPE、CIBERSORTx、MuSiC、scpDeconv、Scaden、RCTD、SPOTlight等在內的十余種前沿反卷積方法進行了全面比較,評估指標包括Lin‘s一致性相關系數、均方根誤差和皮爾遜相關系數。
        研究結果
        DECODE框架概述
        DECODE框架整合了對抗訓練和對比學習技術。其核心流程分為四階段:生成訓練數據、對抗性去除批次效應、對比學習增強特征與去噪、以及雙路徑推理。特別是在第三階段,框架引入了一個基于注意力機制的降噪器,能夠從添加了噪聲的輸入中分離出純凈的組織特征和噪聲特征,并通過對比學習損失進行優化,從而提升了模型處理各種噪聲和不同組學數據的魯棒性。
        在轉錄組和蛋白質組反卷積中優于以往方法
        在涵蓋七種不同挑戰性場景的15個數據集測試中,DECODE在跨供體、跨疾病、跨健康狀態、跨數據集、空間轉錄組以及多細胞類型反卷積任務中,均表現出優異且穩定的性能,在絕大多數指標上領先于其他組學專用或空間專用的方法。例如,在空間轉錄組學數據上,DECODE的預測結果與真實細胞類型的空間分布高度吻合。在真實組織數據上,DECODE也展現了強大的競爭力。同時,在峰值內存使用和運行時間方面,DECODE也表現出合理的效率。這些比較表明,DECODE是目前針對轉錄組學和蛋白質組學最有效的反卷積方法之一。
        準確穩定的代謝組學反卷積
        DECODE填補了代謝組學反卷積的工具空白。研究使用了來自小鼠肝臟、小鼠骨髓和人結直腸癌的三個單細胞代謝組學數據集進行測試。盡管代謝組學數據存在可檢測特征少、細胞類型間特征相似度高等獨特挑戰,DECODE仍能準確估計細胞比例。在與其他方法的比較中,DECODE在絕大多數指標上明顯優于其他方法,其預測點緊密分布在1:1線附近,而其他方法則對特征較弱的細胞類型表現出識別困難。這證明了DECODE在捕捉細胞間微弱代謝信號差異方面的能力。
        在三種組學數據集上實現準確的細胞狀態反卷積
        除了細胞類型,DECODE還能準確反卷積與偽時間軌跡、細胞周期階段和藥物響應時間點相關的細胞狀態。研究使用了單核細胞偽時間數據集、跨細胞類型的細胞周期蛋白質組數據集以及黑色素瘤細胞藥物處理多組學數據集進行評估。DECODE在所有數據集上均取得了最佳性能,證明了其恢復與偽時間軌跡、細胞分裂周期以及環境變化誘導的細胞狀態變化相關的細胞狀態豐度的能力。
        在不完整的單細胞參考下實現精確反卷積
        在實際應用中,單細胞參考數據可能無法完全覆蓋組織中存在的所有細胞類型。DECODE通過第三階段的降噪器和對比學習,能夠分離噪聲,從而在一定程度上處理這種不匹配的情況。研究人員通過逐步在測試數據中引入未知細胞類型,并施加三種類型的擾動,系統評估了DECODE的魯棒性。結果表明,DECODE在大多數比較中優于其他方法,尤其是在代謝組學數據上,其他方法基本失效,而DECODE仍能給出可用的結果。盡管在某些轉錄組和蛋白質組場景中,Scaden、scpDeconv等方法在穩定性上可與DECODE媲美甚至更低,但DECODE在整體反卷積精度上仍保持領先。
        在不同組學數據集間具有高度一致性
        使用同一批外周血單核細胞的CITE-seq數據生成的轉錄組和蛋白質組偽隊列進行評估,DECODE在兩個組學上的反卷積結果高度一致,且性能顯著優于其他方法。樣本間預測的KL散度低而斯皮爾曼相關系數高,表明DECODE能為跨組學隊列整合提供一致、可靠的細胞豐度估計。
        應用于真實多組學隊列的分析
        研究人員將DECODE應用于整合后的乳腺癌多組學隊列(轉錄組+蛋白質組,238個樣本)和小鼠肝臟多組學隊列(轉錄組+蛋白質組+代謝組,285個樣本)分析。在乳腺癌中,DECODE揭示了非轉移性原位癌、轉移性原位癌和腦轉移灶之間顯著的細胞組成差異,例如非轉移性腫瘤中T細胞和周血管樣細胞富集,而B細胞在轉移性病變中增加,這與已知的免疫生物學知識相符。在小鼠肝臟隊列中,DECODE的反卷積結果在不同組學間高度一致,且與領域共識(如肝細胞約占70%)吻合。分析顯示,在非酒精性脂肪性肝炎和西方飲食加酒精模型中,庫普弗細胞顯著增加,提示炎癥反應加劇;肝細胞豐度在非酒精性脂肪性肝炎中顯著降低,而在單純高脂飲食中略有增加。這些發現驗證了DECODE在多組學隊列研究中揭示細胞比例變化的強大能力。
        研究結論與意義
        DECODE是一個能夠處理轉錄組、蛋白質組和代謝組數據的反卷積算法,填補了代謝組學反卷積的關鍵空白,是多組學數據分析的一個重要里程碑。其通用性源于多個設計:第二階段通過遷移對抗訓練來對齊不同平臺、健康狀態和樣本類型的多樣組學數據,有效去除多種情況下的批次效應;第三階段結合對比學習和自注意力機制,校正組織樣本中的測量偏差,并協調組織數據與單細胞參考之間的擾動,從而能夠從噪聲輸入中重建純化特征。這些模塊共同賦予了DECODE強大的魯棒性,使其能夠恢復細胞類型和細胞狀態,即使是代謝組學中細胞間細微的差異也能捕捉。在CITE-seq偽隊列上的實驗進一步證明了DECODE跨組學性能的一致性。
        通過將DECODE應用于多組學隊列數據,研究揭示了乳腺癌不同階段細胞類型比例的顯著變化,以及小鼠肝臟在不同飲食模型下細胞組成的變化,這些發現與已有研究相互印證,說明了DECODE在連接轉化研究與臨床應用方面的潛力。盡管DECODE存在一些局限性,例如訓練時需要生成人工噪聲細胞帶來額外計算成本,以及當前單細胞代謝組學數據集規模有限可能限制其全面評估和應用,但它仍是一個用于估計三種組學數據上細胞類型和狀態比例的有效工具。DECODE提供了一個廣泛適用的框架,能夠充分利用現有的大量多組學組織水平數據,為推進生物醫學研究提供了新的見解和方法。未來工作可以通過增加專用空間模塊以更好地利用空間轉錄組學數據,并將其擴展到更多組學層,來進一步提升DECODE的適應性和應用范圍。
        相關新聞
        生物通微信公眾號
        微信
        新浪微博

        知名企業招聘

        熱點排行

          今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

          版權所有 生物通

          Copyright© eBiotrade.com, All Rights Reserved

          聯系信箱:

          粵ICP備09063491號