《Nature Communications》:HRCHY-CytoCommunity identifies hierarchical tissue organization in cell-type spatial maps
編輯推薦:
為解決從細胞類型空間圖譜中識別具有完整嵌套關系的多層次組織結構的難題,研究人員開發了HRCHY-CytoCommunity這一圖神經網絡框架。該框架通過端到端模型集成可微分圖池化等技術,能夠從多樣化的空間組學數據中,同時推斷跨尺度的穩健結構,并揭示與乳腺癌患者預后相關的空間模式,為從單細胞到完整組織的解析提供了通用工具。
在生命科學研究中,理解復雜的多細胞生物體如何從一個受精卵發育而來,其奧秘不僅藏在細胞的基因序列里,更蘊含在無數細胞如何精密地“排兵布陣”之中。組織并非細胞的簡單堆積,而是多種細胞類型在空間上精確組裝,形成從微小“鄰里”(細胞鄰域)到大型“功能社區”(組織分區)的嵌套式、多層次結構。這種層次化的空間組織對器官功能維持、疾病發生發展至關重要。然而,隨著空間組學(Spatial Omics)技術的爆發式發展,科學家們能夠以前所未有的分辨率繪制出組織樣本中每個細胞的位置和類型圖譜,卻也面臨著一個新的“甜蜜的煩惱”:面對海量的細胞點陣數據,如何像擁有“火眼金睛”一樣,自動、準確且不失真地從這些空間圖譜中識別出這些天然的、具有層級關系的多尺度組織模塊?
傳統方法多聚焦于識別單一尺度的結構,或是將不同尺度的分析割裂開來,難以捕捉從微觀到宏觀的完整嵌套關系。這就像只看清了一棵樹或一片森林,卻無法同時理解樹枝、樹冠與整片森林之間如何逐級構成。這一瓶頸限制了我們全面解碼組織構建原則以及與疾病(如癌癥)關聯的復雜空間模式的能力。正因如此,開發一種能夠直接從細胞類型空間圖譜中,端到端地解析多層次、全嵌套組織結構的計算方法,成為了領域內亟待攻克的關鍵挑戰。
為了攻克這一難題,一支研究團隊提出了HRCHY-CytoCommunity。這是一個基于圖神經網絡(Graph Neural Network, GNN)的創新計算框架,專門用于從帶有細胞類型注釋的空間點圖中識別多級組織層次結構。該框架的核心是巧妙地集成了可微分圖池化(Differentiable Graph Pooling)、自適應邊修剪(Adaptive Edge Pruning)以及一致性與平衡正則化(Consistency and Balance Regularization)。通過這種一體化端到端建模,HRCHY-CytoCommunity能夠同時推斷出跨越多個空間尺度的穩健結構,并確保兩個關鍵特性:一是“完全細胞覆蓋”,即每個細胞都被合理分配到某一層級的結構中,無“游離”細胞;二是“完全嵌套關系”,即較細尺度的結構(如細胞鄰域)能夠完美地嵌入到較粗尺度的結構(如組織分區)之中,形成清晰的層次樹。此外,該框架還支持通過基于細胞類型富集的聚類方法,對不同樣本間推斷出的層次結構進行對齊比較,從而實現跨樣本分析。研究人員在多種空間組學數據集上對HRCHY-CytoCommunity進行了基準測試,結果表明,無論是在識別粗粒度的組織功能區,還是細粒度的細胞微環境方面,其性能均優于現有的分層和非分層方法。當應用于一組具有臨床結局的乳腺癌隊列數據時,HRCHY-CytoCommunity的強大解析能力得以彰顯:它不僅能夠依據腫瘤空間組織的層次特征對患者進行具有預后價值的層級化分型,還成功揭示了與患者生存期顯著相關的特定空間組織模式。這項研究成果已發表在《Nature Communications》期刊上。
為了開展此項研究,作者主要運用了以下幾項關鍵技術方法:首先是構建細胞空間關系圖,將每個細胞視為節點,并根據空間鄰近性建立邊。核心是HRCHY-CytoCommunity模型本身,它集成了可微分圖池化操作來逐步粗化圖結構以得到不同層次,結合自適應邊修剪優化連接,并利用一致性正則化保證層次間的嵌套性、平衡正則化保證聚類大小均衡。在模型訓練中,采用無監督方式進行。在跨樣本分析時,采用了基于細胞類型富集譜的層次聚類方法對齊不同樣本的社區結構。所使用的數據包括公開的及作者收集的多種空間轉錄組和成像數據,其中乳腺癌預后分析隊列包含有臨床隨訪信息的樣本。
HRCHY-CytoCommunity框架設計
本研究提出了HRCHY-CytoCommunity這一全新框架。其輸入是帶有細胞類型標簽的空間坐標數據,通過構建K近鄰圖來初始化細胞間的空間關系。框架的核心是一個包含多層可微分池化操作的圖神經網絡。每一層池化操作會將當前層次的圖粗化,合并某些節點(細胞)以形成上一尺度的“超節點”(即推斷出的組織結構),同時自適應地修剪掉不必要的邊以優化社區結構。通過引入一致性正則化,框架強制要求細粒度層次中推斷出的社區必須完全歸屬于粗粒度層次中的某個社區,從而保證了層次間的完全嵌套性。平衡正則化則用于避免產生規模極端不均的社區。整個過程以無監督、端到端的方式同時學習所有層次的結構。
在仿真和真實數據上的性能評估
研究人員在仿真數據和多種真實空間組學數據集上對HRCHY-CytoCommunity進行了系統評估。在仿真數據上,該方法能夠準確地恢復出預設的多層次地面真值結構,其性能顯著優于基線方法。在真實數據上,例如小鼠下丘腦視前區的MERFISH(Multiplexed Error-Robust Fluorescence In Situ Hybridization,多重抗誤差熒光原位雜交)數據和小鼠肝臟的Star空間轉錄組數據,HRCHY-CytoCommunity成功識別出了從細胞鄰域到更大組織功能區(如肝臟門靜脈區、中央靜脈區)的清晰層次結構。性能定量比較顯示,在識別不同尺度結構的多項指標上,HRCHY-CytoCommunity均領先于其他方法,證明了其有效性和通用性。
揭示乳腺癌腫瘤微環境的層次空間組織
將HRCHY-CytoCommunity應用于一個包含多重免疫熒光(Multiplexed Immunofluorescence, mIF)成像數據的乳腺癌隊列(該隊列具有臨床預后信息),研究得以深入解析腫瘤微環境(Tumor Microenvironment, TME)的復雜空間架構。分析不僅識別出了腫瘤細胞區、免疫細胞區、間質區等粗粒度分區,還在這些分區內部進一步解析出更精細的細胞鄰域,例如不同亞型的T細胞與腫瘤細胞、髓系細胞的特定空間聚集模式。這些多層次的空間模式共同描繪了乳腺癌TME的高度異質性和組織化特征。
基于空間層次的預后患者分型
利用從乳腺癌樣本中推斷出的多層次空間社區特征,研究人員進行了生存分析。他們發現,基于特定層次(尤其是中間尺度)的空間社區組成,可以將患者分為具有顯著不同生存結局的亞型。這種基于HRCHY-CytoCommunity衍生特征的分型,其預后預測能力獨立于傳統的臨床病理因素。這表明,腫瘤的空間組織層次本身蘊含著重要的生物學和臨床信息。
識別與生存相關的空間模式
通過進一步分析,研究確定了與患者良好或不良預后顯著相關的具體空間模式。例如,在粗粒度的“免疫富集”分區內,如果特定精細結構的T細胞鄰域與腫瘤細胞鄰域呈現緊密的嵌套和交互空間關系,則該模式與更長的患者生存期相關。反之,某些以髓系抑制細胞為主的鄰域空間分布模式則與較差的預后相關。這些發現為理解腫瘤免疫微環境的功能空間單元及其臨床意義提供了新的見解。
綜上所述,本研究的結論是,組織在空間上具有內在的、多層次的結構化特性。研究人員成功開發的HRCHY-CytoCommunity框架,為直接從細胞類型空間圖譜中系統性地解析這種層次化組織提供了一種強大、通用且可擴展的計算工具。該框架通過集成可微分圖池化、自適應優化和特定的正則化策略,首次實現了在單一端到端模型中同時、無監督地推斷出跨多個尺度且保持完全嵌套關系的穩健組織結構。在多個數據集上的驗證表明其性能優越。更重要的是,將其應用于乳腺癌隊列研究,不僅實現了基于空間組織層次的患者預后分層,還揭示了與生存結局密切相關的特異性空間構型,這為將空間組學數據轉化為具有臨床價值的生物標志物開辟了新途徑。因此,HRCHY-CytoCommunity代表了一項重要進展,它架起了一座從單細胞分辨率到多細胞模塊,再到完整組織功能理解的橋梁,對于發育生物學、腫瘤學及基礎組織學研究均具有廣泛意義。