《Nature Aging》:Structural signature of plasma proteins classifies the status of Alzheimer’s disease
編輯推薦:
本研究針對阿爾茨海默病(AD)早期診斷困難、缺乏反映疾病進展的有效血液生物標志物等問題,開展了血漿蛋白質結構組學分析。研究人員利用質譜與機器學習,系統描繪了與APOE基因型及神經精神癥狀相關的蛋白構象變化,并開發了基于C1QA、CLUS和ApoB蛋白結構改變的診斷模型。該三標記物組合實現了健康、輕度認知障礙(MCI)與AD的三分類(準確率83.44%),并在縱向樣本中得到驗證,為AD的無創早期檢測、疾病監測和臨床試驗分層提供了新思路。
在人類對抗神經退行性疾病的漫長征程中,阿爾茨海默病(Alzheimer's disease, AD)始終是橫亙在前的巨大挑戰。這種疾病不僅蠶食著患者的記憶與認知功能,其復雜的病理機制也讓早期診斷和治療干預困難重重。目前,確診AD通常依賴于昂貴的正電子發射斷層掃描(PET)或具有侵入性的腦脊液(Cerebrospinal Fluid, CSF)檢查,這些方法難以廣泛應用于大規模人群篩查。盡管大腦中淀粉樣蛋白-β(Aβ)斑塊在臨床癥狀出現前約15年就開始積聚,但如何在疾病早期、通過簡便易行的血液檢測捕捉到這些病理變化的“信號”,一直是科學界和臨床醫學迫切希望解決的難題。傳統的血液生物標志物研究多聚焦于蛋白質的“量變”,即表達水平的高低,然而AD的核心病理之一——蛋白質穩態(Proteostasis)失調——所導致的蛋白錯誤折疊,本質上是蛋白質的“質變”,即其三維結構的改變。這些微觀的結構擾動,能否在血液中留下可供識別的“指紋”,并成為區分疾病不同階段的可靠依據?Son等人的研究為此帶來了希望的曙光。
為了探索血漿蛋白結構變化作為AD診斷標志物的潛力,研究人員開展了一項系統性的研究,相關成果發表在《Nature Aging》期刊。該研究整合了來自兩個獨立回顧性隊列(KU ADRC和UCSD)共520名參與者(包括健康對照、輕度認知障礙(Mild Cognitive Impairment, MCI)患者和AD患者)的血漿樣本。核心實驗技術是共價蛋白質譜分析(Covalent Protein Profiling, CPP),這是一種化學蛋白質組學方法,通過定量分析蛋白質表面賴氨酸殘基的二甲基化標記程度,來測量其溶劑可及性(即結構暴露程度),從而在蛋白質組尺度上刻畫構象變化。研究人員利用液相色譜-串聯質譜(LC-MS/MS)對樣本進行分析,并結合多種機器學習算法對海量的結構數據進行挖掘,旨在尋找AD特異性的血漿蛋白結構特征。
研究結果
參與者的人口統計學特征和蛋白質結構譜
研究共分析了520份血漿樣本的蛋白質結構。兩個隊列的參與者在年齡上無顯著差異。研究人員通過CPP方法定量了來自373個蛋白質的3,655個標記肽段,并最終聚焦于在超過25%參與者中穩定檢測到的109個蛋白質的879個肽段。分析顯示,從健康對照到MCI再到AD,標記賴氨酸的平均可及性(Accessibility)呈逐步顯著下降趨勢,且個體間的變異系數(Coefficient of Variation, CV)逐漸增加,這提示隨著疾病進展,蛋白質穩態功能下降,錯誤折疊蛋白增多。相比之下,反映蛋白質豐度的非賴氨酸肽段強度變異較小,且在不同組間無差異。這些發現表明,蛋白質結構變化比表達水平變化更能反映疾病狀態,具有作為疾病分類特征的潛力。
評估蛋白質結構作為分類器的潛力
全局分析發現,蛋白質結構(即可及性)的組間差異比蛋白質表達(即強度)的差異更為顯著。例如,在健康對照 vs. MCI的比較中,42.3%的標記肽段顯示出顯著的可及性差異,而僅有31.8%的非標記肽段顯示出強度差異。此外,疾病早期(健康到MCI)發生的結構改變與整個疾病進程(健康到AD)的結構改變高度相關,提示部分蛋白的結構擾動在疾病早期就已發生。
APOE基因型對蛋白質組結構的影響
載脂蛋白E(ApoE)基因是AD最重要的遺傳風險因子。研究人員探究了不同APOE等位基因(ε2, ε3, ε4)如何影響與之相互作用的蛋白質的結構。通過多元線性回歸分析,他們發現了91個肽段(對應43個蛋白質)的可及性與APOE基因型顯著相關,其中25個蛋白質已知與ApoE存在相互作用。特別值得注意的是,補體成分C1q的A鏈(C1QA)的一個肽段(GFCDTTNLKGLF)的可及性在APOE ε4/ε4純合子攜帶者中最低,顯著低于其他基因型攜帶者。此外,α-1-抗胰蛋白酶(SERPINA3)的一個肽段(DVFEEGTEASAATAVKITLL)的可及性呈現雙峰分布,且低可及性個體在APOE ε4攜帶者中比例更高。計算結構分析為ApoE基因型依賴的SERPINA3結構變化提供了可能的機制解釋。
蛋白質結構變化受神經精神癥狀的性別差異性影響
幾乎所有AD患者都會出現神經精神癥狀(Neuropsychiatric Symptoms, NPS)。研究發現,在AD患者中,女性患者的NPS總分高于男性。線性回歸分析揭示了蛋白質結構可及性與NPS嚴重程度之間存在顯著的負相關關系,即癥狀越嚴重,可及性越低。重要的是,這種關聯存在性別差異:有45個肽段的可及性與NPS的關系具有性別特異性,其中17個僅在男性中顯著,28個僅在女性中顯著。例如,叢生蛋白(Clusterin, CLUS)的一個肽段(SVDCSTNNPSQAKL)的可及性在男女患者中均與NPS嚴重程度呈負相關,且其單獨使用就能較好地區分疾病早期和晚期階段。
基于蛋白質結構狀態的多標記物組合
為了開發一個穩健的診斷模型,研究人員將470份樣本(來自兩個隊列)按2:1的比例分為訓練集和獨立測試集,并系統地評估了18種機器學習算法。基于深度學習的模型在測試集上取得了最佳的三分類(健康 vs. MCI vs. AD)準確率,達到83.44%。該模型最終篩選出三個肽段構成多標記物組合:來自C1QA的GFCDTTNLKGLF、來自CLUS的SVDCSTNNPSQAKL和來自載脂蛋白B(Apolipoprotein B, ApoB)的AVLCEFISQSIKSF。值得注意的是,C1QA和CLUS的肽段在多個高性能算法模型中被一致選中。當用于二分類時,該組合表現出色:區分健康與MCI的曲線下面積(Area Under the ROC Curve, AUROC)為0.9343,區分MCI與AD的AUROC為0.9325。與僅基于蛋白質表達數據構建的模型相比,這個基于結構變化的多標記物組合診斷性能顯著更優。
多標記物組合與現有篩查工具及腦病理變化的相關性
該多標記物組合生成的“AD置信度”評分與臨床上常用的簡易精神狀態檢查(Mini-Mental State Examination, MMSE)和臨床癡呆評定量表總分(Clinical Dementia Rating Sum of Boxes, CDRSUM)評分高度相關。更重要的是,該評分與反映腦組織萎縮的腦室(特別是第三腦室)體積呈正相關,并與CSF中AD核心生物標志物(Aβ42、Aβ42/40比值、總tau蛋白和磷酸化tau181蛋白)的水平存在中等程度的相關性,這證實了該血液標志物組合能夠反映大腦中的病理變化。
多標記物組合在縱向隨訪樣本中的可重復性能
研究人員利用50份縱向隨訪樣本(最長達255天)驗證了模型的性能。該多標記物組合對縱向樣本的分類準確率達到86%。分析顯示,當參與者的診斷狀態發生變化時(如從健康轉為MCI或AD),其“AD置信度”評分會發生顯著改變;而當診斷保持不變時,評分則無顯著變化。這提示該組合不僅能診斷當前狀態,還可能具有追蹤疾病進展的潛力。
研究結論與討論
該研究成功地繪制了AD患者血漿蛋白質組的“結構圖譜”,揭示了疾病進展、APOE基因型和神經精神癥狀的性別差異如何共同塑造了特定的蛋白質構象特征。通過整合質譜技術與深度學習,研究團隊開發出了一個基于C1QA、CLUS和ApoB蛋白結構改變的三標記物診斷組合。這個組合在區分健康、MCI和AD方面表現出高準確度,并與認知評分、腦影像學和CSF生物標志物相關聯,在縱向樣本中也顯示了追蹤疾病變化的潛力。
這項研究的意義重大。首先,它首次在大型隊列中系統證明了血漿蛋白構象變化可以作為AD有效的診斷生物標志物,為理解AD的分子病理機制提供了新視角。其次,所開發的多標記物組合僅需血液樣本,具有無創、便于重復采集的優勢,為AD的大規模早期篩查和風險分層提供了極具前景的工具。最后,該研究揭示了蛋白質結構變化與遺傳風險(APOE)、臨床表現(NPS)之間的內在聯系,有助于未來開發更具針對性的個性化診療策略。盡管研究存在一些局限,如免疫親和去除高豐度蛋白可能導致部分生物標志物共丟失、縱向隨訪時間相對較短等,但其開創性的方法學和穩健的結果無疑為AD的血液生物標志物研究開辟了一條嶄新的“結構之路”,有望加速早期診斷技術的臨床轉化,并最終改善患者的治療結局。