《Virulence》:Machine learning prediction of functional cure to pegylated interferon-alpha therapy in two HBV populations: Advantaged populations and HBeAg-negative patients
編輯推薦:
本文構建并驗證了兩個可基線預測聚乙二醇干擾素α(PEG-IFNα)治療慢性乙型肝炎(CHB)功能性治愈的列線圖模型。SHAN模型基于年齡、性別、中性粒細胞百分比(NE%)和log(HBsAg+1)四個常規變量,適用于HBeAg陰性患者;FLASH-N模型在此基礎上納入甲胎蛋白(AFP)和乳酸脫氫酶(LDH),專門用于預測優勢人群的治療結局。兩個模型均顯示出優異的鑒別、校準能力和臨床凈獲益,為個體化治療決策提供了有力工具。
1. 引言
慢性乙型肝炎病毒(HBV)感染是全球重大健康挑戰,每年導致約110萬人死亡。當前抗病毒策略,如核苷(酸)類似物(NAs)和聚乙二醇干擾素α(PEG-IFNα),對實現功能性治愈(定義為治療結束后持續HBsAg清除≥24周,同時HBV DNA檢測不到且肝功能正常)的能力有限。近期臨床試驗發現,針對所謂的“優勢人群”——其特征為HBV DNA檢測不到、HBeAg血清學轉換且HBsAg水平<1500 IU/mL——采用PEG-IFNα和NAs的序貫或聯合治療,功能性治愈率可達33%,在基線HBsAg水平低的患者中甚至超過50%。然而,實際功能性治愈率并不穩定,亟需可靠的預測工具來指導個體化治療。雖然已有一些預測模型,但它們常依賴非常規檢測指標(如HBV基因型、HBcrAg)或多個隨訪點的HBsAg動態測量,難以在臨床實踐中廣泛應用。為此,本研究旨在利用機器學習方法,從大量常規臨床變量中篩選獨立預后因素,為HBeAg陰性患者,尤其是接受PEG-IFNα和NAs聯合治療的優勢人群,開發和驗證一個多變量預測模型。
2. 材料與方法
本研究為回顧性隊列研究,共納入202名接受PEG-IFNα-2b治療(單藥或聯合NAs)的HBeAg陰性慢性乙型肝炎(CHB)患者用于模型推導和內部驗證,并納入183名來自其他兩家醫院的患者用于外部驗證。研究共收集了包括人口統計學、病毒學標志物、血液學指標、生化標志物、腫瘤標志物及影像學評估在內的48項候選預測變量。結局分為功能性治愈(FC)和非功能性治愈(NFC)。數據分析首先進行了單因素邏輯回歸篩選變量,隨后采用最小絕對收縮和選擇算子(LASSO)回歸進行特征選擇。在優勢人群中,因樣本量較小,應用了500次自助抽樣(Bootstrap)再進行LASSO回歸。然后,通過多因素邏輯回歸構建最終預測模型并繪制列線圖。對于優勢人群模型,還應用了Firth校正以減少小樣本偏倚。模型性能通過受試者工作特征(ROC)曲線下面積(AUC)、校準曲線和決策曲線分析(DCA)進行評估,并進行了外部驗證和敏感性分析。
3. 結果
3.1 患者臨床特征
最終納入的202名HBeAg陰性患者中,114名被歸類為優勢人群。FC組與NFC組在甲胎蛋白(AFP)、log_HBsAg、性別和膽堿酯酶(ACHE)等方面存在顯著差異。在外部驗證隊列中,除性別分布外,其他候選預測變量與推導隊列無顯著差異。
3.2 單因素和LASSO回歸分析功能性治愈預測因素
在HBeAg陰性患者中,單因素分析初篩出16個變量,結合臨床考慮因素,最終通過LASSO回歸保留了11個非零系數預測因子,包括log_HBsAg、AFP、NE%、單核細胞計數(Mon)、ACHE、性別、年齡、HBV DNA、LDH、血小板(PLT)和肝臟硬度值(LSM)。
在優勢人群中,經過500次Bootstrap迭代的LASSO回歸,最終確定了8個關鍵預測因子。
3.3 多因素回歸分析功能性治愈預測因素
在HBeAg陰性訓練隊列中,通過逐步回歸,從LASSO篩選的變量中最終確定了四個關鍵預測因子:年齡、log_HBsAg、NE%和性別,構成了SHAN模型的基礎。在優勢人群中,多因素回歸結合Firth校正后,最終模型包含了六個預測因子:log_HBsAg、AFP、LDH、年齡、性別和NE%,構成了FLASH-N模型。
3.4 功能性治愈基線預測模型的開發
基于多因素分析結果,研究構建了兩個列線圖預測模型。針對HBeAg陰性患者的SHAN模型的數學表達式為:Logit(P) = 5.97 - 0.96×log_HBsAg - 1.52×Sex (男性=1,女性=0) - 0.076×Age + 0.048×NE%。對應的列線圖整合了這四個變量,可直觀計算總分并估計功能性治愈概率。
針對優勢人群的FLASH-N模型表達式為:Logit(P) = 8.54 - 0.89×log_HBsAg - 1.17×Sex (男性=1,女性=0) - 0.060×Age + 0.053×NE% - 0.012×LDH - 0.74×AFP。夏普利加法解釋(SHAP)分析進一步揭示了各變量在模型預測中的相對重要性。
3.5 列線圖的性能評估
兩個模型均表現出優異的判別能力。在HBeAg陰性患者中,SHAN模型在訓練集和測試集的AUC分別達到0.908和0.949。在優勢人群中,FLASH-N模型的AUC為0.920,經過Bootstrap驗證校正后仍保持在0.889。
與已有的OASIS模型相比,本研究模型顯示出更優的區分度。敏感性分析表明,無論患者先前是否接受過NAs治療,兩個模型的性能均保持穩定。校準曲線顯示,在各個數據集中,模型的預測概率與實際觀測結果高度一致。決策曲線分析則證明,在廣泛的閾值概率范圍內,與單一變量或“全治/全不治”策略相比,兩個列線圖模型均能提供更高的臨床凈獲益。
外部驗證進一步確認了模型的穩健性。在外部HBeAg陰性患者隊列中,SHAN模型的AUC為0.861;在外部優勢人群隊列中,FLASH-N模型的AUC為0.800,且決策曲線分析證實其臨床效用優于單一預測因子。
4. 討論
本研究全面評估了接受PEG-IFNα治療的CHB患者基線特征,并成功開發了分別針對HBeAg陰性患者和優勢人群的SHAN與FLASH-N列線圖預測模型。研究確認了年齡、性別、NE%和HBsAg是預測治療結局的關鍵因素,其中基線HBsAg水平是最重要的貢獻者。在優勢人群中,額外納入的LDH和AFP進一步優化了預測。NE%的作用可能與中性粒細胞胞外誘捕網(NETs)的抗病毒免疫功能有關。研究也存在局限性,例如模型中包含的NE%、LDH并非肝臟特異性標志物,且研究隊列存在性別比例失衡。盡管如此,基于年齡、性別、qHBsAg和AFP等常規臨床變量構建的這兩個模型,展現出強大的預測能力,為臨床實踐中追求CHB功能性治愈的個體化決策提供了實用工具。