《Frontiers in Endocrinology》:Development and external validation of a machine learning model for predicting in-hospital mortality in ICU patients with diabetic kidney disease: a study utilizing the MIMIC database and a Chinese cohort
1 引言
糖尿病(DM)是本世紀(jì)主要的醫(yī)療問題之一,持續(xù)對人類健康構(gòu)成重大威脅。2019年全球疾病負(fù)擔(dān)研究估計,糖尿病是導(dǎo)致死亡和殘疾的第八大最重要因素,當(dāng)年影響了全球近4.6億各年齡段人群。糖尿病腎病(DKD)作為糖尿病的常見并發(fā)癥,其特點是既往有糖尿病診斷、有腎臟損害指標(biāo)(如腎小球濾過率(GFR)降低)和持續(xù)性蛋白尿。隨著糖尿病患病率的上升,DKD的發(fā)病率也在增加。DKD現(xiàn)已成為終末期腎病(ESRD)的主要病因,導(dǎo)致生活質(zhì)量下降、生存率降低并帶來沉重的社會經(jīng)濟負(fù)擔(dān)。研究表明,DKD患者因任何原因?qū)е碌脑簝?nèi)死亡風(fēng)險顯著增加。此外,包括DKD繼發(fā)的ESRD患者在內(nèi)的ESRD患者,入住重癥監(jiān)護(hù)病房(ICU)的比率在1%至9%之間,遠(yuǎn)高于普通人群。鑒于DKD進(jìn)展加速和明顯的臨床異質(zhì)性特點,開發(fā)可靠有效的預(yù)后模型至關(guān)重要。
DKD本質(zhì)上是一個涉及多系統(tǒng)的復(fù)雜病理過程。患者常伴有心血管功能障礙、電解質(zhì)紊亂和多種代謝異常。這些動態(tài)生理參數(shù)通常表現(xiàn)出復(fù)雜的非線性相互作用。傳統(tǒng)預(yù)測方法,如邏輯回歸(LR)模型,已廣泛用于臨床風(fēng)險預(yù)測。然而,這些模型潛在的線性假設(shè)往往無法充分捕捉多維生物標(biāo)志物之間的協(xié)同或拮抗效應(yīng)。相比之下,機器學(xué)習(xí)(ML)技術(shù)為預(yù)測復(fù)雜的臨床結(jié)果提供了新方法。ML算法的一個關(guān)鍵優(yōu)勢在于其能夠通過自適應(yīng)學(xué)習(xí),在不依賴預(yù)設(shè)假設(shè)的情況下闡明高維變量之間的非線性關(guān)系和交互效應(yīng)。近年來,ML在預(yù)測危重患者結(jié)局方面顯示出廣闊的應(yīng)用前景。
然而,現(xiàn)有文獻(xiàn)主要關(guān)注特定疾病或治療方式,尚未探索其在危重DKD特定人群中的應(yīng)用。此外,大多數(shù)研究的預(yù)測時間點不同,且部分模型缺乏充分的外部驗證,限制了其在不同患者群體中的普適性和適用性。本研究的主要目標(biāo)是利用MIMIC-IV數(shù)據(jù)庫構(gòu)建并測試一個全面的ML模型,以評估DKD患者的院內(nèi)全因死亡風(fēng)險。為確保模型在不同醫(yī)療環(huán)境中的廣泛適用性,將進(jìn)行外部驗證以評估其泛化能力。
2 方法
2.1 倫理與知情同意聲明
MIMIC-IV數(shù)據(jù)庫經(jīng)過去標(biāo)識化處理以保護(hù)患者隱私,因此貝斯以色列女執(zhí)事醫(yī)療中心的機構(gòu)審查委員會(IRB)豁免了患者知情同意的要求。本研究根據(jù)觀察性常規(guī)收集健康數(shù)據(jù)報告指南、《赫爾辛基宣言》和美國國立衛(wèi)生研究院“保護(hù)人類研究參與者”在線課程進(jìn)行報告。長江大學(xué)倫理委員會審查并批準(zhǔn)了本研究。由于我們采用的是無法識別個體患者的匿名數(shù)據(jù)進(jìn)行回顧性研究,因此不需要知情同意。
2.2 數(shù)據(jù)來源描述
這項回顧性研究采用了來自MIMIC-IV(V3.1)的健康相關(guān)數(shù)據(jù),這是一個由麻省理工學(xué)院計算生理學(xué)實驗室創(chuàng)建和維護(hù)的大規(guī)模、可公開訪問的資源。該數(shù)據(jù)庫包含貝斯以色列女執(zhí)事醫(yī)療中心ICU住院患者的詳細(xì)健康記錄集合。為滿足數(shù)據(jù)庫訪問要求,一位作者完成了美國國立衛(wèi)生研究院的在線課程“保護(hù)人類研究參與者”,并負(fù)責(zé)數(shù)據(jù)提取。此外,還收集了長江大學(xué)第一附屬醫(yī)院ICU-DKD患者的數(shù)據(jù)用于外部驗證,形成了YTU-ICU數(shù)據(jù)庫。
2.3 研究人群
根據(jù)國際疾病分類第九版(ICD-9)和第十版(ICD-10)確診為DKD的患者被納入研究。患者需滿足以下標(biāo)準(zhǔn):(1)在ICU停留至少24小時;(2)分類變量(如性別、婚姻狀況、合并癥、用藥史和醫(yī)療操作)數(shù)據(jù)完整。如果患者有多次住院記錄,則僅收集首次住院的數(shù)據(jù)。臨床變量的數(shù)據(jù)收集于入住ICU后的最初24小時內(nèi)。主要結(jié)局是院內(nèi)死亡率,定義為住院期間任何時間點發(fā)生的任何原因的死亡。預(yù)測因子僅限于ICU入院后最初24小時的數(shù)據(jù),以便于早期風(fēng)險分層,而結(jié)局記錄則覆蓋整個住院期間。
2.4 數(shù)據(jù)收集
數(shù)據(jù)使用Navicate Premium通過執(zhí)行結(jié)構(gòu)化查詢語言(SQL)查詢進(jìn)行提取。潛在變量的提取分為五大類:(1)人口統(tǒng)計學(xué)信息,包括年齡、性別、婚姻狀況、體重、身高和體重指數(shù)(BMI)。(2)合并癥,如酸中毒、心律失常、電解質(zhì)紊亂、心血管疾病、肺炎、呼吸衰竭和膿毒癥。(3)實驗室標(biāo)志物,包括白蛋白(ALB)、丙氨酸氨基轉(zhuǎn)移酶(ALT)、天冬氨酸氨基轉(zhuǎn)移酶(AST)、活化部分凝血活酶時間(APTT)、碳酸氫鹽(BIC)、血尿素氮(BUN)、氯(CL)、肌酐(CR)、葡萄糖(GLU)、血紅蛋白(HB)、淋巴細(xì)胞(LYM)、中性粒細(xì)胞(NEU)、血小板(PLT)、鉀(K)、紅細(xì)胞分布寬度(RDW)、凝血酶原時間(PT)、鈉(NA)、總膽紅素(TB)、白細(xì)胞(LEU)。(4)入院時疾病嚴(yán)重程度評分,包括簡化急性生理學(xué)評分II(SAPS II)、膿毒癥相關(guān)器官衰竭評估評分(SOFA)和格拉斯哥昏迷評分(GCS)。(5)ICU常用藥物,包括胰島素、頭孢菌素、奧美拉唑、地塞米松、美羅培南和萬古霉素。
2.5 數(shù)據(jù)預(yù)處理與特征選擇
為減少潛在偏倚,任何缺失值超過20%的變量均被排除在本研究之外。對于缺失數(shù)據(jù)少于20%的變量,使用R軟件中的“mice”包進(jìn)行多重插補。數(shù)據(jù)中的異常值采用Winsorization方法處理,以減小極端值對分析結(jié)果的影響。MIMIC-IV數(shù)據(jù)庫被隨機劃分為訓(xùn)練集(70%)和內(nèi)部驗證集(30%)。僅對訓(xùn)練集應(yīng)用LASSO邏輯回歸模型來選擇最相關(guān)的預(yù)測因子,然后將選定的特征應(yīng)用于內(nèi)部驗證集和外部驗證集。這種方法旨在排除數(shù)據(jù)泄露并確保內(nèi)部驗證的完整性。lambda參數(shù)通過訓(xùn)練集內(nèi)的十倍交叉驗證確定。對于外部驗證隊列(YTU-ICU),由于所選預(yù)測因子中缺失數(shù)據(jù)的比例可忽略不計(小于1%),因此采用完整案例分析,未對外部集應(yīng)用插補模型。
2.6 模型開發(fā)與解釋
采用八種ML算法來預(yù)測DKD患者的院內(nèi)全因死亡風(fēng)險。這些算法包括極限梯度提升(XGBoost)、梯度提升決策樹(GBDT)、輕量級梯度提升機(LightGBM)、神經(jīng)網(wǎng)絡(luò)(NN)、邏輯回歸(LR)、樸素貝葉斯(NB)、隨機森林(RF)和支持向量機(SVM)。為獲得最佳預(yù)測性能,對復(fù)雜的非線性算法(包括XGBoost、GBDT、LightGBM、RF、SVM和NN)采用網(wǎng)格搜索策略進(jìn)行超參數(shù)調(diào)優(yōu)。在此過程中,基于訓(xùn)練集訓(xùn)練模型,并根據(jù)內(nèi)部驗證集評估模型性能,以確定最佳超參數(shù)組合。邏輯回歸和NB使用默認(rèn)參數(shù)。評估指標(biāo)包括受試者工作特征曲線下面積(AUROC)、準(zhǔn)確率、約登指數(shù)、敏感性、特異性、F1分?jǐn)?shù)、陽性預(yù)測值(PPV)和陰性預(yù)測值(NPV)。通過決策曲線分析(DCA)評估凈臨床效益。采用校準(zhǔn)曲線評估模型的可靠性。將內(nèi)部驗證集中具有最強區(qū)分度、校準(zhǔn)度和臨床效用平衡的模型定義為最佳模型。為評估模型在不同環(huán)境中的適應(yīng)性和泛化能力,使用YTU-ICU數(shù)據(jù)庫的獨立數(shù)據(jù)集測試其外部有效性。生成SHAP匯總圖以說明每個特征對預(yù)測結(jié)果的作用。此外,SHAP分析通過使用力圖的個體案例評估展示了特定樣本中每個特征的個體層面貢獻(xiàn),從而促進(jìn)對模型決策過程的更深入理解。
為進(jìn)一步確保可重復(fù)性并最小化過擬合風(fēng)險,所有程序均使用固定的隨機種子。關(guān)于類別不平衡,我們選擇在原始數(shù)據(jù)分布上訓(xùn)練所有模型以反映真實世界的臨床患病率(約18.2%),并使用AUROC和F1分?jǐn)?shù)作為穩(wěn)健的評估指標(biāo)。
2.7 統(tǒng)計方法
使用Shapiro-Wilk檢驗評估數(shù)據(jù)正態(tài)性。正態(tài)分布的連續(xù)數(shù)據(jù)用均數(shù)(標(biāo)準(zhǔn)差)總結(jié),并使用獨立樣本t檢驗進(jìn)行比較。對于非正態(tài)分布的變量,使用Mann-Whitney U檢驗進(jìn)行比較,數(shù)據(jù)用中位數(shù)和四分位距總結(jié)。使用卡方檢驗或Fisher精確檢驗比較分類變量,數(shù)據(jù)用頻率和百分比總結(jié)。使用R進(jìn)行數(shù)據(jù)分析和所有計算。統(tǒng)計顯著性的標(biāo)準(zhǔn)為雙尾假設(shè)P < 0.05。
考慮到結(jié)局不平衡以及開發(fā)隊列和外部隊列之間事件發(fā)生率的差異,我們使用AUROC和精確率-召回率曲線下面積(PR-AUC)評估模型的區(qū)分度。通過將觀測結(jié)局對預(yù)測概率的logit值進(jìn)行回歸,使用Brier評分、大樣本校準(zhǔn)(校準(zhǔn)截距)和校準(zhǔn)斜率來量化校準(zhǔn)度。通過估計從0.1到0.5閾值概率范圍內(nèi)的凈效益,使用決策曲線分析評估臨床效用。所有指標(biāo)的不確定性均使用非參數(shù)自助法重抽樣進(jìn)行估計。
3 結(jié)果
3.1 人群人口統(tǒng)計學(xué)特征
最初篩選了10,686名DKD患者。在應(yīng)用納入和排除標(biāo)準(zhǔn)后,最終有3,403例患者被納入最終分析。同時,從長江大學(xué)篩選了261名患者,最終保留260名作為外部驗證隊列。詳細(xì)的人口統(tǒng)計學(xué)和臨床特征數(shù)據(jù)顯示,存活組和死亡組在年齡、收縮壓、脈搏、呼吸頻率、白蛋白(ALB)、丙氨酸氨基轉(zhuǎn)移酶(ALT)、天冬氨酸氨基轉(zhuǎn)移酶(AST)、活化部分凝血活酶時間(APTT)、血尿素氮(BUN)、氯(CL)、肌酐(CR)、血紅蛋白(HB)、淋巴細(xì)胞(LYM)、中性粒細(xì)胞(NEU)、凝血酶原時間(PT)、紅細(xì)胞分布寬度(RDW)、總膽紅素(TB)、酸中毒、心律失常、電解質(zhì)紊亂、肺炎、呼吸衰竭、膿毒癥、頭孢菌素、地塞米松、美羅培南、萬古霉素、連續(xù)性腎臟替代治療(CRRT)、機械通氣(MV)、格拉斯哥昏迷評分(GCS)、簡化急性生理學(xué)評分II(SAPS II)和序貫器官衰竭評估(SOFA)評分方面存在顯著差異。
3.2 特征選擇
篩選過程最初收集了45個臨床特征作為可能的輸入變量。為確定與DKD患者全因死亡風(fēng)險相關(guān)的重要變量,采用了LASSO回歸。調(diào)整參數(shù)λ被用來控制β系數(shù)的懲罰。最終識別出十個系數(shù)非零的潛在預(yù)測因子,即年齡、淋巴細(xì)胞計數(shù)、紅細(xì)胞分布寬度(RDW)、酸中毒、肺炎、呼吸衰竭、美羅培南、萬古霉素、簡化急性生理學(xué)評分II(SAPS II)和序貫器官衰竭評估(SOFA)評分。隨后使用這些預(yù)測因子進(jìn)行模型構(gòu)建。
3.3 模型評估與比較
采用訓(xùn)練數(shù)據(jù)集構(gòu)建了八種不同的ML模型。每種模型在訓(xùn)練集和內(nèi)部驗證集上的性能通過一套綜合指標(biāo)進(jìn)行評估。在內(nèi)部驗證集中,XGBoost表現(xiàn)出最高的AUROC,為0.738,其次是LightGBM(0.731)、NN(0.73)、LR(0.728)、GBDT和NB(0.723)、RF(0.722)以及SVM(0.67)。校準(zhǔn)曲線顯示,XGBoost模型在兩個數(shù)據(jù)集上都表現(xiàn)出最佳的校準(zhǔn)性能。決策曲線分析(DCA)用于探索每個模型在一系列閾值概率下的凈臨床效益。結(jié)果表明,XGBoost模型的凈效益在廣泛的閾值概率范圍內(nèi)超過了“全治療”和“不治療”策略,突顯了該模型在有效估計死亡風(fēng)險和減少不適當(dāng)治療方面的臨床價值。
3.4 外部驗證
使用包含260名患者數(shù)據(jù)的YTU-ICU數(shù)據(jù)庫進(jìn)一步驗證了每個模型對DKD患者全因死亡的預(yù)測性能。在外部驗證隊列中,邏輯回歸(LR)模型表現(xiàn)出最佳的區(qū)分能力,AUROC為0.761。其余模型的AUROC得分分別為:XGBoost(0.746)、GBDT(0.74)、LightGBM(0.735)、NB(0.731)、RF(0.712)、NN(0.702)和SVM(0.56)。盡管LR模型的AUROC略高于XGBoost,但XGBoost模型因其更優(yōu)的臨床效用被選為最終的最佳模型。決策曲線分析(DCA)顯示,在廣泛的閾值概率范圍內(nèi),XGBoost提供的凈臨床效益持續(xù)高于LR和其他模型。這表明XGBoost在指導(dǎo)臨床干預(yù)和減少真實世界ICU環(huán)境中不必要的傷害方面更為有效。XGBoost模型的預(yù)測性能優(yōu)于傳統(tǒng)的SOFA和SAPS II評分系統(tǒng)。然而,校準(zhǔn)曲線在外部驗證隊列中擬合不佳,這可能歸因于YTU-ICU數(shù)據(jù)集樣本量較小以及患者人口統(tǒng)計學(xué)特征相對于MIMIC-IV的差異。
在外部驗證隊列中,主要模型保持了相當(dāng)?shù)膮^(qū)分度,但校準(zhǔn)度顯著下降,表現(xiàn)為明顯為正的校準(zhǔn)截距和大于1的校準(zhǔn)斜率,表明在不同基線風(fēng)險下存在系統(tǒng)性的錯誤校準(zhǔn)。這些發(fā)現(xiàn)表明,雖然區(qū)分度在不同隊列間轉(zhuǎn)移得相當(dāng)好,但在臨床部署前可能需要進(jìn)行局部重新校準(zhǔn)和隊列特定的閾值調(diào)整。
3.5 可解釋性分析
SHAP分析提供了對XGBoost模型的深入解釋。呼吸衰竭、淋巴細(xì)胞計數(shù)、序貫器官衰竭評估(SOFA)評分、紅細(xì)胞分布寬度(RDW)、年齡、簡化急性生理學(xué)評分II(SAPS II)、酸中毒、萬古霉素、肺炎和美羅培南被確定為預(yù)測DKD患者全因死亡風(fēng)險的十個最重要因素,并按重要性排序。呼吸衰竭、酸中毒、肺炎、萬古霉素使用和美羅培南使用被識別為與死亡率相關(guān)的特征,并顯示出正的SHAP值,從而有助于模型預(yù)測傾向于死亡率。淋巴細(xì)胞計數(shù)、序貫器官衰竭評估(SOFA)評分、紅細(xì)胞分布寬度(RDW)、年齡和簡化急性生理學(xué)評分II(SAPS II)評分進(jìn)一步促進(jìn)了死亡率的預(yù)測。
SHAP依賴圖用于進(jìn)一步分析十個因素對XGBoost模型預(yù)測死亡風(fēng)險的影響。結(jié)果顯示,呼吸衰竭、酸中毒、嚴(yán)重肺炎以及萬古霉素和美羅培南的使用與死亡率升高顯著相關(guān)。值得注意的是,死亡風(fēng)險隨著呼吸衰竭和酸中毒的嚴(yán)重程度而增加。相反,淋巴細(xì)胞計數(shù)降低與死亡風(fēng)險升高相關(guān),而較高的淋巴細(xì)胞計數(shù)可能降低死亡風(fēng)險。較高的序貫器官衰竭評估(SOFA)評分、年齡較大、紅細(xì)胞分布寬度(RDW)升高和較高的簡化急性生理學(xué)評分II(SAPS II)評分顯示出與死亡風(fēng)險升高的密切相關(guān)性,這些因素在數(shù)值較高時對死亡風(fēng)險的貢獻(xiàn)更為顯著。此外,萬古霉素和美羅培南使用的增加與死亡風(fēng)險顯著升高相關(guān),表明這些抗生素的使用可能作為患者病情更危重以及存在嚴(yán)重或耐藥感染的臨床替代指標(biāo)。
4 討論
目前尚無專門關(guān)注ICU-DKD患者院內(nèi)全因死亡的ML預(yù)測模型研究。本研究利用MIMIC-IV和YTU-ICU數(shù)據(jù)庫創(chuàng)建并測試了一個可解釋的ML預(yù)測模型,以探索ICU-DKD患者的全因死亡風(fēng)險。主要發(fā)現(xiàn)如下:XGBoost模型在預(yù)測ICU-DKD患者院內(nèi)全因死亡方面表現(xiàn)出良好的性能,為早期風(fēng)險識別和個體化干預(yù)提供了有力支持。該模型在外部驗證隊列中表現(xiàn)出令人滿意的泛化能力。盡管患者特征存在差異,模型仍顯示出穩(wěn)定的預(yù)測性能,為其在不同臨床環(huán)境中的應(yīng)用奠定了基礎(chǔ)。SHAP分析揭示,呼吸衰竭、淋巴細(xì)胞計數(shù)、序貫器官衰竭評估(SOFA)評分、紅細(xì)胞分布寬度(RDW)和年齡是影響死亡風(fēng)險的關(guān)鍵因素,為臨床決策提供了重要依據(jù)。
隨著機器學(xué)習(xí)的發(fā)展,XGBoost已成為醫(yī)療保健領(lǐng)域構(gòu)建預(yù)測模型的一種高效且廣泛應(yīng)用的方法。先前的研究結(jié)果表明,XGBoost模型在預(yù)測糖尿病酮癥酸中毒患者發(fā)生急性腎損傷方面非常有效。因此,XGBoost成為創(chuàng)建醫(yī)學(xué)應(yīng)用預(yù)測模型的有前途的工具。通過應(yīng)用ML技術(shù)實現(xiàn)了對ICU-DKD患者的預(yù)測建模。從最初的45個臨床變量中篩選出十個信息量最大的變量,并用其構(gòu)建了八個ML模型,隨后進(jìn)行了內(nèi)部驗證和外部驗證。研究結(jié)果表明,XGBoost模型被證明是預(yù)測院內(nèi)全因死亡最有效的模型。XGBoost在本研究中的預(yù)測性能可能歸功于其集成學(xué)習(xí)框架。具體而言,從大量決策樹中匯總預(yù)測結(jié)果有助于準(zhǔn)確表示預(yù)測變量之間復(fù)雜的非線性交互作用。XGBoost具有固有的特征選擇能力,可以消除冗余特征并降低過擬合的敏感性。此外,它對缺失數(shù)據(jù)和高維性具有魯棒性,這有助于提高其臨床預(yù)測的性能。
盡管具有令人滿意的區(qū)分度,但該模型在外部隊列中表現(xiàn)出次優(yōu)的校準(zhǔn)度,這可能源于YTU-ICU人群疾病嚴(yán)重程度更高。與來自MIMIC-IV的訓(xùn)練集相比,YTU-ICU人群顯示出更高的簡化急性生理學(xué)評分II(SAPS II)評分和更高的膿毒癥患病率。鑒于這些基線風(fēng)險的差異,模型可能會系統(tǒng)性地低估外部隊列的絕對死亡風(fēng)險。因此,在異構(gòu)的醫(yī)療環(huán)境中部署預(yù)測模型需要進(jìn)行重新校準(zhǔn)。
研究使用SHAP來解釋XGBoost模型,重點關(guān)注了與ICU-DKD患者院內(nèi)全因死亡相關(guān)的幾個關(guān)鍵變量。研究發(fā)現(xiàn),呼吸衰竭是預(yù)測死亡風(fēng)險的首要決定因素。先前的研究表明,呼吸衰竭是許多危重患者(尤其是膿毒癥患者)不良結(jié)局的關(guān)鍵預(yù)測因子,并與患者健康狀況惡化和呼吸功能下降密切相關(guān)。呼吸衰竭通過激活肺部的化學(xué)感受器和機械感受器,增強呼吸中樞的神經(jīng)反射,導(dǎo)致呼吸頻率增加和潮氣量減少,進(jìn)而形成快速淺表的呼吸模式,進(jìn)一步加劇患者病情。此外,炎癥反應(yīng)和肺損傷可導(dǎo)致肺功能惡化,并可能引發(fā)多器官衰竭。我們的研究強調(diào)了呼吸衰竭在預(yù)測院內(nèi)死亡方面的關(guān)鍵作用,尤其是在ICU-DKD患者中,其對死亡率的預(yù)測能力最為顯著。
免疫系統(tǒng)的功能狀態(tài)顯著影響ICU環(huán)境中患者的臨床結(jié)局。特別是在患有糖尿病的ICU患者中,免疫抑制和免疫功能障礙常常會加劇患者病情并增加死亡風(fēng)險。免疫抑制可歸因于多種因素,包括糖尿病相關(guān)的免疫功能障礙、慢性炎癥和藥物治療方案。在此背景下,作為免疫系統(tǒng)核心成分的淋巴細(xì)胞計數(shù)的變化,可能是死亡風(fēng)險的重要預(yù)測指標(biāo)。淋巴細(xì)胞主要參與識別和清除外來病原體,并在免疫反應(yīng)中發(fā)揮調(diào)節(jié)作用。淋巴細(xì)胞計數(shù)的減少通常意味著免疫系統(tǒng)的抑制或功能不全。DKD患者表現(xiàn)出免疫功能受損并伴有慢性低度炎癥。這種免疫抑制狀態(tài)使患者容易發(fā)生感染,而感染被認(rèn)為是ICU環(huán)境中導(dǎo)致死亡的重要因素。重要的是,免疫抑制狀態(tài)不僅僅以淋巴細(xì)胞減少為特征,它還可以通過影響整體免疫反應(yīng)來調(diào)節(jié)炎癥標(biāo)志物的平衡。因此,淋巴細(xì)胞計數(shù)的變化是評估ICU-DKD患者免疫功能障礙和預(yù)測死亡風(fēng)險的重要決定因素。
現(xiàn)有研究已證實,序貫器官衰竭評估(SOFA)和簡化急性生理學(xué)評分II(SAPS II)作為整合了多個器官功能參數(shù)的綜合工具,在ICU各種疾病的預(yù)后評估中具有重要的臨床意義。我們的研究結(jié)果表明,較高的序貫器官衰竭評估(SOFA)評分和簡化急性生理學(xué)評分II(SAPS II)評分與ICU-DKD患者院內(nèi)全因死亡風(fēng)險的升高顯著相關(guān)。針對特定危重患者群體的臨床研究表明,在首次入住ICU的腎移植受者中,早期序貫器官衰竭評估(SOFA)評分的動態(tài)變化與90天臨床結(jié)局顯著相關(guān)。在接受連續(xù)性腎臟替代治療(CRRT)的患者中,簡化急性生理學(xué)評分II(SAPS II)評分系統(tǒng)對術(shù)后最初48小時內(nèi)的死亡風(fēng)險具有顯著的預(yù)測能力。序貫器官衰竭評估(SOFA)和簡化急性生理學(xué)評分II(SAPS II)評分系統(tǒng)在ICU患者預(yù)后評估中的應(yīng)用,為早期風(fēng)險分層和針對性干預(yù)提供了有力證據(jù)。
DKD的發(fā)病機制復(fù)雜,當(dāng)前研究一致表明炎癥是DKD發(fā)生和加重的關(guān)鍵因素。炎癥可能通過調(diào)節(jié)紅細(xì)胞生成、縮短紅細(xì)胞壽命以及改變紅細(xì)胞大小的同質(zhì)性等機制導(dǎo)致紅細(xì)胞分布寬度(RDW)升高。紅細(xì)胞分布寬度(RDW)作為紅細(xì)胞大小異質(zhì)性的衡量指標(biāo),可以反映生物體內(nèi)的氧化應(yīng)激和炎癥程度。因此,紅細(xì)胞分布寬度(RDW)被認(rèn)為是DKD患者風(fēng)險分層的潛在預(yù)后因素。最近的研究越來越多地證實了紅細(xì)胞分布寬度(RDW)在預(yù)測DKD發(fā)病率和臨床結(jié)局方面的價值。此外,萬古霉素和美羅培南等治療相關(guān)變量被納入我們的模型,但這些應(yīng)被解釋為反映疾病嚴(yán)重程度的指標(biāo)。這些抗生素是存在嚴(yán)重或耐藥感染的替代標(biāo)志物,而非導(dǎo)致死亡的直接原因。它們的高預(yù)測權(quán)重表明需要使用此類強效抗菌治療的患者病情危重。
值得注意的是,我們模型中最終選擇的預(yù)測因子,如序貫器官衰竭評估(SOFA)、簡化急性生理學(xué)評分II(SAPS II)和呼吸衰竭,反映的是一般的系統(tǒng)嚴(yán)重程度,而非糖尿病腎病(DKD)特異性參數(shù),如糖化血紅蛋白(HbA1c)或尿白蛋白與肌酐比值(UACR)。這可以歸因于幾個因素。首先,慢性糖尿病腎病(DKD)的標(biāo)志物(如糖化血紅蛋白(HbA1c)和蛋白尿)在急性ICU環(huán)境中通常缺失率很高。因此,這些變量在我們的初始數(shù)據(jù)預(yù)處理階段就被排除了。其次,雖然肌酐和血尿素氮(BUN)等指標(biāo)被納入了最初的LASSO回歸,但它們被綜合評分和急性并發(fā)癥標(biāo)志物所取代。這表明對于危重糖尿病腎病(DKD)患者,院內(nèi)死亡的即刻風(fēng)險更多地歸因于急性生理性失代償和多器官衰竭,而非基線慢性腎臟病。因此,我們的模型捕捉到了高風(fēng)險ICU-DKD人群的急性加重于慢性的特征。
4.1 優(yōu)勢與局限性
與以往研究相比,本研究具有若干優(yōu)勢。首先,本研究利用了MIMIC-IV數(shù)據(jù)庫,它提供了一個更大、更新、質(zhì)量更高的數(shù)據(jù)集。其次,采用了多種ML算法來評估不同模型的預(yù)測能力,并根據(jù)模型在各項評估指標(biāo)上的綜合表現(xiàn)選擇了最優(yōu)模型。此外,進(jìn)行了外部驗證,增強了模型的準(zhǔn)確性和泛化能力,并證實了其在不同醫(yī)療環(huán)境中的適用性。最后,采用SHAP分析對XGBoost模型進(jìn)行了深入的可解釋性分析,揭示了影響糖尿病腎病(DKD)患者死亡風(fēng)險的關(guān)鍵因素,為臨床決策提供了寶貴見解。
然而,我們的研究也存在一些局限性。首先,本研究涵蓋了多種臨床特征和實驗室指標(biāo),但由于缺失數(shù)據(jù)超過20%,一些與不良預(yù)后相關(guān)的危險因素被排除在分析之外。其次,死亡風(fēng)險預(yù)測模型基于ICU入院后最初24小時內(nèi)收集的數(shù)據(jù),可能會遺漏后來發(fā)生的影響結(jié)局的事件,并引入了混雜變量。此外,我們承認(rèn)在幾個排名靠前的預(yù)測因子之間存在臨床共線性。呼吸衰竭、肺炎和廣譜抗生素的使用在臨床上是相互關(guān)聯(lián)的,通常反映了嚴(yán)重的感染或膿毒癥綜合征。另外,序貫器官衰竭評估(SOFA)評分本身就包含了與呼吸功能障礙相關(guān)的參數(shù),這可能與呼吸衰竭存在重疊。盡管XGBoost在處理多維數(shù)據(jù)方面具有魯棒性,但這種共線性可能會影響分配給這些特征的個體SHAP重要性。因此,SHAP結(jié)果應(yīng)被解釋為識別了幾個共同反映系統(tǒng)性嚴(yán)重感染或膿毒癥綜合征的指標(biāo),而非獨立的危險因素。此外,雖然使用了外部驗證隊列,但有限的樣本量可能限制XGBoost模型在臨床環(huán)境中的適用性。最后,盡管采用了先進(jìn)的ML算法進(jìn)行預(yù)測,但研究中使用的模型尚未開發(fā)成可直接臨床應(yīng)用的應(yīng)用程序。未來的研究可以考慮將我們的模型轉(zhuǎn)化為可操作的在線應(yīng)用平臺,使臨床醫(yī)生和醫(yī)療保健提供者能夠方便地使用該工具進(jìn)行臨床預(yù)測和管理。此外,考慮到不同醫(yī)療中心之間固有的數(shù)據(jù)集偏移,在異構(gòu)人群中進(jìn)行臨床部署之前,可能需要進(jìn)行局部重新校準(zhǔn)以優(yōu)化模型的預(yù)測性能。
5 結(jié)論
我們開發(fā)了一個可解釋的XGBoost預(yù)測模型,該模型在預(yù)測重癥糖尿病腎病(DKD)患者院內(nèi)全因死亡方面表現(xiàn)出良好的性能。SHAP提供了對特征重要性排序、個體特征的閾值以及每個特征與結(jié)局正負(fù)相關(guān)性的直觀解釋。這有助于醫(yī)療保健專業(yè)人員早期識別并進(jìn)行針對性管理,從而促進(jìn)重癥糖尿病腎病(DKD)患者的康復(fù)和生存。然而,由于外部校準(zhǔn)效果欠佳,在將模型應(yīng)用于異質(zhì)性臨床環(huán)境之前,應(yīng)考慮進(jìn)行局部重新校準(zhǔn)和隊列特定的閾值選擇。