<tt id="vwe5b"></tt>
      1. <tfoot id="vwe5b"><progress id="vwe5b"></progress></tfoot><abbr id="vwe5b"></abbr>

      2. 91人人妻,99偷拍,碰碰免费视频,亚洲中文字幕AV,丝袜a片,91纯肉动漫,中文无码日,伊人福利导航

        結(jié)直腸癌篩查質(zhì)量監(jiān)控新路徑:一種基于隨機(jī)森林混合自然語(yǔ)言處理模型的結(jié)腸鏡檢查結(jié)果自動(dòng)分類方法

        《The Clinical Journal of Pain》:Rafiq syndrome in a Saudi patient: novel homozygous MAN1B1 variant (c.1118C>G; p.Pro373Arg) and expanded phenotypic spectrum

        【字體: 時(shí)間:2026年03月02日 來(lái)源:The Clinical Journal of Pain 3.1

        編輯推薦:

          本文旨在解決結(jié)腸鏡檢查中結(jié)直腸腫瘤檢測(cè)率(Neoplasia Detection Rate)手工計(jì)算耗時(shí)費(fèi)力、實(shí)施門檻高的質(zhì)量監(jiān)控難題。研究團(tuán)隊(duì)利用自然語(yǔ)言處理(NLP)技術(shù)結(jié)合隨機(jī)森林(Random Forest)機(jī)器學(xué)習(xí)算法,開(kāi)發(fā)了一套可自動(dòng)、準(zhǔn)確地將無(wú)結(jié)構(gòu)病理報(bào)告文本分類為腺瘤、鋸齒狀病變或晚期腫瘤的系統(tǒng)。該系統(tǒng)在獨(dú)立的測(cè)試集上表現(xiàn)出色(AUC達(dá)0.99以上),為規(guī)模化、低成本地監(jiān)測(cè)和提升結(jié)腸鏡檢查質(zhì)量,以降低結(jié)直腸癌(CRC)發(fā)病率和死亡率,提供了一種高效、可解釋的技術(shù)方案。

          
        引言
        結(jié)直腸癌(CRC)是美國(guó)癌癥相關(guān)死亡的主要原因之一。結(jié)腸鏡檢查是CRC篩查和預(yù)防的基石,能夠同時(shí)檢測(cè)和切除結(jié)直腸病變。腺瘤檢測(cè)率(ADR)是衡量結(jié)腸鏡檢查質(zhì)量的最重要指標(biāo),高ADR與較低的結(jié)腸鏡檢查后CRC發(fā)生率和死亡率相關(guān)。然而,計(jì)算腫瘤檢測(cè)率通常需要大量人力對(duì)結(jié)腸鏡和內(nèi)窺鏡報(bào)告及匹配的病理報(bào)告進(jìn)行手動(dòng)提取,這阻礙了許多醫(yī)療機(jī)構(gòu)常規(guī)開(kāi)展此項(xiàng)質(zhì)量監(jiān)測(cè)。近年來(lái),機(jī)器學(xué)習(xí)工具,特別是自然語(yǔ)言處理(NLP),為自動(dòng)化分類提供了可能性。雖然已有NLP方法應(yīng)用于報(bào)告分類,但隨機(jī)森林模型在結(jié)直腸腫瘤分類中的應(yīng)用尚未被深入評(píng)估。本研究旨在開(kāi)發(fā)和驗(yàn)證一種自動(dòng)工具,將NLP與隨機(jī)森林機(jī)器學(xué)習(xí)相結(jié)合,以實(shí)現(xiàn)病理報(bào)告的自動(dòng)分類,從而為監(jiān)控結(jié)腸鏡檢查質(zhì)量提供可擴(kuò)展的解決方案。
        方法
        數(shù)據(jù)集分析:本研究在梅奧診所機(jī)構(gòu)審查委員會(huì)批準(zhǔn)后,進(jìn)行了一項(xiàng)回顧性隊(duì)列研究。研究團(tuán)隊(duì)利用之前工作中建立的、基于規(guī)則的算法識(shí)別結(jié)直腸腫瘤的隊(duì)列作為訓(xùn)練集。該訓(xùn)練集涵蓋了2014年至2017年期間多個(gè)電子健康記錄系統(tǒng)的數(shù)據(jù),包括與無(wú)結(jié)構(gòu)病理報(bào)告配對(duì)的結(jié)腸鏡檢查程序,并使用系統(tǒng)醫(yī)學(xué)命名法-臨床術(shù)語(yǔ)(SNOMED-CT)作為訓(xùn)練標(biāo)簽。在機(jī)構(gòu)于2017年初更換為Epic電子健康記錄系統(tǒng)后,病理報(bào)告不再使用SNOMED-CT,因此本研究的目標(biāo)是創(chuàng)建一種模型,能夠?qū)罄m(xù)無(wú)標(biāo)簽的病理報(bào)告文本進(jìn)行自動(dòng)分類。
        模型設(shè)計(jì)與實(shí)現(xiàn):研究采用隨機(jī)森林機(jī)器學(xué)習(xí)方法,針對(duì)三類關(guān)鍵病變(腺瘤、無(wú)蒂鋸齒狀病變/傳統(tǒng)鋸齒狀腺瘤、晚期病變)分別構(gòu)建了預(yù)測(cè)模型。模型開(kāi)發(fā)使用R語(yǔ)言,并利用tidymodels等軟件包。首先,對(duì)無(wú)結(jié)構(gòu)病理報(bào)告文本進(jìn)行詞元化,生成了包括單字、雙字組和三字組在內(nèi)的500個(gè)結(jié)構(gòu)化特征。這些特征被用于訓(xùn)練模型。研究團(tuán)隊(duì)將訓(xùn)練數(shù)據(jù)集分割為訓(xùn)練集和測(cè)試集,并通過(guò)5折交叉驗(yàn)證來(lái)調(diào)整模型超參數(shù),包括節(jié)點(diǎn)中最小數(shù)據(jù)點(diǎn)數(shù)、每棵樹(shù)隨機(jī)采樣的預(yù)測(cè)因子數(shù)量和樹(shù)的總數(shù)。最終,根據(jù)測(cè)試集的性能指標(biāo)(如受試者工作特征曲線下面積AUC、敏感度、特異度等)確定分類的閾值點(diǎn)。最終模型在完整的訓(xùn)練集上進(jìn)行訓(xùn)練,并在一個(gè)獨(dú)立的、手動(dòng)標(biāo)注的驗(yàn)證集上進(jìn)行了性能評(píng)估。
        結(jié)果
        模型性能:訓(xùn)練集包含來(lái)自95,188份結(jié)腸鏡報(bào)告的35,953份無(wú)結(jié)構(gòu)病理報(bào)告。在獨(dú)立的測(cè)試集上,模型對(duì)腺瘤、鋸齒狀病變和晚期病變的預(yù)測(cè)AUC分別達(dá)到0.997、0.999和0.998。最終模型的超參數(shù)被優(yōu)化,例如腺瘤模型采用節(jié)點(diǎn)中最小數(shù)據(jù)點(diǎn)數(shù)為2,隨機(jī)采樣5個(gè)預(yù)測(cè)因子,構(gòu)建1000棵樹(shù)。在包含337個(gè)手動(dòng)標(biāo)注程序的獨(dú)立驗(yàn)證集上,模型表現(xiàn)出了極高的準(zhǔn)確性。腺瘤模型的AUC為0.997,鋸齒狀病變模型為0.99,晚期病變模型為0.99,其敏感度和特異度也均表現(xiàn)優(yōu)異。驗(yàn)證過(guò)程中出現(xiàn)的一些錯(cuò)誤分類案例(如內(nèi)鏡聯(lián)合手術(shù)的誤判)可以得到合理解釋,且模型對(duì)這些特殊情況也保持了良好的區(qū)分能力。
        討論
        本研究成功開(kāi)發(fā)并驗(yàn)證了一套基于隨機(jī)森林機(jī)器學(xué)習(xí)和NLP的混合系統(tǒng),能夠準(zhǔn)確地將結(jié)腸鏡檢查結(jié)果自動(dòng)分類為腺瘤、鋸齒狀病變或晚期病變。該模型旨在彌補(bǔ)因電子健康記錄系統(tǒng)升級(jí)導(dǎo)致的歷史SNOMED-CT結(jié)構(gòu)化編碼缺失的問(wèn)題,從而為持續(xù)監(jiān)測(cè)腫瘤檢測(cè)率提供工具。與當(dāng)前流行的大型語(yǔ)言模型相比,該混合模型具有計(jì)算成本低、可解釋性強(qiáng)、部署簡(jiǎn)單的優(yōu)勢(shì),可運(yùn)行于個(gè)人電腦,適合不同規(guī)模的醫(yī)療機(jī)構(gòu)使用。隨機(jī)森林模型能夠清晰地解釋其預(yù)測(cè)所依據(jù)的特征,這是單純NLP系統(tǒng)所不具備的優(yōu)勢(shì)。
        然而,該模型也存在一些局限性。首先,當(dāng)前版本的模型最適用于單獨(dú)的結(jié)腸鏡檢查及其匹配的病理報(bào)告,在處理聯(lián)合內(nèi)鏡手術(shù)時(shí)可能出現(xiàn)誤分類。其次,模型在不同機(jī)構(gòu)間的通用性有待驗(yàn)證,因?yàn)椴±韴?bào)告的自由文本格式可能因機(jī)構(gòu)和數(shù)據(jù)庫(kù)供應(yīng)商而異。最后,在鋸齒狀病變的定義上,本研究模型排除了單純性增生性息肉,除非其直徑大于10毫米,這可能導(dǎo)致對(duì)小而位于近端的增生性息肉的鋸齒狀病變檢測(cè)率有所低估,但這是為了避免檢測(cè)率計(jì)算中的偏差而做出的設(shè)計(jì)選擇。
        未來(lái)的工作將集中在從結(jié)腸鏡和病理報(bào)告中提取更細(xì)粒度的特征,如腸道準(zhǔn)備質(zhì)量和息肉位置信息,并探索更具魯棒性的模型以適應(yīng)報(bào)告格式的變化,以增強(qiáng)模型在不同機(jī)構(gòu)間的適用性。
        總而言之,本研究表明,簡(jiǎn)單的文本詞元化結(jié)合高效的隨機(jī)森林機(jī)器學(xué)習(xí)算法,可以高精度地預(yù)測(cè)和分類結(jié)腸鏡檢查結(jié)果。該混合系統(tǒng)為實(shí)現(xiàn)大規(guī)模、高效、低成本的結(jié)腸鏡檢查質(zhì)量監(jiān)控提供了可行的技術(shù)路徑,有助于未來(lái)開(kāi)展更多關(guān)于結(jié)腸鏡檢查性能的研究。
        相關(guān)新聞
        生物通微信公眾號(hào)
        微信
        新浪微博

        知名企業(yè)招聘

        熱點(diǎn)排行

          今日動(dòng)態(tài) | 人才市場(chǎng) | 新技術(shù)專欄 | 中國(guó)科學(xué)人 | 云展臺(tái) | BioHot | 云講堂直播 | 會(huì)展中心 | 特價(jià)專欄 | 技術(shù)快訊 | 免費(fèi)試用

          版權(quán)所有 生物通

          Copyright© eBiotrade.com, All Rights Reserved

          聯(lián)系信箱:

          粵ICP備09063491號(hào)