《npj Cardiovascular Health》:Development and validation of AI-Enhanced auscultation for valvular heart disease screening through a multi-centre study
編輯推薦:
本文聚焦于解決因傳統聽診靈敏度低導致的瓣膜性心臟病(VHD)漏診率高這一臨床痛點。研究人員開展了一項多中心研究,開發了一種基于循環神經網絡、直接通過聽診器錄音預測具有臨床意義VHD的AI算法。該算法在獨立測試集上實現了0.83的AUROC,對嚴重主動脈瓣狹窄(AS)和二尖瓣反流(MR)的靈敏度分別高達98%和94%,其性能超越了全科醫生。該研究為解決VHD大規模篩查難題提供了有前景的、可擴展的低成本工具,有助于實現早期診斷和及時干預。
瓣膜性心臟病(VHD)正迅速成為“下一個心臟流行病”,尤其在老齡化社會中,其患病率不斷攀升。然而,超過一半的VHD病例未被診斷,原因在于其癥狀(如呼吸困難、疲勞)常被誤認為呼吸系統問題或自然衰老,導致許多患者直到出現晚期癥狀和并發癥時才就醫,錯過了最佳干預時機。目前的診斷工具難以勝任大規模篩查:初級保健依賴全科醫生(GPs)用聽診器識別心臟雜音,但靈敏度可低至45%,且臨床技能信心下降;而作為診斷金標準的超聲心動圖,則受限于設備昂貴、需專業操作人員且檢查耗時,難以普及。與此同時,現有的人工智能(AI)工具大多專注于雜音檢測,將其作為VHD的間接代理,但這種方法對常見亞型(如二尖瓣反流,MR)的靈敏度不足,且受限于小規模數據集。為了解決這些挑戰,一項發表于《npj Cardiovascular Health》的多中心研究,旨在開發一種新型AI算法,能夠直接從聽診器錄音中預測具有臨床意義的VHD,為早期篩查提供一種準確、快速且可及的解決方案。
為了驗證這一目標,研究團隊采用了幾個關鍵技術方法。首先,他們構建了一個大規模、高質量的數據集,該數據集來源于三項在英國國家醫療服務體系(NHS)下進行的研究(CAIS、DUO-EF和OxVALVE),共納入了1767名患者,將電子聽診器在四個標準聽診位置(主動脈、肺動脈、三尖瓣、二尖瓣)采集的心音錄音與作為金標準的超聲心動圖診斷標簽配對。其次,算法開發基于一個循環神經網絡(RNN),該網絡最初在公開的心音數據集上進行雜音檢測的預訓練,隨后使用本研究收集的、以超聲心動圖為標簽的數據進行微調,使其能夠直接預測“具有臨床意義的VHD”(定義為存在≥輕度瓣膜狹窄或≥中度瓣膜反流)。最后,研究通過一個獨立的測試集(包含263名患者)評估了算法性能,并與14位擁有不同臨床經驗的全科醫生進行了直接比較,后者通過在線調查聽取相同的聽診錄音并進行判斷。
研究結果如下:
數據特征:研究隊列中位年齡為74歲,40%患者超重,26%肥胖。793名(45%)患者被超聲心動圖診斷為具有臨床意義的VHD,最常見的是主動脈瓣狹窄(AS,n=325)和二尖瓣反流(MR,n=287)。
算法性能:所開發的“VHD檢測器”算法在識別具有臨床意義的VHD時,接收者操作特征曲線下面積(AUROC)達到0.83。在設定的操作點(概率閾值≥0.675)時,靈敏度為72%,特異性為82%。算法預測概率與金標準校準良好,預期校準誤差為0.08。
不同類型和嚴重程度VHD的性能:算法對特定嚴重病變表現出極高的靈敏度:在測試集中,對嚴重AS的靈敏度為98%,對嚴重MR的靈敏度為94%。不過,對于中度MR等病變,靈敏度相對較低。
聽診部位分析:分析顯示,三尖瓣部位是檢測VHD最重要的單一位置,但對嚴重AS和MR的檢測靈敏度分別為75%和64%。結合主動脈和二尖瓣部位的錄音可顯著提高對各種VHD的檢測靈敏度,而加入肺動脈部位則對整體靈敏度影響甚微。
與全科醫生比較:在全科醫生方面,其綜合表現(基于多數決原則)的靈敏度為62%,特異性為64%。VHD檢測器在靈敏度(p=0.01)和特異性(p=0.002)上均顯著優于全科醫生的表現。個體全科醫生的操作點差異很大,而算法的性能則更為一致,集中在高特異性區域。值得注意的是,在14位全科醫生中,算法在13例中取得了更高的約登指數,在剩下1例中與之持平。
討論與結論部分強調了本研究的意義。這項多中心研究表明,機器學習算法可以有效利用標準胸部聽診位置的心音錄音來檢測具有臨床意義的VHD。與電子聽診器結合后,該算法有潛力成為一種快速、無創的VHD篩查工具,其靈敏度和一致性均優于當前初級保健的臨床評估,有助于更高效地分流患者,使其獲得目前資源有限且昂貴的超聲心動圖服務。
研究的核心優勢在于其構建了世界上規模最大、標注最全面的心音圖資源庫之一,并且每個病例都有配對的超聲心動圖金標準。VHD檢測器算法的一個關鍵優勢在于其對嚴重AS和嚴重MR這兩種具有獨特聲學特征且臨床意義重大的疾病具有極高的靈敏度。這種高靈敏度在篩查環境中轉化為高陰性預測值,能讓全科醫生更有信心地排除嚴重的左側VHD。與以往基于雜音檢測的AI研究不同,本研究的算法直接以超聲心動圖標簽為訓練目標,避免了雜音標注本身的復雜性和觀察者間的高變異性,從而可能學習到人耳無法察覺或不符合既定模式的聲學特征,這使得模型具有更強的校準和鑒別能力。
當然,研究也存在一些局限性。例如,數據集雖然包含了多樣化的VHD表現,但并非典型的英國篩查人群代表(為了獲得足夠的VHD病例,招募偏重于醫院患者),這可能導致在真實世界篩查中靈敏度降低。與全科醫生的比較也存在局限,因為醫生僅通過耳機聽錄音,并未進行現場聽診。未來需要在初級保健環境中進行前瞻性研究,以驗證其在真實環境中的性能,并評估其在更低疾病流行率人群中的篩查效益。
總之,VHD檢測器顯示出作為獲得性VHD篩查工具的巨大潛力。它能夠在需要進一步檢查的中重度VHD患者與僅需觀察的輕度反流或微量VHD患者之間進行有效區分。與手持超聲心動圖等更復雜的篩查方法不同,該工具僅需一分鐘簡單的聽診器錄音,操作快速、易于獲取,且可由經過最少培訓的非專業操作人員部署,有望實現VHD的早期檢測。