綜述:從算法創新到臨床應用:系統綜述限制醫療保健領域聯邦學習方法論的差距
《International Journal of Medical Informatics》:From algorithmic innovation to clinical deployment: A systematic review of methodological gaps limiting federated learning in healthcare
【字體:
大
中
小
】
時間:2026年03月03日
來源:International Journal of Medical Informatics 4.1
編輯推薦:
聯邦學習在生物醫學信息學中的應用及挑戰,系統綜述了2017-2025年間97篇文獻,分析其架構拓撲、優化策略、隱私機制及臨床轉化瓶頸,指出需整合研究設計、標準評估、可解釋性及監管框架。
Sandhya Vijayasarathy
印度卡納塔克邦班加羅爾BSK III階段Ring Road校區PES大學生物技術系,郵編560085
摘要
目的:聯邦學習(FL)是一種分布式機器學習范式,旨在無需數據集中化即可實現跨分散數據源的模型訓練。本文批判性地探討了聯邦學習在生物醫學信息學中的方法論應用,總結了其概念基礎、方法變體、成功之處以及局限性,并指出了未來研究的方向。方法:我們遵循PRISMA 2020指南進行了系統的方法學綜述。搜索范圍涵蓋了PubMed、Web of Science、Scopus、IEEE Xplore和Google Scholar中2017年1月至2025年3月期間發表的相關研究。只有那些提出、擴展或批判性分析生物醫學或生命科學數據相關聯邦學習方法的文章才被納入研究。這些方法根據聯邦拓撲結構、優化策略、數據異質性處理方式、隱私保護機制、評估設計以及轉化應用可行性進行了分類。結果:在8,412條記錄中,有97篇文章符合納入標準。在優化和隱私保護機制方面存在快速的方法創新,但在設計時評估和治理方面的支持仍然有限。結論:聯邦學習在生物醫學信息學中代表了重要的方法論進步,但當前的實現僅解決了部分轉化應用挑戰。未來的工作需要將研究設計、評估、可解釋性和治理機制整合到聯邦學習方法中。
引言
生物醫學信息學長期以來一直面臨著一個基本矛盾:一方面需要大規模、多樣化的數據集來支持強大的統計和機器學習模型;另一方面則受到倫理、法律和制度約束的限制,這些約束限制了數據共享[1]。在醫學和生命科學領域,這一問題尤為突出,因為數據具有敏感性、受到監管、存在異質性,并且由不同的機構生成[2](見表1)。
聯邦學習(FL)作為一種應對這一挑戰的方法應運而生。它不是將數據集中處理,而是將模型訓練分散到多個站點進行,同時保持原始數據的本地化[3],[4]。自2016-2017年引入以來,聯邦學習在生物醫學領域得到了迅速應用,被視為一種保護隱私的集中學習替代方案[5]。
< />
研究設計
綜述設計
本研究遵循PRISMA 2020(系統評價和薈萃分析的優先報告項目)指南進行了系統的方法學綜述[9]。與匯總患者結果的臨床系統評價不同,本綜述重點關注聯邦學習作為一種方法,評估其架構組件的發展及其在生物醫學信息學中的適用性[10]。
數據來源和搜索策略
主要使用了五個電子數據庫:PubMed、Web of Science、Scopus、IEEE Xplore和Google
研究特征
從最初的8,412條記錄中,有97篇文章符合最終納入標準(圖1)。大多數研究(76.9%)采用了集中式拓撲結構,且研究趨勢正朝著多組學數據整合方向發展[9]。
方法學維度
我們的分析確定了四個主要的創新維度:
•優化:盡管FedAvg[3]仍是基線方法,但現代框架采用了FedProx[14]來應對本地系統的不穩定性。
大多數被審查的研究采用FedAvg作為默認的優化策略
討論
研究結果表明,聯邦學習正從理論上的隱私保護轉向實際應用效用。然而,為了使聯邦學習具有轉化應用價值,開發者必須超越“僅關注隱私”的創新,將臨床數據標準整合到方法中,并提供處理缺失數據和實驗室偏差的強大機制[20]。本綜述指出的轉化應用差距反映了生物醫學信息學中的一個更廣泛挑戰:將方法論創新與實際應用相結合
未來方向
為彌合當前的轉化應用差距,未來的聯邦學習研究必須超越算法效率,關注以下以信息學為中心的領域:
•考慮研究設計的聯邦學習方法:未來的框架必須將研究設計原則納入訓練流程,確保站點選擇和數據采樣策略能夠最小化聯邦內的選擇偏差[28]。
•醫學領域聯邦學習的評估標準:
迫切需要制定標準化基準
結論
聯邦學習在生物醫學信息學中代表了重要的方法論進步,為多機構合作提供了一個穩健的范式,同時避免了數據集中的風險。然而,當前的實施僅解決了醫療保健領域轉化應用挑戰的一部分問題。在評估、可解釋性和監管一致性方面仍存在顯著的方法學差距。未來的工作需要聚焦于“以信息學為導向”的聯邦學習方法
CRediT作者貢獻聲明
Sandhya Vijayasarathy:負責撰寫綜述與編輯、初稿撰寫、驗證、方法論設計、數據分析、概念構建。
利益沖突聲明
作者聲明沒有已知的財務利益或個人關系可能影響本文的研究結果。
致謝
作者感謝PES大學生物技術系(前稱PES理工學院)提供的支持。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號