德國癌癥登記與醫保數據隱私保護鏈接新方法:DigiNet研究證實IV期非小細胞肺癌真實世界研究可行性
《Journal of Cancer Research and Clinical Oncology》:Concept and feasibility of privacy-preserving record linkage of cancer registry data and claims data in Germany: results from the DigiNet study on stage IV non-small cell lung cancer
【字體:
大
中
小
】
時間:2025年12月05日
來源:Journal of Cancer Research and Clinical Oncology 2.8
編輯推薦:
本研究針對德國癌癥登記數據與醫保結算數據因隱私保護限制難以在個體層面鏈接的問題,開發并驗證了一種基于法定醫療保險號(KVNR)加密的隱私保護記錄鏈接(PPRL)方法。通過E-PIX?軟件實現不可逆加密,由獨立可信第三方完成鏈接,在DigiNet研究的IV期非小細胞肺癌(NSCLC)人群對照群組中實現94.2%的高匹配率。該方法為腫瘤健康服務研究提供了安全可靠的數據整合方案,具有重要示范意義。
在德國,肺癌是第三大常見癌癥和最主要的癌癥死因,2020年新增56,690例病例并導致44,817例死亡。更令人擔憂的是,57%的肺癌患者在初診時已處于轉移性IV期,其一年生存概率不足35%。近年來,非小細胞肺癌(NSCLC)的系統性治療策略已從傳統的統一化療方案發展為更加個性化的精準醫療模式,顯著改善了患者預后和生活質量。
隨著可靶向基因突變發現的增多(德國約30%的NSCLC患者攜帶可靶向基因改變),靶向治療的應用為晚期NSCLC患者帶來了新的希望。然而,個性化醫療的實施仍面臨諸多挑戰:領域快速發展、可操作突變譜系不斷擴大以及治療決策日益復雜化。其直接后果是,并非所有德國晚期NSCLC患者都能接受全面分子檢測以識別所有相關可靶向驅動突變。
在此背景下,德國國家基因組醫學網絡(nNGM)肺癌項目應運而生,旨在確保所有NSCLC患者都能獲得全面基因檢測并基于最新科學進展接受癌癥治療。DigiNet研究則建立在nNGM基礎結構之上,在柏林、薩克森和北萊茵-威斯特法倫等模型區域,通過數字化手段加強nNGM中心與常規診療機構間的協作,進一步優化IV期NSCLC患者的個性化治療。
DigiNet研究采用前瞻性、對照、非隨機、非盲法、多中心隊列設計,總時長四年(2021年10月-2025年9月)。干預組基于書面知情同意主動招募,而基于人群的對照組(pCG)則通過參與聯邦州癌癥登記處的隊列匹配確定。為進行健康經濟學評估,需要在無特定知情同意的情況下實現癌癥登記數據與醫保數據的病例特異性鏈接,這對隱私保護提出了極高要求。
研究人員開發了一種隱私保護記錄鏈接(PPRL)概念,確保無法推斷個體身份。該方法基于在數據持有機構內部對法定醫療保險號(KVNR)進行不可逆加密,使用公開可用軟件的特定研究配置。關鍵技術環節包括:在各數據持有機構安裝本地E-PIX?實例;使用隨機哈希和布魯姆過濾器生成鏈接密鑰;由獨立可信第三方(TTP)執行鏈接并移除鏈接密鑰;采用Cryptshare進行加密數據傳輸。
研究通過癌癥登記處的隊列匹配,識別出2022年6月至2024年3月期間診斷的9,597例IV期NSCLC pCG病例。其中1,437例(15.0%)由三家參與研究的法定醫療保險機構覆蓋,符合PPRL條件。最終,94.2%(1,354例)的患者成功實現癌癥登記數據與醫保數據鏈接。可信第三方基于加密標識符執行鏈接,移除鏈接密鑰后向評估方提供數據。
隊列匹配與病例篩選:通過嚴格的流程篩選,從初始13,193例IV期NSCLC患者中排除干預組和nNGM對照組病例,最終確定9,597例構成基于人群的對照組。
PPRL工作流程實施:研究分兩階段實施PPRL流程。第一階段在各數據持有機構內生成鏈接密鑰,第二階段由可信第三方完成數據鏈接與偽匿名化處理。
鏈接成功率分析:總體匹配率達到94.2%,各癌癥登記處與醫保機構間的匹配率穩定在93.6%-97.8%之間,證明該方法在不同機構間具有良好一致性和可靠性。
E-PIX?軟件配置細節:采用隨機哈希方法將KVNR分割為二元語法(bigrams),通過預定義種子值的偽隨機數生成器確保各方計算方式一致,再生成平衡布魯姆過濾器防止重新識別。
未匹配病例分析:83例目標人群病例未能成功匹配,可能原因包括篩選標準差異(治療地點與居住地不一致)、醫保提供商變更或社會救助報銷等情況。
本研究成功證明了在真實世界腫瘤學研究環境中實現癌癥登記數據與醫保數據隱私保護記錄鏈接的可行性。與以往基于概率鏈接的方法相比,這種基于KVNR的精確PPRL方法結合了確定性鏈接的精度與不可逆加密的隱私保護優勢,有效解決了數據保護關切和技術限制。
該方法的主要優勢在于:確保識別數據的機密性;實現精確鏈接;采用安全加密程序;限制加密知識傳播;由獨立可信第三方執行鏈接與偽匿名化;鏈接完成后立即不可逆刪除映射關系。這些特性使其特別適用于需要安全、基于標識符鏈接而無須披露個人標識符的研究場景。
從實踐角度看,該研究的成功實施為德國乃至國際類似研究提供了可轉移的藍圖。使用公開可用的E-PIX?軟件解決方案意味著其他研究團隊可以復制該方法,而無需依賴專有技術或特定機構的基礎設施。同時,研究也強調了早期規劃、多方協調和測試運行的重要性,這些經驗對未來類似項目具有重要參考價值。
研究的局限性主要在于對KVNR可用性和準確性的依賴,以及需要各參與方具備相應的IT基礎設施支持。對于AOK數據,因WIdO僅存儲偽匿名化數據且無法訪問PII,需采用研究所特定的加密算法,這也凸顯了在不同機構環境下實施統一方法的挑戰。
總體而言,DigiNet研究開發的精確PPRL程序在保持高水平數據隱私保護的同時,為癌癥護理的病例特異性評估(如成本效益分析或指南依從性評估)提供了可行路徑。該方法可推廣至其他使用唯一識別變量(如個人身份號碼)的真實世界數據源場景,對推動腫瘤學健康服務研究具有重要意義。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號