《Annals of Hematology》:Assessment of long-read strategies for the enrichment of clinically relevant breakpoints in lymphomas: towards a diagnostic implementation
編輯推薦:
本研究針對淋巴瘤染色體易位斷點檢測的技術挑戰,系統評估了基于CRISPR/Cas9的靶向富集與自適應采樣(Adaptive Sampling)兩種長讀長測序策略。研究人員通過設計覆蓋IGH、MYC、BCL2、BCL6、CCND1等關鍵基因的探針面板,在多種淋巴瘤細胞系中驗證發現:Cas9切除法對已知易位檢測靈敏度高、覆蓋深度佳,適用于臨床診斷;自適應采樣則靈活性更強、通量更高,更適用于探索性研究。該研究為長讀長測序技術融入淋巴瘤分子診斷路徑提供了關鍵實驗依據和決策算法。
染色體易位是血液系統惡性腫瘤的典型特征,準確檢測其斷點位置對淋巴瘤的診斷分型、治療策略制定和疾病監測至關重要。然而,傳統熒光原位雜交(FISH)技術分辨率有限,短讀長測序(NGS)難以跨越重復區域,而免疫組化僅能間接反映基因過表達——這些方法在檢測復雜結構變異或未知伴侶基因時存在明顯局限。尤其值得注意的是,在濾泡性淋巴瘤和彌漫大B細胞淋巴瘤中,免疫球蛋白重鏈(IGH)基因的斷點可能分布在相隔數百kb的Sμ或Sγ恒定區轉換區域內,這進一步增加了檢測難度。
為解決這一難題,研究團隊將目光投向了牛津納米孔技術(Oxford Nanopore Technologies)的長讀長測序。該技術能夠生成跨越數十kb的讀長,輕松穿透重復序列區域,為精準定位斷點提供了新可能。但全基因組測序成本高昂,在臨床診斷中并不經濟。因此,如何高效富集目標區域成為關鍵。本研究聚焦于評估兩種主流富集策略:CRISPR/Cas9介導的靶向富集與納米孔平臺特有的自適應采樣(Adaptive Sampling)技術。
研究人員設計了一套精心優化的實驗方案:他們選取了9種涵蓋不同淋巴瘤亞型的細胞系(包括DOHH-2、Maver-1、Ramos等),這些細胞系攜帶IGH::BCL2、IGH::MYC、IGH::CCND1等典型易位。通過設計特異性引導RNA探針,團隊構建了一個覆蓋淋巴惡性腫瘤常見易位熱點區域的Cas9富集面板。實驗設置了三種富集方案進行比較:單邊Cas9讀取、雙邊Cas9切除并支持多重測序、以及基于軟件實時篩選的自適應采樣。所有測序數據通過Dorado堿基識別和minimap2比對流程處理,并使用Sniffles2、NanoSV等工具進行結構變異檢測。
主要技術方法概述
研究使用9株淋巴瘤細胞系和5例臨床淋巴瘤樣本,通過CRISPR/Cas9富集面板(覆蓋IGH、BCL2、MYC、CCND1等基因)和自適應采樣(靶向1320個癌癥相關基因)兩種策略進行納米孔長讀長測序。采用MinION R9.4.1和PromethION R10.4.1流動槽,通過Cas9切除法和自適應采樣策略對比檢測已知易位,并通過生物信息學工具驗證斷點檢測效率。
Cas9富集在目標區域展現卓越覆蓋深度
研究人員發現,Cas9富集策略在目標區域覆蓋度方面表現突出。在測序運行#2中,目標區域平均覆蓋深度達到231倍,顯著高于其他方法。這種策略通過設計在預期易位兩側的引導RNA探針,能夠實現雙向斷點捕獲(對已知伴侶)或單向測序(對未知伴侶)。如圖1A所示,該策略利用Cas9酶在引導RNA指定位置選擇性切割DNA的特性,有效富集目標片段。值得注意的是,在運行#8中,團隊成功檢測到Ramos細胞系的IGH::MYC易位斷點,驗證了該策略對經典易位的檢測可靠性。
優化的Cas9多重測序提升效率不犧牲靈敏度
為提升臨床應用可行性,研究團隊將Cas9富集方案與納米孔最新測序化學方法(NBD-114條形碼試劑盒)相結合,實現了樣本多重測序。這種改進使得三個不同樣本能夠在單次測序運行中同時處理,不僅將流動槽使用率提升至55%,還保持了37.6倍的平均覆蓋深度。如圖1B所示,雙邊切除策略通過從兩側切割目標區域,再經核酸外切酶消化背景DNA,顯著提高了常見易位的靶向精度。然而,該方法對非經典伴侶(如Maver-1細胞的IGL::MYC易位)的檢測能力有限,這主要是由于探針設計僅針對MYC而非IGL伴侶。
自適應采樣提供快速靈活方案但靈敏度受限
與Cas9富集相比,自適應采樣展現出獨特的優勢:無需預先設計探針,可根據需要動態調整靶向區域,且完全支持樣本多重測序。如圖1C所示,該技術利用納米孔平臺的實時堿基識別特性,在讀取約400個堿基后暫停測序,通過與參考基因組比對決定是否繼續測序整個片段。然而,這種策略的劣勢同樣明顯:四個測序運行的平均覆蓋深度僅為12.4倍,導致多個預期易位未被檢出。例如在運行#6中,僅檢測到5個主要重排之一的IGH::MYC易位。研究人員認為,這種較低的檢測率與自適應采樣固有的較高脫靶率有關。
面向臨床應用的決策模型
基于上述發現,研究團隊提出了一套實用決策算法(圖4),幫助實驗室根據具體需求選擇最優富集策略。關鍵考量因素包括:目標區域大小與復雜性、預期易位伴侶(已知或未知)、設計靈活性、樣本多重測序需求以及周轉時間。從經濟學角度,還需權衡測序的主要目的(探索性研究還是確診性檢測)與成本效益。Cas9介導的富集適合聚焦的診斷意圖,而自適應采樣更適用于廣泛的科研用途。
研究結論與討論
本研究系統評估了長讀長測序富集策略在淋巴瘤相關易位檢測中的性能。結果表明,CRISPR/Cas9富集策略(特別是雙邊切除法)在檢測已知易位方面具有高靈敏度和覆蓋深度,適合臨床診斷場景。而自適應采樣則以其靈活性和高通量特性,更適用于探索性研究或需要檢測大量樣本的項目。研究人員在5例臨床淋巴瘤樣本中成功驗證了Cas9切除法的可靠性,所有通過短讀長測序和光學基因組圖譜確定的易位均被準確檢出。
然而,該研究也存在一定局限:自適應采樣運行的覆蓋深度相對較低,影響了部分斷點的檢測能力;實驗主要使用細胞系,可能無法完全反映臨床樣本的腫瘤異質性和亞克隆事件。此外,對高質量高分子量DNA的依賴也限制了在常規福爾馬林固定石蠟包埋(FFPE)樣本中的應用。
總體而言,長讀長測序技術憑借其長讀長優勢,能夠跨越大型基因組重排區域,為血液腫瘤中結構變異的檢測提供了獨特價值。隨著技術不斷優化和臨床驗證的深入,長讀長靶向測序有望整合入常規診斷流程,特別適用于常規細胞遺傳學技術結果不明確或復雜的病例。本研究為此轉化過程提供了重要的方法學依據和實用決策框架。