《Communications Biology》:A practical guide to targeted single-cell RNA sequencing technologies
編輯推薦:
這篇綜述系統剖析了傳統3′/5′端單細胞RNA測序(scRNA-seq)在檢測目標轉錄本(TOI)和序列區域(ROI)時存在的各類偏倚,并全面介紹了靶向測序解決方案(包含捕獲、引物設計、擴增、雙重PCR、探針雜交五大類)來克服這些局限。文章為研究人員提供了實用的決策樹,助其根據實驗需求(如檢測單核苷酸變異、剪接點、融合斷點)選擇最適合的靶向方法。
單細胞RNA測序(scRNA-seq)已成為解析組織中單個細胞基因表達的強大工具。然而,當前主流的高通量3′/5′端scRNA-seq方法僅能檢測細胞中10–40%的轉錄本,且獲取的信息通常局限于轉錄本末端的非翻譯區(UTR),導致對轉錄本內部重要區域(如編碼區、突變位點)信息的丟失。這些局限性嚴重阻礙了研究者對特定目標轉錄本(Transcripts of Interest, TOIs)和序列區域(Regions of Interest, ROIs)的檢測。為此,一系列靶向scRNA-seq方法應運而生,旨在特異性富集TOIs或ROIs,以彌補標準方法的不足。
scRNA-seq中影響TOI和ROI檢測的偏倚
標準的3′/5′端scRNA-seq實驗流程會引入多種偏倚,影響TOI和ROI的檢測。這些偏倚貫穿于整個工作流程,主要可歸納為三類:scRNA-seq協議固有的偏倚、轉錄本序列特征相關的偏倚以及實驗設計選擇引入的偏倚。
- •
單細胞制備:組織解離、細胞分離等步驟可能損傷RNA,導致碎片化或線粒體RNA比例升高,影響TOI檢測。
- •
dT捕獲/引物設計與內部捕獲:大多數方法通過oligo(dT)捕獲帶poly(A)尾的mRNA,這排除了非poly(A)化的RNA(如調控RNA)。此外,分子擁擠和空間位阻會阻礙結合,而內部多聚腺苷酸化序列導致的“內部捕獲”會產生截短的cDNA,消耗珠子上有限的寡核苷酸,并導致轉錄本5′端信息丟失。
- •
逆轉錄:逆轉錄效率受轉錄本二級結構、高GC含量等因素影響,可能導致cDNA合成不完全或引入序列錯誤。
- •
模板轉換:包括“鏈入侵”(可能導致嵌合cDNA)和“scRNA-seq模板轉換”(依賴逆轉錄酶末端轉移酶活性添加非模板C,然后由模板轉換寡核苷酸TSO介導第二鏈合成)。后者效率不高,導致許多cDNA分子無法完成全長轉換。
- •
較短cDNA的生成:為適配短讀長測序,需通過轉座酶片段化(Tagmentation)或隨機引物法將cDNA縮短至200-600 bp。轉座酶插入有序列偏好性,隨機引物則可能導致錯配延伸。關鍵在于,cDNA必須在其末端包含細胞條形碼和唯一分子標識符(UMI),因此可讀取的序列信息通常局限在捕獲位點(polyA尾)約600 bp范圍內,這使得獲取編碼序列(CDS)內部信息變得困難。
- •
PCR偏倚:PCR擴增偏好短且GC含量均衡的cDNA,可能導致低豐度TOIs被高豐度cDNA掩蓋。聚合酶的保真度也影響ROI序列的準確性。
- •
高通量測序:測序深度直接影響低表達TOI的檢出概率。讀長決定了能否覆蓋到遠離捕獲位點的ROI。不同測序平臺(如Illumina, PacBio, ONT)具有不同的錯誤譜。
基于短讀長測序的靶向scRNA-seq策略
為克服上述偏倚,靶向方法在scRNA-seq流程的不同階段進行干預。根據其富集策略,可分為五大類:
- •
類別1:靶向捕獲:通過在條形碼珠上修飾與TOI內部區域互補的寡核苷酸(捕獲序列),在逆轉錄前直接從RNA池中物理捕獲目標轉錄本。代表性方法如DART-seq、RoCKseq和direct capture Perturb-seq。其優勢在于從源頭富集目標,可繞過不利于逆轉錄的區域,并能靶向非poly(A)化轉錄本。局限性包括潛在的脫靶捕獲和因RNA二級結構導致的雜交效率低下。
- •
類別2:靶向引物設計:使用能與轉錄本或cDNA特定區域結合的引物,來富集ROI或TOI信息。根據引物加入的步驟不同,可作用于第一鏈cDNA(如RoCK and ROI、Constellation-Seq)、逆轉錄步驟(如GoT、tss2)或擴增后的cDNA(如Constellation-Seq應用于10× Chromium文庫)。這類方法通過定義cDNA的5′端,將信息“移位”到TOI內部,有效緩解了3′/5′端偏倚,并降低了對讀長的要求。其局限性在于引物設計的特異性、潛在的非特異性結合以及RNA二級結構對引物結合的影響。
- •
類別3:靶向擴增:在文庫制備后期(通常在cDNA擴增后),使用針對特定ROI或TOI的引物進行額外的PCR,以富集這些區域。代表性方法包括BD Rhapsody平臺的靶向擴增模塊、TARGET-seq、BART-Seq以及GoT-Splice和scG2P方法的一部分。這類方法操作相對簡單,可靈活設計大量引物。但主要挑戰在于需與大量背景cDNA競爭,可能導致低豐度靶點富集效率不高,且無法緩解早期步驟(如捕獲、逆轉錄)引入的偏倚。
- •
類別4:雙重靶向PCR:在同一反應體系中,使用兩套不同的靶向引物分別擴增基因的不同區域(通常是5′UTR和3′UTR),以獲得全長或近全長的轉錄本信息。代表性方法如GoT和GoT-Splice,特別適用于將體細胞突變(位于ROI)與細胞類型(由TOI表達譜定義)進行關聯。其主要優勢是能夠獲得跨越多個外顯子的信息,有利于檢測可變剪接和突變。局限性在于需要為每個靶基因設計兩對引物,多重化程度受限,且擴增效率受兩對引物性能共同影響。
- •
類別5:探針雜交:使用熒光標記的DNA探針與細胞內的RNA靶點原位雜交,然后通過顯微成像或測序進行檢測。代表性方法如HyPR-seq(基于成像)和HybriSeq(基于測序)。其最大優勢是可在完全保留空間位置信息的情況下,對少量預先定義的靶點進行高靈敏度、高多重性的檢測,無需逆轉錄或擴增,避免了相關偏倚。局限性在于通量有限(通常靶點數在百個級別),且無法獲得非靶向轉錄本的全基因組表達譜。
靶向方法在長讀長測序和空間轉錄組學中的應用
靶向策略也被整合到長讀長測序(如PacBio, Oxford Nanopore)和空間轉錄組學技術中,以提升其性能。
- •
長讀長測序:長讀長技術能直接測序全長cDNA,但通量較低。通過結合靶向策略(如探針雜交富集scTaILoR-seq,或通過靶向引物進行特異性擴增如HIT-scISOseq),可以富集包含特定條形碼或來自目標基因的cDNA,從而提高目標序列的覆蓋深度和檢測效率。
- •
空間轉錄組學:許多空間轉錄組學方法本質上是靶向的,例如基于探針雜交的(如10x Genomics Visium, 其后續的靶向panel如10x Flex)或基于捕獲的(如Slide-seq)方法。這些方法通過在空間位置上捕獲特定mRNA,將基因表達信息與組織形態學背景相關聯。
選擇指南與未來展望
為幫助研究者選擇合適的靶向方法,文章提供了一個實用的決策樹。決策的關鍵因素包括:主要目標是增強TOI檢測還是ROI檢測?需要多高的細胞通量?是否需要保留標準轉錄組信息?ROI是位于轉錄本內部還是末端?預算是多少?以及實驗室具備哪些技術平臺。
未來,靶向scRNA-seq領域的發展方向可能包括:開發能夠同時靶向數千個ROI的高多重性方法;創建更靈活、可定制的“按需”靶向panel;將靶向測序與蛋白質組學、表觀基因組學等多組學技術更緊密地整合;以及利用人工智能輔助設計最優的靶向策略和數據分析流程。
總之,靶向scRNA-seq方法為克服傳統技術的偏倚提供了強大的工具箱。通過明智地選擇和運用這些方法,研究者能夠以前所未有的精度和深度,探索單細胞中特定的轉錄本和遺傳變異,從而推動基礎生物學發現和臨床醫學研究。