馬甲子T2T單倍型基因組揭示鼠李科進化與抗病/抗逆分子機制
《Communications Biology》:Haplotype-resolved t2t genome of paliurus hemsleyanus provides insights into rhamnaceae evolution and genome biology
【字體:
大
中
小
】
時間:2025年12月05日
來源:Communications Biology 5.1
編輯推薦:
本研究針對鼠李科重要樹種馬甲子(Paliurus hemsleyanus)基因組資源匱乏的問題,通過PacBio HiFi+ONT+Hi-C技術構建了首個單倍型分型的T2T無間隙基因組(兩個單倍型分別為306.65/306.21 Mb)。研究發現鼠李科基因組結構相對穩定,NLR抗病基因呈現根組織優勢表達模式,等位基因表達與序列變異正相關;抗壞血酸代謝基因在葉片高表達,MDHAR基因家族在鼠李科發生譜系特異性串聯擴增。該高質量基因組為鼠李科進化研究和分子育種提供了關鍵資源。
在植物基因組學研究日新月異的今天,鼠李科植物作為重要的經濟樹種和生態樹種,其基因組資源卻相對匱乏。馬甲子(Paliurus hemsleyanus)作為中國特有落葉灌木或小喬木,不僅具有生態韌性、經濟價值和觀賞價值,更是棗樹(Ziziphus jujuba Mill.)的優選砧木,能顯著提高接穗對棗瘋病的抗性。然而,由于缺乏高質量的基因組參考序列,人們對該物種的基因組生物學和進化歷史的認識一直受限。
為了解決這一難題,河北農業大學的研究團隊在《Communications Biology》上發表了最新研究成果。他們采用多種前沿測序技術,成功構建了馬甲子單倍型分型的端粒到端粒無間隙基因組,為鼠李科植物進化研究和功能基因組學分析提供了高質量參考。
研究人員首先通過PacBio HiFi、Oxford Nanopore超長讀長和Hi-C技術,構建了兩個單倍型基因組(HapA 306.66 Mb,HapB 306.21 Mb),contig N50均超過24.9 Mb。評估顯示基因組完整性達98.90%,LAI指數超過18.5,QV值高于51.4,證實了組裝的高質量。所有著絲粒和端粒區域均被完整預測,共注釋到約29,000個蛋白編碼基因。
通過整合多組學數據,研究人員成功將contig錨定到12條染色體上,Hi-C互作圖譜顯示清晰的染色體對角線信號。BUSCO分析顯示兩個單倍型均具有98.90%的完整性,Merqury評估顯示堿基錯誤率低于0.0001。著絲粒預測顯示其大小為100 kb-2 Mb,主要由LTR反轉錄轉座子主導。
重復序列占基因組的47.37%-47.57%,其中轉座元件(TE)是主要組成部分。Gypsy和Copia是含量最豐富的LTR反轉錄轉座子;虮磉_分析顯示,約66%的基因在至少一個組織中表達,表達模式在兩個單倍型間高度相似。
共鑒定到1,295,745個SNP和348,631個Indel,影響66.66%的蛋白編碼基因。等位基因特異性表達(ASE)分析發現829對基因存在顯著表達差異,這些基因富集于防御反應和應激相關過程。表達差異與序列變異程度呈正相關,啟動子區域變異對表達影響尤為顯著。
特別值得注意的是精氨酸琥珀酸合酶基因ASS1的等位變異:HapA中的PhAASS1具有功能,而HapB中的等位基因因第一外顯子插入285 bp而失活。這一發現揭示了結構變異如何驅動等位基因特異性表達,進而影響代謝靈活性。
與19個物種的比較基因組分析顯示,鼠李科物種保持12條染色體的穩定核型,而薔薇科物種染色體數目變異較大。Ks和4DTv分析揭示了共享的古代全基因組三倍化事件(γ事件),以及薔薇科和胡頹子科中特異的全基因組復制事件。鼠李科物種僅保留較小的物種特異性復制峰,表明其基因組進化相對保守。
共鑒定到853個NLR基因,分為CNL、NL、TNL和RNL四個亞家族。表達分析顯示NLR基因在根組織中優勢表達,特別是在中等表達水平(FPKM 10-100)范圍內。等位NLR基因的表達顯著高于非等位基因,表明保留兩個單倍型具有轉錄優勢。
轉座元件分析顯示,與全基因組模式不同,Copia元件在NLR基因周圍占主導地位。TNL亞家族攜帶的TE數量顯著多于其他亞家族,且TE豐度與TNL在莖葉中的表達呈負相關,但在根中無此相關性,提示根組織可能存在特異性調控機制。
HapB染色體9上約246 kb的缺失導致13個串聯NLR基因丟失,這些基因完全不表達,為非等位NLR表達降低提供了典型案例。鼠李科物種間NLR庫比較顯示顯著變異,其中Sth物種的NLR數量極少(68個),但RNL數量與馬甲子相當,表明RNL在鼠李科中具有獨特的進化軌跡。
鑒定到91個AsA代謝相關基因,其中L-半乳糖和D-半乳糖醛酸途徑在根、莖、葉中占主導地位。生物合成基因在莖葉中的平均表達顯著高于根,與AsA含量測定結果一致(葉片含量最高)。
MDHAR基因家族在鼠李科中發生譜系特異性串聯擴增,其中棗樹擴張最為顯著(13個基因)。比較分析顯示,這種擴張模式為鼠李科特有,其他高AsA物種如獼猴桃和柑橘中未見類似擴張。
本研究提供的馬甲子單倍型分型T2T基因組填補了鼠李科基因組資源的空白。研究發現鼠李科基因組結構相對穩定,NLR基因呈現根組織優勢表達模式,等位基因表達與序列變異正相關。AsA代謝在葉片中最為活躍,MDHAR基因家族的譜系特異性擴張可能增強了鼠李科植物的抗逆能力。
該基因組為鼠李科植物的進化研究、功能基因組學和分子育種提供了寶貴資源,對未來比較基因組學研究和育種策略制定具有重要指導意義。特別是對NLR和AsA代謝基因的深入分析,為理解植物抗病抗逆機制提供了新視角。
研究采用PacBio HiFi(41.7×)、Oxford Nanopore超長讀長(180×)和Hi-C(201×)技術進行基因組測序,使用MGISEQ-2000平臺進行基因組長短讀長測序(71×)。利用改進的CTAB法從年輕葉片提取基因組DNA,從同一馬甲子個體的根、莖、葉組織(各3個生物學重復)提取RNA進行轉錄組測序。通過Hi-C數據輔助染色體構建,使用BUSCO、Merqury和LAI指數評估基因組質量。
生物通微信公眾號
生物通新浪微博
今日動態 |
人才市場 |
新技術專欄 |
中國科學人 |
云展臺 |
BioHot |
云講堂直播 |
會展中心 |
特價專欄 |
技術快訊 |
免費試用
版權所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯系信箱:
粵ICP備09063491號