《Journal of Genetic Engineering and Biotechnology》:Structural analysis of clingstone and freestone peach (
Prunus persica L.) plastome genome: provides insight into phylogeny and time diversification
編輯推薦:
本研究為闡明桃(Prunus persica)在薔薇科(Rosaceae)內的進化歷史,利用高通量測序技術解析了黏核桃(CLS)、離核桃(FRS)及其野生近緣種Prunus mira的葉綠體基因組(plastome)。研究發現三者plastome結構高度保守,但存在IR區邊界位移、基因重排及豐富的簡單序列重復(SSR)等變異,這些是系統發育信息熱點。基于全plastome的系統基因組學分析明確了桃、杏、櫻桃類群的單系進化關系,分化時間估算表明栽培桃與P. mira的分化發生在始新世。該研究為桃的遺傳進化、分子標記開發及亞種水平精確分類提供了寶貴的基因組資源。
桃,這種以其甜美多汁的果實和迷人花朵而風靡全球的薔薇科果樹,不僅是一種重要的經濟作物,也是研究木本果樹遺傳進化的潛在模式植物。然而,桃的栽培品種(如黏核桃和離核桃)與其眾多野生近緣種之間復雜的進化關系,以及驅動其馴化和分化的基因組機制,長期以來仍是植物學家和遺傳育種家關注的焦點。尤其是在葉綠體(質體)基因組層面,盡管其結構相對保守,但其中蘊含的變異是解析物種間親緣關系、追溯母系譜系歷史和開發高鑒別力分子標記的寶貴資源。此前,雖有桃栽培品種“Lovell”的質體基因組草圖發表,但對具有不同果實性狀(果肉與果核黏離性)的關鍵栽培類型及其野生祖先的質體基因組進行全面比較研究仍顯不足,限制了人們對桃質體基因組進化動態和其作為系統發育標記潛力的深入理解。
為填補這一空白,由Mokhtar Said Rizk、Alsamman M. Alsamman等人組成的研究團隊開展了一項深入的研究,對黏核桃(Clingstone, CLS)、離核桃(Freestone, FRS)以及野生近緣種Prunus mira的完整葉綠體基因組進行了測序、組裝和比較分析。相關研究成果已發表在《Journal of Genetic Engineering and Biotechnology》上。
為了系統回答上述問題,研究人員主要采用了以下關鍵技術方法:首先,利用Illumina HiSeq 2500平臺對來自埃及的CLS、FRS栽培品種及來自中國科學院武漢植物園的P. mira野生種的葉片DNA進行高通量測序。其次,使用Geneious軟件,以已發表的P. persica cv. Lovell質體基因組為參考,完成了三個質體基因組的從頭組裝。接著,將新組裝的三個基因組與從NCBI數據庫獲取的22個已發表的Prunus屬物種質體基因組進行大規模比較分析,內容包括使用DOGMA進行基因組注釋,利用IRscope、Mauve、VISTA等工具進行結構變異(如IR區邊界、基因重排)和序列保守性分析。此外,還使用MISA和MegaSSR工具在全基因組范圍內鑒定和分析了簡單序列重復(SSR),并基于46個蛋白質編碼基因(CDS)的多序列比對,采用最大似然法(ML)和貝葉斯推斷法(BI)構建了系統發育樹。最后,運用BEAST軟件,結合化石校準點,估算了Prunus屬內關鍵類群的分化時間。
3.1. 基因組結構變異
研究人員測序獲得了CLS、FRS和P. mira的完整質體基因組,大小分別為157,786 bp、157,794 bp和157,765 bp。與包括22個其他Prunus物種在內的共25個質體基因組的比較顯示,所有基因組均呈現典型的被子植物質體四分區結構(大單拷貝區LSC、小單拷貝區SSC和兩個反向重復區IR),總大小在157,685 bp(Prunus cerasoides)到158,955 bp(Prunus padus)之間,平均GC含量約為37.72%。然而,在保守的整體結構下,研究發現了顯著的結構變異,特別是在IR區與LSC、SSC區的交界處(JLB, JSB, JLA, JSA)存在邊界位移。例如,在CLS和FRS中,rps19基因位于IRb區內而非典型的LSC/IRb交界處,且ndhB、rrn23等基因存在缺失。通過點陣圖(dot-plot)和Mauve比對進一步證實,盡管大多數Prunus物種的質體基因組共線性很高,但在P. persica(包括CLS和FRS)以及P. dulcis、P. serotina中觀察到了獨特的基因重排和IR區的收縮與擴張現象。
3.2. 簡單序列重復和基因變異
簡單序列重復(SSR)分析揭示了Prunus屬質體基因組的豐富多態性。在25個分析的質體基因組中,SSR總數在559(P. mira)到1064(P. serrulata)之間波動,其中CLS和FRS分別含有807和775個SSR。單核苷酸重復(mononucleotide)是最常見的類型,其次是五核苷酸和雙核苷酸重復,未發現三核苷酸和四核苷酸重復。這些SSR,特別是位于非編碼區的SSR,表現出很高的多態性,被確定為進化熱點區域。通過MegaSSR工具,研究人員還為CLS和FRS開發了特異性SSR分子標記。在基因組成方面,所有25個質體基因組均穩定含有40個基因(28個單拷貝和12個多拷貝),包括6個蛋白質編碼基因、16個tRNA基因和4個rRNA基因。密碼子使用偏好性分析顯示,不同物種間tRNA的長度和分布存在差異,例如P. dulcis和FRS中丙氨酸(Ala)和甘氨酸(Gly)的tRNA長度顯著較長,這反映了遺傳變異和可能的進化適應。
3.3. 質體系統基因組學分析
基于46個蛋白質編碼基因構建的最大似然系統發育樹,以Pyrus和Malus的物種為外類群,清晰地揭示了Prunus屬內的進化關系。所有23個Prunus物種被強有力地分為三大支:桃類支、杏類支和櫻桃類支。本研究的兩個桃栽培品種CLS和FRS與已發表的P. persica cv. Lovell聚為一個單系群,顯示它們具有最近的共同祖先。這個桃類支進一步與P. kansuensis和野生種P. mira聚在一起。P. davidiana、P. mongolica、P. humilis和P. mume則位于該支的基部。所有杏和櫻桃物種聚合成另一個單系群,表明它們與桃類支有較近的進化關系,但內部又存在顯著的遺傳多樣性。系統發育分析有力地支持了傳統分類,并明確了P. mira作為桃古老野生祖先的地位。
3.4. 分化時間估算分析
通過結合化石校準點的貝葉斯放松分子鐘分析,研究推斷了Prunus屬關鍵節點的分化時間。估算結果表明,Prunus屬的根節點年齡約為9654萬年(百萬年前,Mya),起源于上白堊紀。Prunus屬內的分化大約發生在8095萬年前。栽培桃(P. persica,包括CLS和FRS)與野生近緣種P. mira的分化時間被估算在始新世,大約在3515萬年前。而桃不同栽培品種(如CLS和FRS)之間的最近一次分化則發生在大約47.6萬年前。這一時間框架為理解桃的馴化歷史和Prunus屬的物種形成過程提供了寶貴的進化時間尺度。
綜合研究結果與討論,本項研究得出了明確結論并闡明了其重要意義。該研究首次完成了對具有重要經濟性狀的黏核桃和離核桃栽培品種及其野生祖先P. mira的完整葉綠體基因組比較分析,極大地豐富了薔薇科特別是桃亞屬的質體基因組資源庫。研究發現,盡管桃質體基因組在大小、GC含量和基本基因組成上高度保守,但在IR區邊界、基因排列(如rps19、ndhF的位置)以及SSR的分布和數量上存在顯著變異,這些區域被確定為系統發育信息豐富的“熱點”。這些結構性變異,尤其是IR區的收縮與擴張,是導致質體基因組大小差異和進化譜系特異性的主要驅動力。
鑒定出的大量多態性SSR位點和特定的密碼子使用模式,為未來開發用于桃品種鑒定、遺傳圖譜構建、群體遺傳學研究和DNA條形碼(DNA barcoding)的高鑒別力分子標記提供了直接候選資源。基于全質體基因組序列的系統發育分析以前所未有的支持度厘清了桃、杏、櫻桃類群之間的進化關系,證實了P. mira是桃的古老野生祖先,并且揭示了栽培桃品種(CLS, FRS)形成獨立的單系群,與野生近緣種明顯分開。分化時間估算將栽培桃與P. mira的分化定位到始新世,為桃的漫長進化史提供了具體的時間坐標,暗示其馴化過程可能經歷了復雜的雜交和基因滲入事件。
總之,這項全面的質體基因組學研究不僅增進了我們對桃(特別是黏核桃和離核桃)栽培品種與其野生近緣種之間進化動力學的理解,而且所鑒定的結構變異熱點、SSR標記和清晰的系統發育框架,將為桃的遺傳育種、種質資源保護、物種精確鑒定以及薔薇科植物的系統進化研究提供堅實的基因組學基礎和新的工具。研究強調,質體基因組是解析近緣物種關系、追溯母系歷史和研究植物馴化的強大工具,尤其在桃這類具有復雜育種歷史的作物中顯示出獨特價值。