黑腹果蠅Canton S品系近完整基因組組裝揭示結(jié)構(gòu)變異與嗅覺基因功能
《Nature Communications》:Near complete assembly of Drosophila melanogaster Canton S strain genome
【字體:
大
中
小
】
時(shí)間:2025年12月04日
來源:Nature Communications 15.7
編輯推薦:
本研究針對(duì)黑腹果蠅(Drosophila melanogaster)參考基因組(ISO-1品系)在復(fù)雜區(qū)域存在未解析缺口的問題,研究人員通過整合PacBio HiFi、Oxford Nanopore超長讀長和Hi-C數(shù)據(jù),成功構(gòu)建了Canton S品系雄性果蠅的近完整端粒到端粒(T2T)基因組組裝(Dm.nT2T)。該組裝大小為161.63 Mb,閉合了當(dāng)前參考基因組93.28%的缺口,并鑒定出著絲粒和端粒區(qū)域。研究發(fā)現(xiàn)7,989個(gè)結(jié)構(gòu)變異(SVs),首次在果蠅中發(fā)現(xiàn)SINE轉(zhuǎn)座子,并通過功能驗(yàn)證證實(shí)Chr3L.2449基因?qū)π嵊X敏感性至關(guān)重要。這項(xiàng)研究為探索果蠅基因組復(fù)雜性、品系多樣性和基因功能提供了高質(zhì)量資源,對(duì)理解基因組進(jìn)化具有重要意義。
作為生物學(xué)研究中最經(jīng)典的模式生物之一,黑腹果蠅(Drosophila melanogaster)在遺傳學(xué)、神經(jīng)科學(xué)和發(fā)育生物學(xué)等領(lǐng)域發(fā)揮著不可替代的作用。然而,盡管科學(xué)家們對(duì)其基因組的研究已持續(xù)數(shù)十年,當(dāng)前參考基因組(ISO-1品系)仍存在約250個(gè)未解析缺口,這些缺口主要分布在結(jié)構(gòu)復(fù)雜的區(qū)域,如著絲粒和端粒等重復(fù)序列區(qū)域。這些區(qū)域的缺失限制了我們?nèi)娼馕龌蚪M功能景觀的能力,也阻礙了對(duì)品系間遺傳差異的深入理解。
隨著長讀長測序技術(shù)的突破,科學(xué)家們已經(jīng)能夠構(gòu)建從端粒到端粒(Telomere-to-Telomere, T2T)的完整基因組組裝,人類基因組的T2T組裝就是這一領(lǐng)域的里程碑成就。受此啟發(fā),由云南大學(xué)孫艷波教授和昆明動(dòng)物研究所吳東東研究員領(lǐng)導(dǎo)的研究團(tuán)隊(duì),在《Nature Communications》上發(fā)表了題為"Near complete assembly of Drosophila melanogaster Canton S strain genome"的研究論文,報(bào)道了黑腹果蠅Canton S品系的近完整T2T基因組組裝。
研究人員采用多技術(shù)整合策略,結(jié)合PacBio HiFi環(huán)形共識(shí)序列(CCS)測序(107.39×覆蓋度)、Oxford Nanopore Technology(ONT)超長讀長測序(966.74×覆蓋度)、Illumina短讀長測序(149.37×覆蓋度)和Hi-C測序數(shù)據(jù)(190.8×覆蓋度),通過NextDenovo進(jìn)行從頭組裝,并利用Nextpolish進(jìn)行多輪拋光,最終獲得包含7條染色體的高質(zhì)量基因組組裝。
研究團(tuán)隊(duì)獲得的Dm.nT2T基因組組裝大小為161.63 Mb,比當(dāng)前參考基因組R6大17.93 Mb,contig N50達(dá)到21.93 Mb,成功閉合了93.28%的R6缺口。質(zhì)量評(píng)估顯示,該組裝的k-mer完整性為98.0%,QV值為40.24,BUSCO分析顯示98.8%的完整性,略高于R6參考基因組。特別值得注意的是,研究人員成功解析了核糖體DNA(rDNA)陣列和組蛋白基因簇等傳統(tǒng)上難以組裝的區(qū)域。在Dm.nT2T中,18S、5.8S和28S rDNA序列被精確定位到X染色體和Y染色體上,而R6基因組中Y染色體的rDNA簇未被注釋。組蛋白基因簇在2L染色體上的組裝區(qū)間從R6的21.4-21.5 Mb擴(kuò)展到21.4-22.1 Mb,顯示了在重復(fù)序列解析方面的顯著改進(jìn)。
重復(fù)序列與結(jié)構(gòu)變異分析
Dm.nT2T基因組中重復(fù)序列含量為30.57%,其中轉(zhuǎn)座元件(TEs)占22.79%,略高于R6基因組的21.7%。研究人員發(fā)現(xiàn)了所有主要類型的TEs,包括DNA轉(zhuǎn)座子(3.98%)、長末端重復(fù)序列(LTRs, 11.91%)、長散布核元件(LINEs, 6.87%)和短散布核元件(SINEs, 0.02%)。特別引人注目的是SINE元件的發(fā)現(xiàn),因?yàn)橄惹暗难芯亢臀墨I(xiàn)并未報(bào)道其在黑腹果蠅中存在。通過與已知的DINE-1和suffix元件比較,發(fā)現(xiàn)這些SINE序列與它們相似度很低(16-30%),表明它們代表了黑腹果蠅中一個(gè)獨(dú)立的進(jìn)化譜系。
通過與R6參考基因組的比較,研究團(tuán)隊(duì)共鑒定出7,989個(gè)結(jié)構(gòu)變異(SVs),包括2,862個(gè)插入(INSs)、3,208個(gè)缺失(DELs)、242個(gè)重復(fù)(DUPs)、203個(gè)倒位(INVs)和1,474個(gè)易位(TRAs)。這些SVs在所有常染色體的端粒區(qū)域、X染色體的一端以及Y染色體全染色體富集,其中79.57%的INDELs長度超過100 bp。功能注釋顯示,大多數(shù)SVs位于基因間區(qū)(46.7%)和內(nèi)含子區(qū)(38.2%),只有4.2%位于外顯子區(qū)。
黑腹果蠅的端粒結(jié)構(gòu)與其他真核生物顯著不同,它們不是由端粒酶維持,而是通過三種特殊逆轉(zhuǎn)錄轉(zhuǎn)座子(HeT-A、TART和TAHRE)的靶向轉(zhuǎn)座來延長。研究人員在Dm.nT2T組裝中鑒定出所有染色體的端粒區(qū)域,發(fā)現(xiàn)其端粒轉(zhuǎn)座子組成比R6參考基因組更為復(fù)雜,除了HeT-A外,還包含TART、TAHRE和HETA_DSi等多種轉(zhuǎn)座子家族。
對(duì)于著絲粒區(qū)域,研究人員采用串聯(lián)重復(fù)查找器(TRF)和StainedGlass可視化相結(jié)合的方法,發(fā)現(xiàn)黑腹果蠅的著絲粒主要由5-12 bp的衛(wèi)星重復(fù)序列構(gòu)成,其中5-bp重復(fù)最為豐富,有290,576個(gè)拷貝,約占基因組的0.9%。通過整合CENP-A ChIP-seq數(shù)據(jù)驗(yàn)證,最終確定了各條染色體的著絲粒區(qū)域,長度從4號(hào)染色體的35.3 kb到X染色體的2.6 Mb不等,平均長度為920 kb。轉(zhuǎn)座子分布分析顯示,著絲粒區(qū)域主要富含Jockey、CR1、R1、Copia、Gypsy、Pao和Helitron等七種類型的轉(zhuǎn)座子。
通過多證據(jù)整合方法,研究團(tuán)隊(duì)在Dm.nT2T基因組中注釋了17,898個(gè)基因,其中發(fā)現(xiàn)了213個(gè)潛在的新基因。通過相互最佳命中(RBH)分析和轉(zhuǎn)錄組驗(yàn)證,最終確認(rèn)了92個(gè)新基因,其中74個(gè)被預(yù)測為蛋白質(zhì)編碼基因。這些基因在染色體上分布不均,約63%位于3R染色體上,而在性染色體上分布極少。
為了驗(yàn)證這些新基因的生物學(xué)功能,研究人員選擇了兩代表性基因Chr2R.722和Chr3L.2449進(jìn)行功能驗(yàn)證。通過CRISPR/Cas9技術(shù)引入移碼突變,發(fā)現(xiàn)Chr3L.2449基因敲除后果蠅的嗅覺能力顯著受損。在Y型管嗅覺選擇實(shí)驗(yàn)中,突變體果蠅對(duì)厭惡氣味劑3-Octanol(OCT)的反應(yīng)明顯弱于對(duì)照組,表明該基因在嗅覺功能中發(fā)揮關(guān)鍵作用。
Dm.nT2T基因組的發(fā)布標(biāo)志著果蠅基因組學(xué)研究進(jìn)入了一個(gè)新階段。這項(xiàng)研究不僅解決了長期存在的基因組缺口問題,還揭示了品系特異的遺傳變異,特別是著絲粒和端粒區(qū)域的完整表征為理解染色體生物學(xué)提供了新見解。SINE轉(zhuǎn)座子的發(fā)現(xiàn)挑戰(zhàn)了我們對(duì)果蠅轉(zhuǎn)座子組成的傳統(tǒng)認(rèn)知,而新基因的功能驗(yàn)證則展示了完整基因組組裝在發(fā)現(xiàn)功能元件方面的重要價(jià)值。
盡管Dm.nT2T組裝取得了顯著進(jìn)展,但仍存在一些局限性。例如,Y染色體的組裝長度(6.27 Mb)與之前報(bào)道的14.6 Mb存在差異,這可能反映了品系特異性差異或組裝挑戰(zhàn)。此外,與估計(jì)的基因組大小(117-205 Mb)相比,當(dāng)前組裝仍有約54 Mb的差距,這可能源于殘留的異染色質(zhì)區(qū)域或品系特異性變異。
未來研究需要整合更多個(gè)體和品系的長讀長測序數(shù)據(jù),結(jié)合轉(zhuǎn)錄組和表型分析,以全面揭示這些結(jié)構(gòu)變異的功能和進(jìn)化意義。Dm.nT2T基因組的發(fā)布為果蠅生物學(xué)研究提供了寶貴資源,將推動(dòng)我們對(duì)基因組結(jié)構(gòu)、功能和進(jìn)化的理解邁向新的高度。
生物通微信公眾號(hào)
生物通新浪微博
- 搜索
- 國際
- 國內(nèi)
- 人物
- 產(chǎn)業(yè)
- 熱點(diǎn)
- 科普
今日動(dòng)態(tài) |
人才市場 |
新技術(shù)專欄 |
中國科學(xué)人 |
云展臺(tái) |
BioHot |
云講堂直播 |
會(huì)展中心 |
特價(jià)專欄 |
技術(shù)快訊 |
免費(fèi)試用
版權(quán)所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
聯(lián)系信箱:
粵ICP備09063491號(hào)