《Journal of Advanced Research》:Comparative genomics reveals two major lineages of
Bifidobacterium adolescentis in the human gut, driven by divergent adaptation in China and the United States
編輯推薦:
本研究針對(duì)青春雙歧桿菌(B. adolescentis)基因組多樣性與進(jìn)化機(jī)制不明的問(wèn)題,對(duì)395株菌株開(kāi)展大規(guī)模比較基因組分析,發(fā)現(xiàn)該菌種已形成中美兩大譜系,其功能異質(zhì)性由同源重組主導(dǎo),為開(kāi)發(fā)地域特異性益生菌提供理論基礎(chǔ)。
在人體腸道這個(gè)神秘而復(fù)雜的微生態(tài)系統(tǒng)中,數(shù)以萬(wàn)億計(jì)的微生物與宿主共同演化,形成了精妙的共生關(guān)系。其中,青春雙歧桿菌(Bifidobacterium adolescentis)作為成年人腸道中的優(yōu)勢(shì)菌群,占據(jù)著舉足輕重的地位。這種革蘭氏陽(yáng)性、嚴(yán)格厭氧的細(xì)菌在60-80%的健康成年人腸道中定植,占糞便微生物群總量的比例可高達(dá)5%,尤其在16至45歲的成年人群中豐度達(dá)到峰值,暗示著其對(duì)成人腸道環(huán)境具有特殊的適應(yīng)性。更為引人注目的是,百歲老人體內(nèi)該菌的豐度顯著升高,提示其可能與健康長(zhǎng)壽存在關(guān)聯(lián)。
然而,盡管青春雙歧桿菌展現(xiàn)出諸多益生潛力——從抗焦慮、抗抑郁到廣譜抗菌抗病毒活性,再到緩解阿司匹林和應(yīng)激誘導(dǎo)的腸道通透性增加——其功能特性卻呈現(xiàn)出高度的菌株特異性。不同宿主來(lái)源的菌株在代謝能力和免疫調(diào)節(jié)功能上表現(xiàn)出顯著差異,即便是來(lái)自同一宿主的七個(gè)分離株也在親水性和自聚集能力上存在顯著變異。這種功能異質(zhì)性的根源在于基因組的高度可塑性。已有研究發(fā)現(xiàn),不同菌株的胞外多糖生物合成基因簇在序列和組織結(jié)構(gòu)上差異巨大,缺乏一致性結(jié)構(gòu)。更為復(fù)雜的是,雖然青春雙歧桿菌普遍存在于人類(lèi)腸道中,但其豐度受到飲食的強(qiáng)烈影響:高碳水化合物攝入者體內(nèi)該菌豐度較高,而高蛋白或高脂肪飲食則與其水平呈負(fù)相關(guān)。
面對(duì)這一背景,一個(gè)關(guān)鍵科學(xué)問(wèn)題浮出水面:在全球化時(shí)代,不同地理人群的飲食結(jié)構(gòu)、生活方式和醫(yī)療實(shí)踐差異,是否在塑造青春雙歧桿菌的基因組特征上留下了深刻的印記?遺憾的是,此前的比較基因組學(xué)研究?jī)H涵蓋18株菌株,且地理采樣范圍狹窄,對(duì)該物種的群體水平基因組特征、功能多樣性及進(jìn)化動(dòng)態(tài)認(rèn)識(shí)極為有限。正是為了填補(bǔ)這一知識(shí)空白,研究團(tuán)隊(duì)開(kāi)展了迄今最大規(guī)模的青春雙歧桿菌比較基因組學(xué)研究。
這項(xiàng)發(fā)表在《Journal of Advanced Research》的研究整合了395株高質(zhì)量基因組,其中包括82株來(lái)自湖北襄陽(yáng)和內(nèi)蒙古呼和浩特的新分離株,以及313株來(lái)自公共數(shù)據(jù)庫(kù)的已發(fā)表基因組,樣本覆蓋中國(guó)(169株)、美國(guó)(146株)、澳大利亞(25株)、意大利(15株)、英國(guó)(13株)等多個(gè)地理區(qū)域。通過(guò)多維度分析框架,研究系統(tǒng)闡明了該物種的泛基因組結(jié)構(gòu)、群體遺傳分化、碳水化合物代謝適應(yīng)、抗生素抗性基因分布及進(jìn)化動(dòng)力學(xué)的全球圖景。
研究采用的關(guān)鍵技術(shù)方法包括:基于CheckM的基因組質(zhì)量評(píng)估(完整性>95%,污染<5%);使用Prokka進(jìn)行基因預(yù)測(cè),eggNOG-mapper進(jìn)行功能注釋?zhuān)煌ㄟ^(guò)dbCAN 2鑒定碳水化合物活性酶(CAZyme);利用Roary pipeline進(jìn)行泛基因組和核心基因組分析;采用Snippy pipeline進(jìn)行單核苷otide多態(tài)性(SNP)檢測(cè),并結(jié)合Gubbins過(guò)濾重組區(qū)域;使用RAxML-NG構(gòu)建最大似然系統(tǒng)發(fā)育樹(shù);運(yùn)用PopCOGenT檢測(cè)水平基因轉(zhuǎn)移(HGT)事件;通過(guò)IslandViewer 4預(yù)測(cè)基因組島(GI);借助PopLDdecay分析連鎖不平衡(LD)衰減模式;使用OPLS-DA進(jìn)行多變量統(tǒng)計(jì)分析。
基因組多樣性與泛基因組結(jié)構(gòu)
通過(guò)對(duì)395株菌株的基因組特征分析,研究發(fā)現(xiàn)平均基因組大小為2.23±0.09 Mb,GC含量為59.35±0.22%。值得注意的是,新分離的中國(guó)菌株在基因組大小、編碼序列(CDS)數(shù)量、轉(zhuǎn)運(yùn)RNA(tRNA)和核糖體RNA(rRNA)基因數(shù)量上均與公共數(shù)據(jù)庫(kù)中的菌株存在顯著差異,特別是rRNA基因數(shù)量顯著高于先前報(bào)道的中國(guó)菌株,提示既往測(cè)序工作可能存在區(qū)域或方法學(xué)偏差。泛基因組分析顯示該物種具有開(kāi)放的泛基因組結(jié)構(gòu),遵循冪律模型y=2190×x(R=0.9994),意味著新測(cè)序工作將持續(xù)發(fā)現(xiàn)新基因。在總計(jì)12,402個(gè)基因家族中,云基因(存在于<15%的分離株中)占81.8%,而核心基因(存在于100%的菌株中)僅占5.0%,凸顯了該物種巨大的附屬基因組和廣泛的遺傳異質(zhì)性。
區(qū)域系統(tǒng)發(fā)育結(jié)構(gòu)與基因組分化
基于614個(gè)單拷貝核心基因構(gòu)建的系統(tǒng)發(fā)育樹(shù)揭示了清晰的地理分層模式:349株形成A、B兩大分支,其中151株中國(guó)分離株主要聚集在B分支,121株美國(guó)分離株分布在A分支。澳大利亞菌株(17/25)主要位于A-2亞群,與美國(guó)菌株親緣關(guān)系較近。ANI(平均核苷酸一致性)分析進(jìn)一步證實(shí)了這種地理聚類(lèi)模式。OPLS-DA分析顯示,泛基因組和核心基因組譜系均能顯著區(qū)分不同地理來(lái)源的菌株,中美菌株呈現(xiàn)明顯分離。值得注意的是,美國(guó)菌株具有最大的泛基因組(4,868個(gè)基因家族)和最多的附屬基因,而中國(guó)菌株的核心基因家族數(shù)量(1,136個(gè))位居前列。
突變與SNP分析揭示的區(qū)域遺傳分化
全基因組共鑒定出61,275個(gè)SNP,包括18,373個(gè)非同義和38,668個(gè)同義突變,轉(zhuǎn)換/顛換比為5.11。基于SNP的OPLS-DA清晰分離了不同地理群體,但經(jīng)重組過(guò)濾后的核心SNP系統(tǒng)發(fā)育樹(shù)卻未顯示強(qiáng)烈的地理聚類(lèi)。這一看似矛盾的現(xiàn)象源于核心基因樹(shù)保留了遠(yuǎn)古譜系分化的信號(hào),而重組過(guò)濾后的SNP主要反映近期垂直遺傳的點(diǎn)突變。高頻的同源重組不斷同質(zhì)化地理群體間的局部基因組,從而抹去了SNP樹(shù)中的精細(xì)群體結(jié)構(gòu)。通過(guò)VIP(變量重要性投影)分析篩選出10個(gè)關(guān)鍵區(qū)分基因,包括beta-galIII、bfrA、gtfA、crcB_2和yteP等,這些基因在中美菌株中呈現(xiàn)相反的富集模式,可作為追溯菌株地理來(lái)源的潛在分子標(biāo)記。
功能注釋揭示的地理適應(yīng):碳水化合物代謝與CRISPR-Cas系統(tǒng)
功能注釋分析揭示了顯著的區(qū)域代謝差異。中國(guó)菌株編碼最多的KEGG直系同源物(KO,1,071個(gè))和CAZyme(76個(gè)),其中34個(gè)KO為特有,主要涉及信號(hào)轉(zhuǎn)導(dǎo)和細(xì)胞過(guò)程,如ABC-2型轉(zhuǎn)運(yùn)系統(tǒng)ATP結(jié)合蛋白(K01990)、多重糖轉(zhuǎn)運(yùn)系統(tǒng)通透酶蛋白(K02025/K02026)等。美國(guó)菌株則擁有24個(gè)特有KO,富集于遺傳信息處理通路,如DNA復(fù)制蛋白DnaC(K02315)、LacI家族轉(zhuǎn)錄調(diào)節(jié)因子(K02529)等。
在CAZyme層面,區(qū)域特異性更為顯著。美國(guó)菌株特有CBM10、CE5、GH15和GH91家族;中國(guó)菌株特有CBM61、CBM77、GH112、GH125、GH28和GH85家族;意大利菌株僅特有CBM4。中國(guó)菌株富含糖基轉(zhuǎn)移酶(GT)家族(特別是GT27和GT32),而CBM和碳水化合物酯酶(CE)家族較少,提示其功能偏向聚糖合成而非降解。關(guān)鍵區(qū)分特征包括15個(gè)CBM家族、4個(gè)CE家族和8個(gè)GT家族的顯著差異,這些家族多與植物多糖利用相關(guān)。
防御系統(tǒng)分析顯示35.7%的菌株攜帶完整的CRISPR-Cas系統(tǒng),共鑒定出6種亞型。地理分布呈現(xiàn)顯著差異:美國(guó)菌株富集class 2-subtype-II-C和class 1-subtype-I-G;中國(guó)菌株以class 1-subtype-I-G和class 1-subtype-I-C為主;澳大利亞菌株則class 1-subtype-I-C prevalence較高。這種區(qū)域分層暗示不同人群面臨差異化的噬菌體或移動(dòng)遺傳元件(MGE)暴露壓力。
水平基因轉(zhuǎn)移與移動(dòng)遺傳元件分布
PopCOGenT分析揭示了廣泛的近期HGT事件,但HGT網(wǎng)絡(luò)未顯示清晰的地理聚類(lèi),暗示基因流跨越區(qū)域邊界,不受限于地理共現(xiàn)的譜系。這種泛混合模式反映了物種內(nèi)高度的遺傳連通性。MGE分析顯示美國(guó)菌株攜帶的MGE數(shù)量顯著高于中國(guó)菌株,尤其在整合與切除元件、穩(wěn)定性/轉(zhuǎn)移/防御元件方面更為富集,表明其具有更高的基因組重排、防御機(jī)制和水平獲取潛力。
基因組島分析揭示的HGT與功能潛力區(qū)域模式
基因組島作為HGT獲得的大片段染色體區(qū)域,是微生物適應(yīng)、生態(tài)位特化和代謝擴(kuò)展的重要載體。英國(guó)菌株平均GI數(shù)量最高(21.0±3.8),其次為美國(guó)(20.03±4.49)、意大利(20.0±8.9)、中國(guó)(19.65±4.28)和澳大利亞(18.32±3.4)。在GI區(qū)域內(nèi)共鑒定出57個(gè)具有區(qū)域富集或缺失模式的CAZyme編碼基因。CBM46僅在澳大利亞菌株的GI中檢出且全基因組prevalence顯著高于其他區(qū)域;CBM32在英國(guó)菌株GI中檢出率更高;GH23在中國(guó)菌株GI中顯著富集。相反,CE1在中國(guó)菌株中顯著缺失,GH1在美國(guó)、英國(guó)和意大利菌株中顯著富集。
抗生素抗性基因(ARG)分析鑒定出7個(gè)ARG,其中rpoB(99.2%)為保守的物種鑒定標(biāo)記基因,位于染色體而非GI中。而tet(W/32/O)(23%)和ermX(10.6%)則主要存在于中國(guó)菌株(分別為71.4%和95.2%),且?guī)缀跬耆挥贕I內(nèi),強(qiáng)烈提示這些基因通過(guò)HGT獲得,可能與中國(guó)的抗生素使用模式或耐藥微生物群落共存有關(guān)。
重組驅(qū)動(dòng)青春雙歧桿菌的區(qū)域分化進(jìn)化
為評(píng)估同源重組與點(diǎn)突變的相對(duì)貢獻(xiàn),研究計(jì)算了重組/突變比(r/m)。整體r/m比為2.69,表明重組在塑造遺傳變異中作用大于突變。中國(guó)菌株r/m值最高(3.50),美國(guó)次之(2.98),而澳大利亞(0.54)、意大利(0.59)和英國(guó)(0.45)均低于1,提示突變是后三個(gè)地區(qū)的主導(dǎo)進(jìn)化力量。LD衰減分析進(jìn)一步支持這一結(jié)論:中國(guó)菌株平均r最低(0.096),美國(guó)次之(0.143),而英國(guó)最高(0.249)。LD衰減曲線顯示中美菌株呈陡峭下降,而澳意英菌株斜率平緩,證實(shí)前者重組頻率高、后者更具克隆性。
這項(xiàng)研究的重要意義在于首次在全球尺度上系統(tǒng)闡明了青春雙歧桿菌的群體基因組結(jié)構(gòu)和進(jìn)化動(dòng)力學(xué)。研究發(fā)現(xiàn)該物種已形成以中國(guó)和美國(guó)為代表的兩大主要譜系,這種分化并非源于點(diǎn)突變的逐漸積累,而是由廣泛發(fā)生的同源重組所主導(dǎo)。基因組島作為功能創(chuàng)新的熱點(diǎn)區(qū)域,承載了區(qū)域特異性的碳水化合物代謝酶和抗生素抗性基因,反映了宿主飲食、抗生素暴露等生態(tài)因子的選擇壓力。
特別值得關(guān)注的是,中美菌株在CAZyme譜上的顯著差異——中國(guó)菌株富集植物多糖降解酶(如果膠酶YTEP),美國(guó)菌株富集乳糖代謝酶(如beta-半乳糖苷酶)——與兩地飲食結(jié)構(gòu)(高纖維vs.高乳制品)高度吻合,展現(xiàn)了微生物對(duì)宿主飲食的精細(xì)適應(yīng)。同時(shí),tet(W/32/O)和ermX在中國(guó)菌株中的高頻出現(xiàn)及其與GI的關(guān)聯(lián),為監(jiān)測(cè)腸道微生物耐藥性傳播提供了重要靶點(diǎn)。
從進(jìn)化生物學(xué)視角,該研究揭示了重組在細(xì)菌物種形成中的復(fù)雜作用:高頻重組雖能同質(zhì)化群體間的局部基因組,卻不足以抹去基于數(shù)百個(gè)保守核心基因構(gòu)建的深層系統(tǒng)發(fā)育框架。這種"核心基因樹(shù)強(qiáng)地理信號(hào)、重組過(guò)濾SNP樹(shù)弱地理信號(hào)"的悖論,為理解細(xì)菌群體遺傳結(jié)構(gòu)提供了新的理論視角。
在應(yīng)用層面,這些發(fā)現(xiàn)為開(kāi)發(fā)地域特異性益生菌制劑和個(gè)性化微生態(tài)干預(yù)策略奠定了基因組學(xué)基礎(chǔ)。鑒于不同地理人群攜帶的青春雙歧桿菌在功能潛力上存在顯著差異,未來(lái)的益生菌篩選和應(yīng)用需充分考慮菌株的地理起源與宿主飲食背景的匹配性。同時(shí),針對(duì)中國(guó)人群菌株中 antibiotic resistance genes 的分布特征,有必要建立相應(yīng)的安全性評(píng)估和監(jiān)測(cè)體系。
研究的局限性包括意大利、英國(guó)和澳大利亞樣本量相對(duì)較小,缺乏個(gè)體水平的飲食和抗生素使用等元數(shù)據(jù),以及分析流程依賴(lài)較多手動(dòng)操作影響效率和可重復(fù)性。未來(lái)研究應(yīng)在擴(kuò)大地理采樣、整合宿主生活方式數(shù)據(jù)、開(kāi)發(fā)自動(dòng)化機(jī)器學(xué)習(xí)分析 pipeline 等方面深化探索,特別是通過(guò)功能實(shí)驗(yàn)驗(yàn)證候選適應(yīng)性位點(diǎn)的生理意義,并通過(guò)縱向隊(duì)列研究建立微生物進(jìn)化與個(gè)體因素的因果關(guān)聯(lián)。