《Theoretical Population Biology》:Clade size distributions under the coalescent diversification model
編輯推薦:
本文為讀者系統(tǒng)闡釋了在溯祖分化模型下推導(dǎo)支系大小(clade size)分布的全新分析方法。作者不僅建立了恒定與變化種群規(guī)模下的(聯(lián)合)分布閉合解,并與Yule模型進(jìn)行了對比,其定量差異揭示了緩慢增長疫情反而更易產(chǎn)生大傳播簇的反直覺現(xiàn)象。該工作為識別多樣性異常、檢驗(yàn)宏觀演化的密度依賴性假說及流行病傳播動態(tài)推斷提供了關(guān)鍵理論工具。
亮點(diǎn)
- •
在溯祖分化模型中推導(dǎo)了單個(gè)及多個(gè)支系大小的(聯(lián)合)分布。
- •
對比了溯祖模型與尤爾(Yule)模型的支系大小分布模式。
- •
揭示了緩慢增長的疫情反而更可能產(chǎn)生大傳播簇的意外結(jié)果。
引言
計(jì)算系統(tǒng)發(fā)育樹中的支系大小分布是演化生物學(xué)中一個(gè)經(jīng)久不衰的問題,在古生物學(xué)、流行病學(xué)、保護(hù)生物學(xué)和細(xì)胞生物學(xué)等領(lǐng)域有著廣泛的應(yīng)用。在宏觀演化背景下,多樣性異常類群(例如,適應(yīng)輻射或“活化石”)正是通過這類模型來識別。在流行病學(xué)領(lǐng)域,龐大的病毒譜系支系則可能意味著需要特別關(guān)注的傳播集群。因此,需要理論預(yù)期來識別異常集群,并了解集群大小分布如何依賴于流行病學(xué)動態(tài)(例如,疫情增長期與地方性流行期的對比)。支系大小也可作為檢驗(yàn)替代分化假說的基礎(chǔ),例如檢驗(yàn)分化是否會因有限的生態(tài)位空間競爭而受到“限制”。
方法
我們考慮少數(shù)n個(gè)在當(dāng)下被觀測到的譜系,其遵循中性Wright-Fisher過程的演化歷史。當(dāng)下時(shí)間τ前的種群規(guī)模由N(τ)給出,時(shí)間以Nref代為單位度量。我們首先假設(shè)(案例1-4)種群規(guī)模N(τ) = Nref不隨時(shí)間變化,并在案例5中放寬此假設(shè),允許種群規(guī)模任意變化。當(dāng)種群規(guī)模很大時(shí),n個(gè)隨機(jī)采樣譜系的演化歷史可以通過溯祖過程來近似。
結(jié)果
溯祖分化模型天然地以當(dāng)下譜系數(shù)量n為條件。在T = 0時(shí),系統(tǒng)發(fā)育樹擁有n個(gè)大小為1的支系。隨著時(shí)間推移,這些獨(dú)立的譜系會通過“溯祖事件”成對合并,最終在T → ∞時(shí)融合為一個(gè)大小為n的單系支系。我們的任務(wù)便是描述這一極端變化之間的過渡速率和方式——我們通過將溯祖模型與經(jīng)典的“空心曲線分布”以及n-尤爾(n-Yule)分化模型(設(shè)λ = 1)的結(jié)果進(jìn)行比較來完成這項(xiàng)工作。
討論
我們在本文中推導(dǎo)了溯祖模型在給定時(shí)間下邊際與聯(lián)合支系大小分布的解析表達(dá)式。從方法學(xué)角度看,這項(xiàng)工作的一個(gè)關(guān)鍵工具在于認(rèn)識到支系可以被表示為表示采樣譜系數(shù)量的整數(shù)n的整數(shù)劃分。給定這些劃分,支系大小的分布便簡單地取決于給定時(shí)間存在的祖先數(shù)量。這一洞見使我們能夠從