《Journal of Chemical Theory and Computation》:Improving Conformational Ensembles of Folded Proteins in Go?Martini
編輯推薦:
本文綜述了通過擾動優化方法改進Go?Martini模型,以準確復現原子模擬中折疊蛋白質的構象動力學。針對標準均勻Go?網絡在捕獲蛋白質本質子空間自由能景觀方面的不足,作者提出了一種自動化的PoGo?優化框架。該框架基于微擾理論和粒子群優化算法,通過迭代調整Go?網絡中的非均勻相互作用強度,無需在每一步優化都進行模擬,從而顯著提升了粗粒化系綜與原子參考系綜在本質動力學和局部柔性上的一致性。該方法同樣適用于優化彈性網絡模型,為精確研究蛋白質構象變化提供了高效工具。
引言
蛋白質是生命系統的核心功能分子,其功能常依賴于構象變化以實現不同生物狀態間的轉換。研究表明,大多數蛋白質動力學可以由少量的集體變量(通過主成分分析(PCA)等技術識別)來有效描述。將高維動力學投影到這些“本質”主成分上并量化低維自由能景觀,是理解蛋白質構象動力學和折疊的關鍵。粗粒化模型通過簡化系統表示、犧牲快速自由度的細節,可以顯著降低計算成本,從而實現對原子分子動力學在時空尺度上的有力近似。其中,Martini粗粒化力場是模擬生物分子系統最廣泛使用的基于物理的力場之一。然而,由于方向性相互作用(如氫鍵)被平均化,Martini自身無法維持折疊的蛋白質結構。為此,通常將Martini與基于結構的模型,如彈性網絡模型(ENM)或Go?模型結合使用。盡管ENM和Go?模型能夠保持蛋白質的整體折疊并捕獲其柔性,但它們重現構象動力學的能力尚不明確,尤其是在與原子模擬相比時,其在本質子空間中采樣到的構象空間有限。
方法
微擾理論
研究采用并擴展了Koyama等人提出的微擾理論框架。對于一個由加和勢函數V(q) = Σi=1NLi(q)描述的分子系統,其正則構型分布為ρ(q) = (1/Z) e-V(q)。從構成V(q)的N個勢能中,選擇一個由M個勢能L(q) = [L1(q), ..., LM(q)]T組成的子集,并引入微擾系數λ = [λ1, ..., λM]T,構建一個新的微擾勢能:Vλ(q) = V(q) - λTL(q) = V(q) - Σk=1MλkLk(q)。對應的微擾構型分布為ρλ(q) = (Z/Zλ) ρ(q) eλTL= ρ(q) e-ψ(λ)+λTL,其中 eψ(λ)≡ ?eλTL?。對于小擾動(∥λ∥ ? 1),可將ψ(λ)在λ=0處進行二階泰勒展開,得到近似表達式。通過將協方差矩陣C對角化并進行基變換,最終得到一個高效的計算表達式,可以量化一組線性無關的微擾函數所引起的模擬蛋白質構型分布變化。該微擾理論框架為后續的力場優化提供了理論基礎,使得無需在每次嘗試參數更改時都進行分子動力學模擬,即可分析性地確定網絡改進將如何移動構象系綜。
系綜相似性度量
為了量化測試的原子模型和粗粒化模型在本質子空間上的一致性,研究引入了三個度量指標:均方根內積(RMSIP)、協方差重疊(CO)和切片Wasserstein距離(SWD)。RMSIP衡量由前n個特征向量張成的兩個子空間之間的幾何相似性。CO與RMSIP類似,但強調沿大方差方向的子空間重疊,同時削弱攜帶小方差的重疊。與RMSIP或CO等其他結構相似性度量不同,SWD提供了一個真實的距離度量,可以更好地比較采樣分布本身。
原子與粗粒化模擬
所有分子動力學模擬均使用GROMACS 2023進行。原子模擬使用Amber99SB*-ILDN力場和TIP3P水模型;粗粒化模擬使用Martini 3力場。Martini拓撲使用martinize2生成。初始彈性網絡(κ = 500 kJ/mol/nm2)和Go?網絡(ε = 9.4 kJ/mol)使用參考晶體結構構建。對所有系統進行了初始最小化。所有生產模擬均使用蛙跳積分器,原子系統和粗粒化系統的時間步長分別為2 fs和20 fs。使用速度重標度熱浴在300 K下維持溫度,使用C-rescale氣壓計在1 bar下維持壓力。
結果與討論
均勻Go?網絡在重現本質動力學方面的局限性
研究選取了三個測試系統:T4溶菌酶(T4L)、大腸桿菌核糖結合蛋白(RBP)和大腸桿菌麥芽糖結合蛋白(MBP)。研究產生了5 × 600 ns的原子MD軌跡,以及使用ENM或Go?網絡的Martini采樣。對前向映射的原子軌跡進行笛卡爾空間主成分分析,揭示了多樣的特征運動。將原子和粗粒化軌跡投影到本質子空間顯示,均勻的9.4 kJ/mol Go?模型系綜明顯比原子系綜更擴張,且在T4L和MBP中采樣了多個最小值。ENM系綜雖然部分重疊,但也未能完全復現原子MD模擬在本質子空間內的采樣。通過RMSIP、CO和SWD度量進行系統比較發現,雖然兩種模型都能合理捕獲測試蛋白的本質模式和子空間整體形狀,但在采樣的構象空間分布上重疊度不佳,特別是Go?模型的SWD值更大。增強Go?網絡相互作用強度(ε = 14.1 kJ/mol)或根據原子軌跡調整其平衡距離,僅能帶來適度而非最優的改進。這些結果表明,需要優化非均勻的Go?網絡以匹配參考系綜在本質子空間的行為。
基于微擾的非均勻Go?網絡優化
為匹配本質子空間中的參考系綜,研究提出并實施了一種基于微擾理論的非均勻Go?網絡優化方法。首先,將原子系綜映射到Martini粗粒化表示,進行主成分分析并將軌跡投影到所得的本質子空間以獲得目標分布ρAA(q)。生成一個以均勻Go?網絡初始化的粗粒化系綜,并投影到同一子空間得到ρCG(q),作為優化的基礎。隨后構建一個目標函數χ(λ),該函數衡量應用微擾λ后,預測的粗粒化分布變化與目標分布變化之間的差異。利用微擾理論導出的近似解析表達式,可以在無需運行微擾系綜模擬的情況下計算χ(λ)。這使得能夠使用快速的粒子群優化(PSO)方法來尋找最小化目標函數的最優微擾λ。然后使用更新后的Go?網絡模擬新的粗粒化系綜,并迭代重復此過程直至收斂。該方法被命名為PoGo?。
測試表明,該優化算法對所有測試蛋白質都能在約30步內快速收斂,且與初始Go?網絡強度的選擇無關。優化產生了每種蛋白質獨特的Go?網絡,部分鍵增強,部分鍵減弱。盡管從不同初始強度開始的優化會收斂到不同的參數集(表現為不同的平均相互作用強度),但這些解在目標可觀測量(即本質動力學)上是等效的。所有優化方案產生的粗粒化系綜與參考原子MD系綜在本質動力學上都具有出色的一致性,SWD值接近0.1 nm,比均勻Go?網絡報告的值提高了一個數量級以上。
優化的Go?網絡重現原子本質動力學并改善局部蛋白質柔性
與未優化的均勻Go?網絡相比,優化后的Go?網絡產生的系綜在視覺上與參考原子系綜更相似。對本質子空間的詳細分析顯示,所有測試蛋白質系統的SWD值顯著降低,RMSIP和CO值也有所改善。即使將計算擴展到前五個或十個主成分,相對于未優化的Go?網絡仍有改進。作為獨立的交叉驗證,對骨架珠局部均方根波動(RMSF)的分析表明,優化后的系綜與參考原子系綜的波動譜一致性顯著提高,每個殘基的平均無符號偏差大約減少了一半。相比之下,單純通過均勻增加相互作用強度來改善局部RMSF譜,只能帶來與原子本質子空間重疊度的微小提升。這表明,重現局部RMSF并不一定能確保準確的全局動力學,而PoGo?優化方法以更小的總相互作用能擾動,在波動譜和本質子空間上都實現了更好的一致性。
優化的ENM同樣可以重現本質動力學
鑒于對ENM中彈簧常數的擾動也是線性的,研究也將優化框架應用于ENM。對于所有三個測試蛋白質,優化僅對原本合理的RMSIP和CO值帶來了微小改變,但顯著改善了系綜重疊和波動譜。這證明了該方法可以同時應用于Martini力場的Go?和ENM組件。
結論
總而言之,研究開發并評估了PoGo?,一種用于Go?網絡(此處專門應用于Go?Martini)的基于微擾的優化方法。通過解析地確定網絡改進將如何移動構象系綜,可以提出單一、信息量最大的更新,避免了在每次嘗試參數變化時進行MD模擬的需要。研究在三種不同的蛋白質系統上測試了該方法,在每種情況下都在數十個優化步驟內獲得了收斂的Go?網絡。由此產生的粗粒化系綜在本質子空間中的自由能景觀與相應原子參考模擬的結果非常吻合。研究進一步將該框架擴展到優化ENM中的彈簧常數,并取得了類似的成功。此外,研究發現,雖然未明確優化原子波動,但改善沿本質主成分的一致性同時也改善了原子和粗粒化波動譜之間的一致性。簡而言之,研究提供了一種完全自動化的方法,用于優化基于Go?Martini的蛋白質模型的本質動力學和波動。