《Journal of Molecular Graphics and Modelling》:Integrated Virtual Screening, Machine Learning and Molecular Dynamics Identify Novel Phytochemical FabI Inhibitors against MRSA
編輯推薦:
MRSA FabI抑制劑的計算化學發現與驗證:通過整合虛擬篩選、機器學習、可解釋AI和分子動力學模擬,從41,423個聚酚類化合物中篩選出最佳候選CNP0408084,其結合親和力(-12.57 kcal/mol)顯著優于參考化合物PV4,并展現出高動態穩定性(RMSD:1.79 ?)和熱力學優勢(ΔG結合-38.72 kcal/mol)。
Mithun Rudrapal | Kevser Kübra K?rbo?a
印度安得拉邦Guntur市Vadlamudi 52221,Vignan科學、技術和研究基金會,生物技術與制藥科學學院,藥學科學系
摘要
耐甲氧西林金黃色葡萄球菌(MRSA)感染對全球健康構成了嚴重威脅,因此需要發現針對細菌關鍵代謝途徑的新抗菌劑。烯酰酰基載體蛋白還原酶(FabI)是一個經過驗證的抗菌靶點,因為它在細菌脂肪酸生物合成中起著關鍵作用,而哺乳動物細胞中不存在這種酶。本研究旨在通過結合基于結構的虛擬篩選、機器學習(ML)分類、可解釋的人工智能(XAI)分析、分子動力學模擬和結合自由能計算的綜合計算方法,從天然產物數據庫中篩選出新型的多酚類及相關多酚類FabI抑制劑。從COCONUT數據庫中選取了41,423種類藥多酚類及相關多酚化合物,使用AutoDock Vina對它們與金黃色葡萄球菌FabI(PDB: 4BNF)的結合能力進行了篩選,并用10種ML算法根據ECFP4分子指紋將化合物分類為活性或非活性化合物。通過XAI指導的標準篩選出的候選化合物經過100納秒分子動力學模擬驗證,隨后進行了MM-GBSA結合自由能計算、主成分分析(PCA)和自由能景觀(FEL)分析。虛擬篩選共發現了26,097種化合物(占63%),其結合親和力優于參考抑制劑PV4(-8.21 kcal/mol),其中香豆素類化合物占多數(56%),其次是黃酮類化合物(20%)。SVM-RBF分類器的ROC-AUC為0.9894,Matthews相關系數為0.9017,表現最佳。特征重要性分析顯示,酚羥基/醚基團(占頂級特征的40%)和烷基鏈(占30%)是FabI抑制的關鍵結構決定因素。N-(1H-苯并咪唑-2-基)-2-(2-氧代-4-苯基-chromen-7-基)氧基乙酰胺(CNP0408084)成為最有前景的先導化合物,其結合親和力較高(-12.57 kcal/mol),能夠覆蓋大部分ML重要的結構特征(55%),并且結合穩定性也優于PV4(RMSD:1.79 ± 0.32 ? vs 2.26 ± 0.42 ?)。MM-GBSA計算證實CNP0408084的結合熱力學優勢更明顯(ΔG_bind = -38.72 ± 3.85 kcal/mol vs -24.56 ± 2.94 kcal/mol),范德華相互作用是主要驅動力。PCA分析表明CNP0408084能夠有效限制FabI的構象動態,使其分布更加緊湊;FEL分析顯示其具有穩定的、緊密結合的特性。本研究展示了將ML、可解釋AI、分子動力學和高級后分子動力學分析整合用于天然產物藥物發現的實用性,為基于結構相關性的虛擬篩選結果優先排序提供了一個通用框架。
引言
抗菌素耐藥性(AMR)是21世紀最緊迫的全球健康挑戰之一,2019年由耐藥性感染導致的死亡人數超過495萬例,預計如果不加以解決,到2050年這一數字可能上升至每年1000萬例[1]。在此背景下,近期研究采用了基于結構的計算方法,包括虛擬篩選和分子動力學(MD)模擬,以識別針對關鍵耐藥相關酶的新抑制劑[2]。在各種病原體中,耐甲氧西林金黃色葡萄球菌(MRSA)已成為醫院獲得性和社區獲得性感染的主要原因,其死亡率在發達國家甚至超過了HIV/AIDS[3]。針對傳統抗生素(包括萬古霉素中間型菌株)的耐藥機制的快速演變,迫切需要具有不同作用機制的新治療藥物。細菌的脂肪酸生物合成途徑(FAS-II)作為抗菌藥物開發的潛在靶點受到了廣泛關注。與哺乳動物中的多功能I型脂肪酸合成酶不同,細菌使用由多個基因編碼的獨立酶進行脂肪酸合成,這為選擇性抑制提供了機會,而不會對宿主產生毒性[4]。其中,烯酰酰基載體蛋白還原酶(FabI)催化脂肪酸延伸的限速步驟,以NADH依賴的方式將trans-2-烯酰-ACP還原為酰基-ACP[5]。FabI抑制劑的臨床成功,例如作為外用消毒劑的triclosan和一線抗結核藥物isoniazid,證明了該酶作為抗菌靶點的吸引力。最近,幾種針對FabI的化合物已進入臨床開發階段。AFN-1252(Debio-1452)是一種針對葡萄球菌的合成抑制劑,已完成急性細菌性皮膚感染的II期試驗,但尚未進入III期;CG400549(Nilofabicin)完成了針對MRSA皮膚感染的IIa期研究,效果良好但未進一步進展;Fabimycin主要針對革蘭氏陰性病原體設計,仍處于臨床前階段。盡管這些化合物驗證了FabI作為臨床靶點的可行性[6],但尚未獲得監管批準,而且抗生素開發的高淘汰率凸顯了從新型化學來源開發結構多樣化的FabI抑制劑的必要性。值得注意的是,所有現有的臨床FabI抑制劑候選物均為合成化合物,盡管多酚類化合物具有已知的安全性和多靶點抗菌特性,但對其系統探索仍十分有限。歷史上,天然產物一直是抗菌劑的豐富來源,尤其是多酚類及相關多酚化合物因其多樣的生物活性和已建立的安全性而受到特別關注。多酚類化合物含有多個酚羥基,通過多種機制(如膜破壞、酶抑制和干擾群體感應)展現廣譜抗菌特性[7][8]。多酚類的結構特征,特別是其芳香環和氫鍵能力,使其非常適合與FabI活性位點相互作用,triclosan的酚環可通過與NAD+輔因子的堆疊相互作用結合到該位點[9]。COCONUT數據庫包含超過400,000種天然產物,具有豐富的化學多樣性,為系統探索多酚類及相關多酚類FabI抑制劑提供了前所未有的機會。傳統的藥物發現方法雖然有效,但耗時且資源密集,典型的開發周期超過十年,成本高達數十億美元。計算方法,尤其是基于結構的虛擬篩選和機器學習(ML),已成為從大量化合物庫中加速發現先導化合物的強大工具[10]。深度學習(DL)的最新進展在抗菌發現方面取得了顯著成功,某些研究的命中率比傳統的高通量篩選提高了90倍。然而,許多ML模型的“黑箱”性質限制了其可解釋性和機制洞察力,阻礙了對識別出的候選物的合理優化。可解釋的人工智能(XAI)方法通過為模型預測提供人類可解釋的解釋來克服這一限制。特征重要性分析,特別是使用隨機森林等集成方法,能夠識別出對預測活性有貢獻的分子亞結構,使研究人員能夠理解結構-活性關系,并合理優先選擇化合物進行實驗驗證。將XAI與分子動力學(MD)模擬相結合,可以有效地驗證對接和ML的靜態預測結果在生理條件下的結合穩定性。本研究旨在通過結合基于結構的虛擬篩選、ML分類、XAI分析和分子動力學驗證的綜合計算工作流程,識別新型多酚類及相關多酚類金黃色葡萄球菌FabI抑制劑。從COCONUT和Phenol-Explorer數據庫中檢索的98,088種多酚類及相關多酚化合物庫中,經過順序篩選和ADMET過濾后獲得了41,423種類藥化合物,并對其與FabI活性位的結合能力進行了測試,隨后使用基于ECFP4分子指紋訓練的多種ML算法進行活性預測。基于隨機森林的特征重要性分析用于識別預測活性的結構決定因素,從而指導選擇用于MD模擬的候選化合物。
數據集準備和化合物檢索
多酚類及相關多酚化合物從兩個全面的天然產物數據庫中檢索:COCONUT(開放天然產物集合)版本2.0(2025年12月發布)[11]和Phenol-Explorer版本3.6 [12]。COCONUT是最大的免費開放訪問的天然產物數據庫,包含715,822種化合物,具有詳盡的結構和理化注釋,無需注冊即可訪問:
https://coconut.naturalproducts.net
化合物檢索和過濾結果
從COCONUT數據庫中初步檢索到715,822種天然產物。通過基于多酚類及相關多酚化學分類(苯丙素類、多酮類、黃酮類及相關超類)的過濾,得到了97,596種化合物。從Phenol-Explorer數據庫中檢索到492種多酚類及相關多酚化合物,連同它們的結構信息。初步的多酚類化合物集合共有98,088種。
應用Lipinski五規則
討論
本研究旨在通過結合基于結構的虛擬篩選、ML分類、可解釋AI分析和MD模擬的綜合計算方法,識別新型多酚類及相關多酚類金黃色葡萄球菌FabI抑制劑。結果表明,CNP0408084是最有前景的先導化合物,其結合親和力(-12.57 kcal/mol)和動態穩定性(RMSD:1.79 ± 0.32 ?)均優于參考化合物
結論
本研究通過結合基于結構的虛擬篩選、ML分類、可解釋AI分析、MD模擬和全面的結合自由能計算的綜合計算方法,成功識別出了新型多酚類及相關多酚類金黃色葡萄球菌FabI抑制劑。從COCONUT和Phenol-Explorer數據庫中檢索的98,088種多酚類及相關多酚化合物庫中,獲得了41,423種類藥化合物
作者貢獻聲明
Mithun Rudrapal: 撰寫——審稿與編輯、監督、項目管理、方法學、研究、概念構思。Kevser K?rbo?a: 撰寫——原始草稿、可視化、驗證、軟件開發、方法學、研究、數據分析、概念構思
數據可用性
本研究生成或分析的所有數據均包含在本文及其補充材料中。
寫作過程中生成AI和AI輔助技術的聲明
本手稿的撰寫過程中未使用任何生成AI工具。
利益沖突聲明
作者聲明沒有已知的財務利益沖突或個人關系可能影響本文所述的工作。