
-
生物通官微
陪你抓住生命科技
跳動的脈搏
高斯-牛頓時序差分學習與非線性函數逼近
《IEEE Transactions on Neural Networks and Learning Systems》:Gauss–Newton Temporal Difference Learning With Nonlinear Function Approximation
【字體: 大 中 小 】 時間:2026年02月27日 來源:IEEE Transactions on Neural Networks and Learning Systems 8.9
編輯推薦:
提出基于高斯-牛頓迭代的GNTD學習方法,優化非線性Q函數近似,通過目標網絡避免雙采樣,分析不精確步長確保高效計算,推導全局最優收斂性,樣本復雜度提升至O(ε^{-1.5}),實驗驗證優于傳統TD方法。
生物通微信公眾號
知名企業招聘