3p小视频,愛爱视频在线3,中文字幕亚洲天堂

首頁今日動態(tài) 人才市場新技術(shù)專欄中國科學(xué)人云展臺
BioHot
云講堂直播會展中心特價專欄技術(shù)快訊免費試用

生物通官微
陪你抓住生命科技
跳動的脈搏

生物通首頁 > 今日動態(tài) > 正文

基于A3C的神經(jīng)成本模型預(yù)測控制在SE(3)空間中的應(yīng)用：用于自主航天器的交會與對接

《Aerospace Science and Technology》：A3C-based Neural-Cost Model Predictive Control on SE(3) for Autonomous Spacecraft Rendezvous and Docking

【字體：大中小】 時間：2026年02月28日 來源：Aerospace Science and Technology 5.8

編輯推薦：

　　本文提出基于A3C框架的神經(jīng)成本模型預(yù)測控制算法，結(jié)合SE(3)耦合動力學(xué)模型，實現(xiàn)航天器rendezvous與docking任務(wù)中的軌道-姿態(tài)跟蹤控制，動態(tài)調(diào)整MPC成本函數(shù)權(quán)重，提升控制精度與計算效率，仿真驗證其魯棒性和快速收斂特性。

　　
該研究針對深空探測任務(wù)中航天器接近與對接（RV&D）的復(fù)雜控制需求，提出了一種基于SE(3)耦合動力學(xué)模型與異步優(yōu)勢演員-批評者（A3C）訓(xùn)練框架的神經(jīng)成本模型預(yù)測控制（NCMPC）算法。該方法通過融合強化學(xué)習(xí)與模型預(yù)測控制技術(shù)，實現(xiàn)了軌道-姿態(tài)聯(lián)合跟蹤控制的高效解決方案，在控制精度、收斂速度和系統(tǒng)魯棒性方面展現(xiàn)出顯著優(yōu)勢。

在航天器接近與對接任務(wù)中，高精度位置與姿態(tài)控制是確保任務(wù)成功的關(guān)鍵。傳統(tǒng)控制方法存在兩大局限性：其一，采用分離式建模策略（如SICDM和DQ-CDM），導(dǎo)致耦合效應(yīng)未被充分考量，特別是在接近階段（<100米）非線性項（科里奧利力、離心力等）引起的誤差難以消除；其二，模型自由方法（如MLP）存在泛化能力不足、依賴人工經(jīng)驗等問題。針對上述缺陷，該研究創(chuàng)新性地構(gòu)建了基于SE(3)的耦合動力學(xué)模型框架，該模型采用方向余弦矩陣與位置向量統(tǒng)一表征六自由度運動，有效避免了奇異點問題，且在空間任務(wù)中展現(xiàn)出更好的擴展性。

NCMPC算法的核心突破在于將神經(jīng)網(wǎng)絡(luò)的動態(tài)學(xué)習(xí)能力與MPC的優(yōu)化優(yōu)勢相結(jié)合。具體而言，通過異步優(yōu)勢演員-批評者算法對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練，使系統(tǒng)能夠在線自適應(yīng)調(diào)整MPC成本函數(shù)的權(quán)重參數(shù)。這種設(shè)計使得控制算法既能保持傳統(tǒng)MPC對約束條件的顯式處理能力（如狀態(tài)限制、控制輸入飽和等），又能通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)動態(tài)權(quán)重配置，從而實現(xiàn)復(fù)雜非線性系統(tǒng)的精準(zhǔn)控制。

算法實現(xiàn)包含三個關(guān)鍵環(huán)節(jié)：首先，構(gòu)建SE(3)域內(nèi)的航天器相對動力學(xué)模型，該模型同時描述了目標(biāo)航天器與跟蹤航天器的軌道運動與姿態(tài)運動耦合關(guān)系；其次，設(shè)計具有物理意義的多目標(biāo)成本函數(shù)，將軌道誤差、姿態(tài)偏差、能量消耗等關(guān)鍵指標(biāo)有機整合；最后，采用A3C框架對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練，通過優(yōu)勢函數(shù)量化控制效果，利用演員網(wǎng)絡(luò)生成控制策略，結(jié)合批評網(wǎng)絡(luò)評估策略價值，形成閉環(huán)優(yōu)化機制。

仿真實驗部分采用典型RV&D場景進行驗證，對比了傳統(tǒng)MPC、模型自由神經(jīng)網(wǎng)絡(luò)（MLP）以及NCMPC三種方法的性能表現(xiàn)。實驗數(shù)據(jù)顯示，NCMPC在以下方面具有明顯優(yōu)勢：1）控制精度提升約15%-20%，尤其在非合作目標(biāo)跟蹤時仍能保持高精度；2）系統(tǒng)響應(yīng)速度加快30%以上，動態(tài)過程收斂時間縮短；3）對初始條件的魯棒性顯著增強，在50%偏離初始軌道的情況下仍能穩(wěn)定跟蹤；4）控制輸入的平滑性提升，高頻振蕩現(xiàn)象減少約40%，這對降低推進器能耗和延長器件壽命具有重要意義。

該研究還特別設(shè)計了分層訓(xùn)練機制，將A3C算法分為離線預(yù)訓(xùn)練與在線微調(diào)兩個階段。預(yù)訓(xùn)練階段通過大量模擬數(shù)據(jù)學(xué)習(xí)基礎(chǔ)控制策略，在線階段則根據(jù)實時動力學(xué)模型更新權(quán)重參數(shù)，這種混合訓(xùn)練方式既保證了訓(xùn)練效率，又增強了算法的適應(yīng)性。實驗證明，這種架構(gòu)在任務(wù)中后期面對突發(fā)的軌道擾動時，仍能保持穩(wěn)定的控制性能。

在工程應(yīng)用層面，該算法展現(xiàn)出顯著的成本效益優(yōu)勢。以某型載人飛船對接任務(wù)為例，NCMPC方案相比傳統(tǒng)方法減少推進劑消耗約12%，控制周期縮短至0.8秒（原為1.5秒），同時滿足對接誤差≤2厘米、姿態(tài)角偏差≤0.5度的嚴(yán)苛指標(biāo)。特別值得關(guān)注的是，在非合作目標(biāo)突然改變軌道參數(shù)（如Δv突增）的極端情況下，NCMPC仍能保持系統(tǒng)穩(wěn)定，而傳統(tǒng)MPC需要依賴人工調(diào)整控制參數(shù)。

該研究對后續(xù)空間控制技術(shù)的發(fā)展具有重要啟示：1）建立統(tǒng)一的SE(3)動力學(xué)建�？蚣�，為多任務(wù)協(xié)同控制奠定基礎(chǔ)；2）開發(fā)輕量化神經(jīng)控制算法，以適應(yīng)航天器計算資源受限的特點；3）構(gòu)建數(shù)字孿生驗證平臺，實現(xiàn)控制算法的快速迭代與驗證。未來研究可進一步探索該框架在深空采樣返回、在軌服務(wù)維修等復(fù)雜任務(wù)中的應(yīng)用，同時優(yōu)化神經(jīng)網(wǎng)絡(luò)架構(gòu)以降低計算負載。

這項工作不僅為空間智能控制提供了新的理論方法，更在工程實踐中展現(xiàn)出顯著價值。通過將深度強化學(xué)習(xí)的在線學(xué)習(xí)能力與MPC的約束優(yōu)化優(yōu)勢相結(jié)合，有效解決了傳統(tǒng)方法在復(fù)雜動態(tài)環(huán)境下面臨的適應(yīng)性難題。特別是在處理非合作目標(biāo)、突發(fā)擾動等不可預(yù)測因素時，NCMPC展現(xiàn)出更強的環(huán)境適應(yīng)能力和容錯性能，為下一代自主空間探測任務(wù)奠定了關(guān)鍵技術(shù)基礎(chǔ)。

相關(guān)新聞

生物通微信公眾號

微信

新浪微博

我要投稿

搜索
國際
國內(nèi)
人物
產(chǎn)業(yè)
熱點
科普

知名企業(yè)招聘

熱點排行

新聞專題

版權(quán)所有生物通

聯(lián)系信箱：

粵ICP備09063491號