<tt id="vwe5b"></tt>
      1. <tfoot id="vwe5b"><progress id="vwe5b"></progress></tfoot><abbr id="vwe5b"></abbr>

      2. 91人人妻,99偷拍,碰碰免费视频,亚洲中文字幕AV,丝袜a片,91纯肉动漫,中文无码日,伊人福利导航

        基于A3C的神經(jīng)成本模型預(yù)測控制在SE(3)空間中的應(yīng)用:用于自主航天器的交會與對接

        《Aerospace Science and Technology》:A3C-based Neural-Cost Model Predictive Control on SE(3) for Autonomous Spacecraft Rendezvous and Docking

        【字體: 時間:2026年02月28日 來源:Aerospace Science and Technology 5.8

        編輯推薦:

          本文提出基于A3C框架的神經(jīng)成本模型預(yù)測控制算法,結(jié)合SE(3)耦合動力學(xué)模型,實現(xiàn)航天器rendezvous與docking任務(wù)中的軌道-姿態(tài)跟蹤控制,動態(tài)調(diào)整MPC成本函數(shù)權(quán)重,提升控制精度與計算效率,仿真驗證其魯棒性和快速收斂特性。

          
        該研究針對深空探測任務(wù)中航天器接近與對接(RV&D)的復(fù)雜控制需求,提出了一種基于SE(3)耦合動力學(xué)模型與異步優(yōu)勢演員-批評者(A3C)訓(xùn)練框架的神經(jīng)成本模型預(yù)測控制(NCMPC)算法。該方法通過融合強化學(xué)習(xí)與模型預(yù)測控制技術(shù),實現(xiàn)了軌道-姿態(tài)聯(lián)合跟蹤控制的高效解決方案,在控制精度、收斂速度和系統(tǒng)魯棒性方面展現(xiàn)出顯著優(yōu)勢。

        在航天器接近與對接任務(wù)中,高精度位置與姿態(tài)控制是確保任務(wù)成功的關(guān)鍵。傳統(tǒng)控制方法存在兩大局限性:其一,采用分離式建模策略(如SICDM和DQ-CDM),導(dǎo)致耦合效應(yīng)未被充分考量,特別是在接近階段(<100米)非線性項(科里奧利力、離心力等)引起的誤差難以消除;其二,模型自由方法(如MLP)存在泛化能力不足、依賴人工經(jīng)驗等問題。針對上述缺陷,該研究創(chuàng)新性地構(gòu)建了基于SE(3)的耦合動力學(xué)模型框架,該模型采用方向余弦矩陣與位置向量統(tǒng)一表征六自由度運動,有效避免了奇異點問題,且在空間任務(wù)中展現(xiàn)出更好的擴展性。

        NCMPC算法的核心突破在于將神經(jīng)網(wǎng)絡(luò)的動態(tài)學(xué)習(xí)能力與MPC的優(yōu)化優(yōu)勢相結(jié)合。具體而言,通過異步優(yōu)勢演員-批評者算法對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,使系統(tǒng)能夠在線自適應(yīng)調(diào)整MPC成本函數(shù)的權(quán)重參數(shù)。這種設(shè)計使得控制算法既能保持傳統(tǒng)MPC對約束條件的顯式處理能力(如狀態(tài)限制、控制輸入飽和等),又能通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)動態(tài)權(quán)重配置,從而實現(xiàn)復(fù)雜非線性系統(tǒng)的精準(zhǔn)控制。

        算法實現(xiàn)包含三個關(guān)鍵環(huán)節(jié):首先,構(gòu)建SE(3)域內(nèi)的航天器相對動力學(xué)模型,該模型同時描述了目標(biāo)航天器與跟蹤航天器的軌道運動與姿態(tài)運動耦合關(guān)系;其次,設(shè)計具有物理意義的多目標(biāo)成本函數(shù),將軌道誤差、姿態(tài)偏差、能量消耗等關(guān)鍵指標(biāo)有機整合;最后,采用A3C框架對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,通過優(yōu)勢函數(shù)量化控制效果,利用演員網(wǎng)絡(luò)生成控制策略,結(jié)合批評網(wǎng)絡(luò)評估策略價值,形成閉環(huán)優(yōu)化機制。

        仿真實驗部分采用典型RV&D場景進行驗證,對比了傳統(tǒng)MPC、模型自由神經(jīng)網(wǎng)絡(luò)(MLP)以及NCMPC三種方法的性能表現(xiàn)。實驗數(shù)據(jù)顯示,NCMPC在以下方面具有明顯優(yōu)勢:1)控制精度提升約15%-20%,尤其在非合作目標(biāo)跟蹤時仍能保持高精度;2)系統(tǒng)響應(yīng)速度加快30%以上,動態(tài)過程收斂時間縮短;3)對初始條件的魯棒性顯著增強,在50%偏離初始軌道的情況下仍能穩(wěn)定跟蹤;4)控制輸入的平滑性提升,高頻振蕩現(xiàn)象減少約40%,這對降低推進器能耗和延長器件壽命具有重要意義。

        該研究還特別設(shè)計了分層訓(xùn)練機制,將A3C算法分為離線預(yù)訓(xùn)練與在線微調(diào)兩個階段。預(yù)訓(xùn)練階段通過大量模擬數(shù)據(jù)學(xué)習(xí)基礎(chǔ)控制策略,在線階段則根據(jù)實時動力學(xué)模型更新權(quán)重參數(shù),這種混合訓(xùn)練方式既保證了訓(xùn)練效率,又增強了算法的適應(yīng)性。實驗證明,這種架構(gòu)在任務(wù)中后期面對突發(fā)的軌道擾動時,仍能保持穩(wěn)定的控制性能。

        在工程應(yīng)用層面,該算法展現(xiàn)出顯著的成本效益優(yōu)勢。以某型載人飛船對接任務(wù)為例,NCMPC方案相比傳統(tǒng)方法減少推進劑消耗約12%,控制周期縮短至0.8秒(原為1.5秒),同時滿足對接誤差≤2厘米、姿態(tài)角偏差≤0.5度的嚴(yán)苛指標(biāo)。特別值得關(guān)注的是,在非合作目標(biāo)突然改變軌道參數(shù)(如Δv突增)的極端情況下,NCMPC仍能保持系統(tǒng)穩(wěn)定,而傳統(tǒng)MPC需要依賴人工調(diào)整控制參數(shù)。

        該研究對后續(xù)空間控制技術(shù)的發(fā)展具有重要啟示:1)建立統(tǒng)一的SE(3)動力學(xué)建?蚣,為多任務(wù)協(xié)同控制奠定基礎(chǔ);2)開發(fā)輕量化神經(jīng)控制算法,以適應(yīng)航天器計算資源受限的特點;3)構(gòu)建數(shù)字孿生驗證平臺,實現(xiàn)控制算法的快速迭代與驗證。未來研究可進一步探索該框架在深空采樣返回、在軌服務(wù)維修等復(fù)雜任務(wù)中的應(yīng)用,同時優(yōu)化神經(jīng)網(wǎng)絡(luò)架構(gòu)以降低計算負載。

        這項工作不僅為空間智能控制提供了新的理論方法,更在工程實踐中展現(xiàn)出顯著價值。通過將深度強化學(xué)習(xí)的在線學(xué)習(xí)能力與MPC的約束優(yōu)化優(yōu)勢相結(jié)合,有效解決了傳統(tǒng)方法在復(fù)雜動態(tài)環(huán)境下面臨的適應(yīng)性難題。特別是在處理非合作目標(biāo)、突發(fā)擾動等不可預(yù)測因素時,NCMPC展現(xiàn)出更強的環(huán)境適應(yīng)能力和容錯性能,為下一代自主空間探測任務(wù)奠定了關(guān)鍵技術(shù)基礎(chǔ)。
        相關(guān)新聞
        生物通微信公眾號
        微信
        新浪微博

        知名企業(yè)招聘

        熱點排行

          今日動態(tài) | 人才市場 | 新技術(shù)專欄 | 中國科學(xué)人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術(shù)快訊 | 免費試用

          版權(quán)所有 生物通

          Copyright© eBiotrade.com, All Rights Reserved

          聯(lián)系信箱:

          粵ICP備09063491號