被動探測視場角約束下的深度強化學習制導方法
宇航學報
頁數(shù): 9 2024-08-30
摘要: 針對紅外制導導彈攔截機動目標的導引律設計問題,提出了一種純角度量測下考慮視場角約束的深度強化學習制導方法。首先,將攔截制導問題轉(zhuǎn)化為一個馬爾可夫決策過程,建立了基于雙延遲深度確定性策略梯度算法的深度強化學習制導模型,并充分考慮了導彈一階自動駕駛儀特性;其次,設計了一種滿足導引頭視場角約束,同時又能權(quán)衡能量消耗和制導精度的綜合獎勵函數(shù),并在典型場景下進行了深度強化學習制導律訓練。...