基于距離信息的追逃策略:信念狀態(tài)連續(xù)隨機(jī)博弈
自動(dòng)化學(xué)報(bào)
頁(yè)數(shù): 13 2024-04-15
摘要: 追逃問(wèn)題的研究在對(duì)抗、追蹤以及搜查等領(lǐng)域極具現(xiàn)實(shí)意義.借助連續(xù)隨機(jī)博弈與馬爾科夫決策過(guò)程(Markov decision process, MDP),研究使用測(cè)量距離求解多對(duì)一追逃問(wèn)題的最優(yōu)策略.在此追逃問(wèn)題中,追捕群體僅領(lǐng)導(dǎo)者可測(cè)量與逃逸者間的相對(duì)距離,而逃逸者具有全局視野.追逃策略求解被分為追博弈與馬爾科夫決策兩個(gè)過(guò)程.在求解追捕策略時(shí),通過(guò)分割環(huán)境引入信念區(qū)域狀態(tài)以估計(jì)逃...