摘要:隨著(zhù)無(wú)人移動(dòng)平臺的不斷發(fā)展,為其賦予高效的自主導航能力變得尤為重要;針對無(wú)人機自主導航常用的端到端強化學(xué)習方法存在訓練效率低、泛化能力和通用性差等問(wèn)題,引入了類(lèi)腦導航模型,基于長(cháng)短時(shí)記憶(LSTM)神經(jīng)網(wǎng)絡(luò )構建了類(lèi)腦細胞導航模型,通過(guò)整合編碼無(wú)人機智能體的自運動(dòng)信息,實(shí)現了網(wǎng)格細胞和頭朝向細胞的編碼,進(jìn)一步將這些信息作為深度強化學(xué)習算法D3QN的狀態(tài)補充表示;通過(guò)在A(yíng)irSim仿真環(huán)境的實(shí)驗表明,類(lèi)腦導航模型的引入能夠有效提高算法的訓練能力和無(wú)人機智能體的導航性能,相較于原D3QN算法,在環(huán)境目標改變的情況下仍能尋找到新的目標點(diǎn),有效提升了算法的泛化能力。