国产欧美精品一区二区,中文字幕专区在线亚洲,国产精品美女网站在线观看,艾秋果冻传媒2021精品,在线免费一区二区,久久久久久青草大香综合精品,日韩美aaa特级毛片,欧美成人精品午夜免费影视

基于強化學(xué)習的四旋翼無(wú)人機控制律設計
DOI:
CSTR:
作者:
作者單位:

西北工業(yè)大學(xué) 自動(dòng)化學(xué)院

作者簡(jiǎn)介:

通訊作者:

中圖分類(lèi)號:

基金項目:

航空科學(xué)基金資助( 201905053003);陜西省飛行控制與仿真技術(shù)重點(diǎn)實(shí)驗室資助


Design of Control Law for Quadrotor UAV Based on Reinforcement Learning
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 圖/表
  • |
  • 訪(fǎng)問(wèn)統計
  • |
  • 參考文獻
  • |
  • 相似文獻
  • |
  • 引證文獻
  • |
  • 資源附件
  • |
  • 文章評論
    摘要:

    目前四旋翼無(wú)人機大部分都采用經(jīng)典控制方法進(jìn)行控制律的設計,然而控制參數的選擇和對被控對象數學(xué)模型的依賴(lài)一直是經(jīng)典控制方法設計中需要克服的問(wèn)題;針對此問(wèn)題,采用了一種基于深度強化學(xué)習算法Deep Q Network的無(wú)人機控制律設計方法,以四旋翼姿態(tài)角和姿態(tài)角速率作為三層神經(jīng)網(wǎng)絡(luò )的輸入數據,最終輸出動(dòng)作值函數,再根據貪婪策略進(jìn)行動(dòng)作的選取,通過(guò)與環(huán)境的不斷交互,智能體根據獎懲信息來(lái)更新神經(jīng)網(wǎng)絡(luò )的權值,使得智能體朝著(zhù)獲得累積回報最大值的方向選取動(dòng)作;仿真結果表明在經(jīng)過(guò)強化學(xué)習訓練之后,四旋翼姿態(tài)角能夠快速準確地跟蹤上參考指令的變化,證明了基于強化學(xué)習的四旋翼無(wú)人機控制律的可行性,從而避免了傳統控制方法對控制參數的選擇與控制模型的依賴(lài)。

    Abstract:

    At present, most of the quadrotor UAVs use the classic control method to design the control law. However, the selection of control parameters and the dependence on the mathematical model of the controlled object have always been problems that need to be overcome in the design of the classic control method. Aiming at this problem, a design method of UAV control law based on deep reinforcement learning algorithm Deep Q Network is adopted. The quadrotor attitude angle and attitude angle rate are used as the input data of the three-layer neural network, and finally the action value function is output. Then, the action is selected according to the greedy strategy. Through continuous interaction with the environment, the agent updates the weight of the neural network according to the reward and punishment information, so that the agent selects the action in the direction of obtaining the maximum cumulative return. The simulation results show that after the reinforcement learning training, the quadrotor attitude angle can quickly and accurately track the change of the reference command, which proves the feasibility of the quadrotor UAV control law based on reinforcement learning, thus avoiding the dependence of traditional control methods on the selection of control parameters and control model.

    參考文獻
    相似文獻
    引證文獻
引用本文

梁晨,劉小雄,張興旺,黃劍雄.基于強化學(xué)習的四旋翼無(wú)人機控制律設計計算機測量與控制[J].,2021,29(2):71-75.

復制
分享
文章指標
  • 點(diǎn)擊次數:
  • 下載次數:
  • HTML閱讀次數:
  • 引用次數:
歷史
  • 收稿日期:2020-06-13
  • 最后修改日期:2020-07-08
  • 錄用日期:2020-07-08
  • 在線(xiàn)發(fā)布日期: 2021-02-08
  • 出版日期:
文章二維碼
安塞县| 金昌市| 大悟县| 民勤县| 蒙城县| 石河子市| 西峡县| 循化| 河曲县| 青龙| 瓮安县| 城口县| 固原市| 溆浦县| 兴宁市| 南投县| 马龙县| 安顺市| 左贡县| 依兰县| 赤水市| 廉江市| 保靖县| 泰顺县| 顺昌县| 澳门| 金坛市| 阿城市| 南溪县| 山西省| 揭东县| 石河子市| 邵武市| 兴义市| 清徐县| 抚顺县| 深水埗区| 西平县| 禄丰县| 临武县| 崇文区|