国产欧美精品一区二区,中文字幕专区在线亚洲,国产精品美女网站在线观看,艾秋果冻传媒2021精品,在线免费一区二区,久久久久久青草大香综合精品,日韩美aaa特级毛片,欧美成人精品午夜免费影视

基于內在動(dòng)機的強化學(xué)習算法在兩輪機器人中的研究
DOI:
CSTR:
作者:
作者單位:

(河北聯(lián)合大學(xué) 電氣工程學(xué)院,河北 唐山 063009)

作者簡(jiǎn)介:

任紅格(1979-),女,河北石家莊人,副教授,博士,主要從事人工智能方向的研究。 [FQ)]

通訊作者:

中圖分類(lèi)號:

基金項目:

國家自然科學(xué)基金(61203343);河北省自然基金(E2014209106)。


Reseach on Reinforcement Learning Algorithm Based on Intrinsic Motivation for Two-wheeled Robot
Author:
Affiliation:

(College of Electrical Engineering,Hebei United University,Tangshan 063009,China)

Fund Project:

  • 摘要
  • |
  • 圖/表
  • |
  • 訪(fǎng)問(wèn)統計
  • |
  • 參考文獻
  • |
  • 相似文獻
  • |
  • 引證文獻
  • |
  • 資源附件
  • |
  • 文章評論
    摘要:

    針對兩輪自平衡機器人在學(xué)習過(guò)程中遇到的主動(dòng)性差和以往強化學(xué)習對單步學(xué)習效率低的問(wèn)題,受心理學(xué)中內在動(dòng)機理論的啟發(fā),提出一種基于內在動(dòng)機的強化學(xué)習算法;該算法利用內在動(dòng)機信號作為內部獎勵,模擬人類(lèi)心理認知機理并與外部信號一起作用于整個(gè)學(xué)習過(guò)程,提高了智能體的自學(xué)習能力,同時(shí)采用自組織神經(jīng)網(wǎng)絡(luò )進(jìn)行訓練,保證了算法的快速性;通過(guò)無(wú)擾動(dòng)和有擾動(dòng)兩種仿真實(shí)驗的對比,驗證了基于內在動(dòng)機的強化學(xué)習算法能夠使兩輪機器人在未知環(huán)境下通過(guò)自主學(xué)習最終達到平衡,且體現了該算法的魯棒性和可行性。

    Abstract:

    Aiming at the two-wheeled self-balancing robot in the learning process encountered less-initiative and reinforcement learning to step low learning efficiency in the past, inspired by the intrinsic motivation theory from the psychology, this paper proposes a reinforcement learning algorithm based on intrinsic motivation. This algorithm uses the intrinsic motivation signal as the internal reward,then simulats human psychological mechanism, and applies to the whole learning process with the external signal. That can improve the learning ability. At the same time, by using self-organizing neural network for training, which ensures the rapidity of the system. The undisturbed and disturbed simulation experiment results prove that the reinforcement learning algorithm based on intrinsic motivation can solve the problem of autonomous learning of two-wheeled robot balance control in an unknown environment, and reflects the effectiveness and robustness of the system. 

    參考文獻
    相似文獻
    引證文獻
引用本文

任紅格,向迎帆,李福進(jìn),劉偉民.基于內在動(dòng)機的強化學(xué)習算法在兩輪機器人中的研究計算機測量與控制[J].,2015,23(9):3185-3187, 3191.

復制
分享
文章指標
  • 點(diǎn)擊次數:
  • 下載次數:
  • HTML閱讀次數:
  • 引用次數:
歷史
  • 收稿日期:2015-03-09
  • 最后修改日期:2015-04-15
  • 錄用日期:
  • 在線(xiàn)發(fā)布日期: 2015-10-08
  • 出版日期:
文章二維碼
冀州市| 仁布县| 巩义市| 张北县| 岳阳县| 象山县| 东乌| 濮阳县| 平塘县| 西昌市| 泉州市| 双辽市| 札达县| 三亚市| 陈巴尔虎旗| 吐鲁番市| 印江| 霍山县| 同心县| 普兰县| 沙坪坝区| 长沙县| 姚安县| 南汇区| 祁门县| 临城县| 藁城市| 江永县| 濉溪县| 夏津县| 老河口市| 昭通市| 兴义市| 和田县| 琼结县| 镇安县| 边坝县| 湖口县| 涟源市| 冀州市| 唐海县|