基于Policy Gradient的机械臂运动跟踪控制器参数整定

O231.2; 针对机械臂运动跟踪控制器的参数自整定问题,设计了一种基于强化学习Policy Gradient法的参数整定器.首先,介绍了机械臂的一种混合动力学模型,根据该系统模型进行了比例-微分(proportional-derivative,PD)控制器设计和李雅普诺夫稳定性证明,并由此给出了参数矩阵的范围.其次,设计了基于Policy Gradient的参数整定器,通过引入积分器的方法对其进行改进,使其控制下的参数行为连续化以进一步提高PD控制器的控制效果.最后,以二阶机械臂系统为例进行了仿真验证.实验数据证明了该参数整定器的有效性和可行性,并能有效提升系统的动态性能....

Full description

Saved in:
Bibliographic Details
Published in系统工程与电子技术 Vol. 43; no. 9; pp. 2605 - 2611
Main Authors 韩霖骁, 胡剑波, 宋仕元, 王应洋, 贺子厚, 张鹏
Format Journal Article
LanguageChinese
Published 空军工程大学装备管理与无人机工程学院,陕西西安710051 01.09.2021
Subjects
Online AccessGet full text
ISSN1001-506X
DOI10.12305/j.issn.1001-506X.2021.09.29

Cover

Abstract O231.2; 针对机械臂运动跟踪控制器的参数自整定问题,设计了一种基于强化学习Policy Gradient法的参数整定器.首先,介绍了机械臂的一种混合动力学模型,根据该系统模型进行了比例-微分(proportional-derivative,PD)控制器设计和李雅普诺夫稳定性证明,并由此给出了参数矩阵的范围.其次,设计了基于Policy Gradient的参数整定器,通过引入积分器的方法对其进行改进,使其控制下的参数行为连续化以进一步提高PD控制器的控制效果.最后,以二阶机械臂系统为例进行了仿真验证.实验数据证明了该参数整定器的有效性和可行性,并能有效提升系统的动态性能.
AbstractList O231.2; 针对机械臂运动跟踪控制器的参数自整定问题,设计了一种基于强化学习Policy Gradient法的参数整定器.首先,介绍了机械臂的一种混合动力学模型,根据该系统模型进行了比例-微分(proportional-derivative,PD)控制器设计和李雅普诺夫稳定性证明,并由此给出了参数矩阵的范围.其次,设计了基于Policy Gradient的参数整定器,通过引入积分器的方法对其进行改进,使其控制下的参数行为连续化以进一步提高PD控制器的控制效果.最后,以二阶机械臂系统为例进行了仿真验证.实验数据证明了该参数整定器的有效性和可行性,并能有效提升系统的动态性能.
Author 宋仕元
韩霖骁
贺子厚
张鹏
胡剑波
王应洋
AuthorAffiliation 空军工程大学装备管理与无人机工程学院,陕西西安710051
AuthorAffiliation_xml – name: 空军工程大学装备管理与无人机工程学院,陕西西安710051
Author_FL SONG Shiyuan
HAN Linxiao
HU Jianbo
WANG Yingyang
ZHANG Peng
HE Zihou
Author_FL_xml – sequence: 1
  fullname: HAN Linxiao
– sequence: 2
  fullname: HU Jianbo
– sequence: 3
  fullname: SONG Shiyuan
– sequence: 4
  fullname: WANG Yingyang
– sequence: 5
  fullname: HE Zihou
– sequence: 6
  fullname: ZHANG Peng
Author_xml – sequence: 1
  fullname: 韩霖骁
– sequence: 2
  fullname: 胡剑波
– sequence: 3
  fullname: 宋仕元
– sequence: 4
  fullname: 王应洋
– sequence: 5
  fullname: 贺子厚
– sequence: 6
  fullname: 张鹏
BookMark eNo9jzFLw0AYhm-oYK39Dw5OQuJ3d7lebtSiVSjooOBWLsmlJJQL9CpaxyJYHKpLB4tQcLE4SAdRyeKfMTE_w4ri9MA7PC_PCirpRCuE1jHYmFBgm7EdGaNtDIAtBrUTmwDBNgibiBIq_8_LqGpM5AHDlDPgThltZ9P0Mx0dJp3I7681ujKIlO59TS7z-zR_mBdXg-LjNrueFW_T4v0pHz1mw9fsbpbdDPLxPB-_ZM-TVbQUyo5R1T9W0PHuzlF9z2oeNPbrW03LYGBgcc_B2KMCBHeZ73Pl-NTjrscEhUUECQn3JZGcuC5xVc1V1FMO46FDAyy4orSCNn69Z1KHUrdbcXLa1YvH1nmv7feDi9j8VIMACvQbEmNjjQ
ClassificationCodes O231.2
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2B.
4A8
92I
93N
PSX
TCJ
DOI 10.12305/j.issn.1001-506X.2021.09.29
DatabaseName Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
Discipline Engineering
DocumentTitle_FL Parameter tuning of manipulator motion tracking controller based on Policy Gradient
EndPage 2611
ExternalDocumentID xtgcydzjs202109030
GrantInformation_xml – fundername: 工业控制技术国家重点实验室开放课题
  funderid: (ICT20063)
GroupedDBID -0Y
2B.
4A8
5XA
5XJ
92E
92I
93N
ABJNI
ACGFS
ALMA_UNASSIGNED_HOLDINGS
CCEZO
CUBFJ
CW9
PSX
TCJ
TGP
U1G
U5S
ID FETCH-LOGICAL-s1050-7b411b3909785cc7e4c3b78b59301232f27ca2a728828e68e3be457f43d197e33
ISSN 1001-506X
IngestDate Thu May 29 04:00:30 EDT 2025
IsPeerReviewed false
IsScholarly true
Issue 9
Keywords 机械臂;运动跟踪;Policy Gradient;参数整定;比例-微分控制
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-s1050-7b411b3909785cc7e4c3b78b59301232f27ca2a728828e68e3be457f43d197e33
PageCount 7
ParticipantIDs wanfang_journals_xtgcydzjs202109030
PublicationCentury 2000
PublicationDate 2021-09-01
PublicationDateYYYYMMDD 2021-09-01
PublicationDate_xml – month: 09
  year: 2021
  text: 2021-09-01
  day: 01
PublicationDecade 2020
PublicationTitle 系统工程与电子技术
PublicationTitle_FL Systems Engineering and Electronics
PublicationYear 2021
Publisher 空军工程大学装备管理与无人机工程学院,陕西西安710051
Publisher_xml – name: 空军工程大学装备管理与无人机工程学院,陕西西安710051
SSID ssib051375074
ssib002263377
ssib001102898
ssib057620160
ssib023168126
ssib023646287
ssj0042237
Score 2.3050249
Snippet O231.2; 针对机械臂运动跟踪控制器的参数自整定问题,设计了一种基于强化学习Policy...
SourceID wanfang
SourceType Aggregation Database
StartPage 2605
Title 基于Policy Gradient的机械臂运动跟踪控制器参数整定
URI https://d.wanfangdata.com.cn/periodical/xtgcydzjs202109030
Volume 43
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR1Na9RANNQWRA_iJ35TsHOS1GQmk5k5TtqsRdSLLfRWNrtJxcMK7Ra0xyIoHqqXHixCwYvFg_QgKr34Z9x17_4B33uZ3URcpApLeMy8fZ_JzHvDzBvPm-FFJkQeCx8m_8yPtGn6mhfSb-aQAhWFKbKMNsjejxeWojvLcnni2M_arqWNbjbb2hx7ruR_vApt4Fc8JfsPnh0RhQaAwb_wBA_D80g-ZqlkpsESy9IInzoty_zevL1GO7m6LFXMQHvE0piZOcKMmeUsCViqmVZMcwSSBjMBUtOWWU0tCikjoJmlf-mUWUU40BgTa0PI0NIgOsBCEuUSiLDLpiBAPQJGkRLBkoSAhLhIZGcltgBBnZA6Gjmi_ABLIjVPQsYopA6cRna0M5mlBolZQ8AcMzECILsOKxQgKpgNSWjACpEKSGN5hUIyOxkSVARx4ScqFIWiIYpEixqyLqirk_oaCg9Hm8TKt57UM-QDIAfSJ-M0B_aRMzQobGOU2QqUoOwCnyFySlootAiQquwFZKE3cC9E6W_n-LG8ShaGfMnhe3Mwqq0ROWnUgNI0Bks1ufq95XSGG-ZkQHdFjua7siyW-65NffKKA1kLhCC3DsdOspC1SpplkcfsiMcsWhaLBrslrN_LmD_prraetjcfrSMWLg4Gx7wprhTurZiy8_fuPqiieAx6a6sAkCEIUR2X5njXWlhlDXgFQsyrLEOGAsLgKquBjJpjHcVhgBZBREx3Lg0FP-7NDNW69Rel6Fhfp2h2VmsR6OJp75RLHadtOQ6c8SY2H571TtYKip7zkt7e4ffD7XIUmB6OAj92n_XfHvbfHQyebw2-ve693B982Rt8_dDfft978bn3Zr_3aqu_c9Df-dT7uHveW2qki3MLvrslxV-H3CjwVRaFYSYMHsiSrZbKo5bIlM6kEZQvFVy1mrypOOTSOo91LrI8kqqIRDs0KhfigjfZedzJL3rTGZgV0keI2IMi4m2dQfbYBDrtKGibmOeXvBvOAituFFxf-dOvl4-EdcU7UX2JV73J7tpGfg3i-2523b0PvwBju7hC
linkProvider EBSCOhost
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8EPolicy+Gradient%E7%9A%84%E6%9C%BA%E6%A2%B0%E8%87%82%E8%BF%90%E5%8A%A8%E8%B7%9F%E8%B8%AA%E6%8E%A7%E5%88%B6%E5%99%A8%E5%8F%82%E6%95%B0%E6%95%B4%E5%AE%9A&rft.jtitle=%E7%B3%BB%E7%BB%9F%E5%B7%A5%E7%A8%8B%E4%B8%8E%E7%94%B5%E5%AD%90%E6%8A%80%E6%9C%AF&rft.au=%E9%9F%A9%E9%9C%96%E9%AA%81&rft.au=%E8%83%A1%E5%89%91%E6%B3%A2&rft.au=%E5%AE%8B%E4%BB%95%E5%85%83&rft.au=%E7%8E%8B%E5%BA%94%E6%B4%8B&rft.date=2021-09-01&rft.pub=%E7%A9%BA%E5%86%9B%E5%B7%A5%E7%A8%8B%E5%A4%A7%E5%AD%A6%E8%A3%85%E5%A4%87%E7%AE%A1%E7%90%86%E4%B8%8E%E6%97%A0%E4%BA%BA%E6%9C%BA%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2%2C%E9%99%95%E8%A5%BF%E8%A5%BF%E5%AE%89710051&rft.issn=1001-506X&rft.volume=43&rft.issue=9&rft.spage=2605&rft.epage=2611&rft_id=info:doi/10.12305%2Fj.issn.1001-506X.2021.09.29&rft.externalDocID=xtgcydzjs202109030
thumbnail_s http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fxtgcydzjs%2Fxtgcydzjs.jpg