Towards Safe Control of Continuum Manipulator Using Shielded Multiagent Reinforcement Learning

Continuum robotic manipulators are increasingly adopted in minimal invasive surgery. However, their nonlinear behavior is challenging to model accurately, especially when subject to external interaction, potentially leading to poor control performance. In this letter, we investigate the feasibility...

Full description

Saved in:

Bibliographic Details
Main Authors	Ji, Guanglin, Yan, Junyan, Du, Jingxin, Yan, Wanquan, Chen, Jibiao, Lu, Yongkang, Rojas, Juan, Cheng, Shing Shin
Format	Journal Article
Language	English
Published	15.06.2021
Subjects	Computer Science - Artificial Intelligence Computer Science - Multiagent Systems Computer Science - Robotics
Online Access	Get full text
DOI	10.48550/arxiv.2106.07892

Cover

Abstract	Continuum robotic manipulators are increasingly adopted in minimal invasive surgery. However, their nonlinear behavior is challenging to model accurately, especially when subject to external interaction, potentially leading to poor control performance. In this letter, we investigate the feasibility of adopting a model-free multiagent reinforcement learning (RL), namely multiagent deep Q network (MADQN), to control a 2-degree of freedom (DoF) cable-driven continuum surgical manipulator. The control of the robot is formulated as a one-DoF, one agent problem in the MADQN framework to improve the learning efficiency. Combined with a shielding scheme that enables dynamic variation of the action set boundary, MADQN leads to efficient and importantly safer control of the robot. Shielded MADQN enabled the robot to perform point and trajectory tracking with submillimeter root mean square errors under external loads, soft obstacles, and rigid collision, which are common interaction scenarios encountered by surgical manipulators. The controller was further proven to be effective in a miniature continuum robot with high structural nonlinearitiy, achieving trajectory tracking with submillimeter accuracy under external payload.
AbstractList	Continuum robotic manipulators are increasingly adopted in minimal invasive surgery. However, their nonlinear behavior is challenging to model accurately, especially when subject to external interaction, potentially leading to poor control performance. In this letter, we investigate the feasibility of adopting a model-free multiagent reinforcement learning (RL), namely multiagent deep Q network (MADQN), to control a 2-degree of freedom (DoF) cable-driven continuum surgical manipulator. The control of the robot is formulated as a one-DoF, one agent problem in the MADQN framework to improve the learning efficiency. Combined with a shielding scheme that enables dynamic variation of the action set boundary, MADQN leads to efficient and importantly safer control of the robot. Shielded MADQN enabled the robot to perform point and trajectory tracking with submillimeter root mean square errors under external loads, soft obstacles, and rigid collision, which are common interaction scenarios encountered by surgical manipulators. The controller was further proven to be effective in a miniature continuum robot with high structural nonlinearitiy, achieving trajectory tracking with submillimeter accuracy under external payload.
Author	Du, Jingxin Rojas, Juan Yan, Wanquan Lu, Yongkang Cheng, Shing Shin Yan, Junyan Chen, Jibiao Ji, Guanglin
Author_xml	– sequence: 1 givenname: Guanglin surname: Ji fullname: Ji, Guanglin – sequence: 2 givenname: Junyan surname: Yan fullname: Yan, Junyan – sequence: 3 givenname: Jingxin surname: Du fullname: Du, Jingxin – sequence: 4 givenname: Wanquan surname: Yan fullname: Yan, Wanquan – sequence: 5 givenname: Jibiao surname: Chen fullname: Chen, Jibiao – sequence: 6 givenname: Yongkang surname: Lu fullname: Lu, Yongkang – sequence: 7 givenname: Juan surname: Rojas fullname: Rojas, Juan – sequence: 8 givenname: Shing Shin surname: Cheng fullname: Cheng, Shing Shin
BackLink	https://doi.org/10.48550/arXiv.2106.07892$$DView paper in arXiv
BookMark	eNqFjr0OgjAURjvo4N8DONkXEAFFcSYaB10EV8mN3GKTcktK68_bK8Td6TtfcoYzZD3ShIxNA99bxVHkL8C85MMLA3_t-Zt4Gw7YNdNPMEXDUxDIE03WaMW16FCScxU_AcnaKbDa8EsjqeTpXaIqsOAnp6yEEsnyM0oS2tywat8RwdBXHbO-ANXg5LcjNtvvsuQw70ry2sgKzDtvi_KuaPnf-ACCw0Qj
ContentType	Journal Article
Copyright	http://creativecommons.org/licenses/by-nc-nd/4.0
Copyright_xml	– notice: http://creativecommons.org/licenses/by-nc-nd/4.0
DBID	AKY GOX
DOI	10.48550/arxiv.2106.07892
DatabaseName	arXiv Computer Science arXiv.org
DatabaseTitleList
Database_xml	– sequence: 1 dbid: GOX name: arXiv.org url: http://arxiv.org/find sourceTypes: Open Access Repository
DeliveryMethod	fulltext_linktorsrc
ExternalDocumentID	2106_07892
GroupedDBID	AKY GOX
ID	FETCH-arxiv_primary_2106_078923
IEDL.DBID	GOX
IngestDate	Tue Jul 22 23:18:35 EDT 2025
IsDoiOpenAccess	true
IsOpenAccess	true
IsPeerReviewed	false
IsScholarly	false
Language	English
LinkModel	DirectLink
MergedId	FETCHMERGED-arxiv_primary_2106_078923
OpenAccessLink	https://arxiv.org/abs/2106.07892
ParticipantIDs	arxiv_primary_2106_07892
PublicationCentury	2000
PublicationDate	2021-06-15
PublicationDateYYYYMMDD	2021-06-15
PublicationDate_xml	– month: 06 year: 2021 text: 2021-06-15 day: 15
PublicationDecade	2020
PublicationYear	2021
Score	3.5260828
SecondaryResourceType	preprint
Snippet	Continuum robotic manipulators are increasingly adopted in minimal invasive surgery. However, their nonlinear behavior is challenging to model accurately,...
SourceID	arxiv
SourceType	Open Access Repository
SubjectTerms	Computer Science - Artificial Intelligence Computer Science - Multiagent Systems Computer Science - Robotics
Title	Towards Safe Control of Continuum Manipulator Using Shielded Multiagent Reinforcement Learning
URI	https://arxiv.org/abs/2106.07892
hasFullText	1
inHoldings	1
isFullTextHit
isPrint
link	http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwdV1RS8MwED7mnnwRh8rUTe_B16JN05o9ynAOYQo6oU-WpEmkoJ10q_jzTS4VfdlbSI5wJJC7y933HcCFueLKWWkZZXxSRjxzPpxyUUaUqiTOrLNpJvZ458VDNn_h93ma9wB_sTCy-a6-Aj-wWl-6eMRza4qJe2R3GPPB1d1jHpKTRMXVyf_JOR-Tpv4Zidk-7HXeHd6E6xhAz9QH8Lqk0tQ1PktrcBpqw3FlaVjVbfuBC1lX1Ehr1SAl8dH3qH7XRiMhZKUHQOGTIZrTkn70sGNGfTuE89ntcjqPSKPiM9BHFF7ZgpRNjqDvgnwzBBScG25tIth1zGOhhZAs1YnlTJdSKX0Mw227nGxfOoVd5mswfK-ddAT9TdOasTOiG3VGJ_kDOIV3mQ
linkProvider	Cornell University
openUrl	ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=Towards+Safe+Control+of+Continuum+Manipulator+Using+Shielded+Multiagent+Reinforcement+Learning&rft.au=Ji%2C+Guanglin&rft.au=Yan%2C+Junyan&rft.au=Du%2C+Jingxin&rft.au=Yan%2C+Wanquan&rft.date=2021-06-15&rft_id=info:doi/10.48550%2Farxiv.2106.07892&rft.externalDocID=2106_07892