3分支多层次Transformer特征交互的RGB-D显著性目标检测

TP389.1; RGB深度图像(RGB-D)显著性目标检测是计算机视觉领域的研究任务之一,很多模型在简单场景下取得了较好的检测效果,却无法有效地处理多目标、深度图质量低下及显著性目标色彩与背景相似等复杂场景.因此,本文提出一种3分支多层次Transformer特征交互的RGB-D显著性目标检测模型.首先,提出一个跨模态坐标注意力模块,该模块通过采用坐标注意力抑制RGB图像和深度图的噪声信息,从而提取出更为显著的特征信息用于后续解码.其次,通过特征融合模块将高层的3层特征图调整到相同的分辨率送入Transformer层,有效地获取远距离显著性目标之间的关联关系和整幅图像的全局信息.然后,提出一...

Full description

Saved in:
Bibliographic Details
Published in工程科学与技术 Vol. 55; no. 6; pp. 245 - 256
Main Authors 孟令兵, 袁梦雅, 时雪涵, 刘晴晴, 程菲, 黎玲利, 何术锋
Format Journal Article
LanguageChinese
Published 安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199%安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199 2023
安徽信息工程学院电气与电子工程学院,安徽芜湖 241199%安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199
杭州电子科技大学管理学院,浙江杭州 310018%黑龙江大学计算机科学与技术学院,黑龙江哈尔滨 150006%南京水利科学研究院生态环境研究所,江苏南京 210017
Subjects
Online AccessGet full text
ISSN2096-3246
DOI10.15961/j.jsuese.202200555

Cover

Abstract TP389.1; RGB深度图像(RGB-D)显著性目标检测是计算机视觉领域的研究任务之一,很多模型在简单场景下取得了较好的检测效果,却无法有效地处理多目标、深度图质量低下及显著性目标色彩与背景相似等复杂场景.因此,本文提出一种3分支多层次Transformer特征交互的RGB-D显著性目标检测模型.首先,提出一个跨模态坐标注意力模块,该模块通过采用坐标注意力抑制RGB图像和深度图的噪声信息,从而提取出更为显著的特征信息用于后续解码.其次,通过特征融合模块将高层的3层特征图调整到相同的分辨率送入Transformer层,有效地获取远距离显著性目标之间的关联关系和整幅图像的全局信息.然后,提出一个多层次特征交互模块,该模块有效地聚合多层次信息进行特征交互,从而能够更精准地定位显著性目标的位置,同时对显著性目标的边界进行细化.最后,设计一个密集扩张特征细化模块,利用密集扩张卷积获取丰富的多尺度特征,有效地应对显著性目标数量和尺寸变化.将模型在5个公开的基准数据集上与19种主流模型相比,实验结果表明:本文方法在多个测评指标上有较好的提升效果,提高了在特定复杂场景下的检测精度;从P-R(precision-recall)曲线、F-measure曲线和显著图也可以直观看出,本文方法取得了较好的检测结果,生成的显著图更完整、清晰,相比其他模型更加接近真值图.
AbstractList TP389.1; RGB深度图像(RGB-D)显著性目标检测是计算机视觉领域的研究任务之一,很多模型在简单场景下取得了较好的检测效果,却无法有效地处理多目标、深度图质量低下及显著性目标色彩与背景相似等复杂场景.因此,本文提出一种3分支多层次Transformer特征交互的RGB-D显著性目标检测模型.首先,提出一个跨模态坐标注意力模块,该模块通过采用坐标注意力抑制RGB图像和深度图的噪声信息,从而提取出更为显著的特征信息用于后续解码.其次,通过特征融合模块将高层的3层特征图调整到相同的分辨率送入Transformer层,有效地获取远距离显著性目标之间的关联关系和整幅图像的全局信息.然后,提出一个多层次特征交互模块,该模块有效地聚合多层次信息进行特征交互,从而能够更精准地定位显著性目标的位置,同时对显著性目标的边界进行细化.最后,设计一个密集扩张特征细化模块,利用密集扩张卷积获取丰富的多尺度特征,有效地应对显著性目标数量和尺寸变化.将模型在5个公开的基准数据集上与19种主流模型相比,实验结果表明:本文方法在多个测评指标上有较好的提升效果,提高了在特定复杂场景下的检测精度;从P-R(precision-recall)曲线、F-measure曲线和显著图也可以直观看出,本文方法取得了较好的检测结果,生成的显著图更完整、清晰,相比其他模型更加接近真值图.
Abstract_FL RGB depth map salient object detection(RGB-D SOD)is one of the research tasks in the field of computer vision.Existing models have achieved desired detection performance in simple scenes,but they cannot effectively handle complex scenes with multiple objects,low-qual-ity depth maps,and background-similar object colors.In order to solve the above problems,a RGB-D salient object detection model is proposed based on three-branch multi-level Transformer feature interaction in this paper.Firstly,a cross-modal coordinate attention module is proposed to suppress the noise information of RGB and depth maps by employing coordinate attention,benefiting to extract more significant feature informa-tion for subsequent decoding stage.Secondly,through the feature fusion module,the highest three-layer feature maps are resampled to the same resolution and fed into the Transformer layer,which can effectively obtain the correlations between distant objects and the global information of the entire image.Then,a multi-level feature interaction module is proposed to effectively aggregate multi-level information for feature interaction,thus enabling more accurate location of salient objects as well as refinement of the boundary of salient objects.Finally,we design a Dense Dilated Feature Refinement Module to obtain rich multi-scale features by using dense dilation convolution to effectively address the number and size vari-ations of objects.Experimental results on five public benchmark datasets with 19 models show that the proposed method achieves significant per-formance improvement over baselines on multiple evaluation metrics,which effectively improves the detection accuracy of salient objects in com-plex scenes.In addition,based on the P-R(precision-recall)curve and the F-measure curve,we can also intuitively observe that the proposed method achieves better detection results,with more complete and clearer saliency maps.
Author 孟令兵
时雪涵
黎玲利
何术锋
刘晴晴
程菲
袁梦雅
AuthorAffiliation 安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199%安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199;安徽信息工程学院电气与电子工程学院,安徽芜湖 241199%安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199;杭州电子科技大学管理学院,浙江杭州 310018%黑龙江大学计算机科学与技术学院,黑龙江哈尔滨 150006%南京水利科学研究院生态环境研究所,江苏南京 210017
AuthorAffiliation_xml – name: 安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199%安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199;安徽信息工程学院电气与电子工程学院,安徽芜湖 241199%安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199;杭州电子科技大学管理学院,浙江杭州 310018%黑龙江大学计算机科学与技术学院,黑龙江哈尔滨 150006%南京水利科学研究院生态环境研究所,江苏南京 210017
Author_FL HE Shufeng
LIU Qingqing
MENG Lingbing
CHENG Fei
YUAN Mengya
SHI Xuehan
LI Lingli
Author_FL_xml – sequence: 1
  fullname: MENG Lingbing
– sequence: 2
  fullname: YUAN Mengya
– sequence: 3
  fullname: SHI Xuehan
– sequence: 4
  fullname: LIU Qingqing
– sequence: 5
  fullname: CHENG Fei
– sequence: 6
  fullname: LI Lingli
– sequence: 7
  fullname: HE Shufeng
Author_xml – sequence: 1
  fullname: 孟令兵
– sequence: 2
  fullname: 袁梦雅
– sequence: 3
  fullname: 时雪涵
– sequence: 4
  fullname: 刘晴晴
– sequence: 5
  fullname: 程菲
– sequence: 6
  fullname: 黎玲利
– sequence: 7
  fullname: 何术锋
BookMark eNotj79Kw1AcRu9QwVr7BL6Cifff76YZtdUqFASpc7hJbopVE8ilmLGKWMVJEZS6KBZcRHFwsEOfprnxMQwo33C2c_iWUCVOYoXQCsE2AVeQtb7d1wOllU0xpRgDQAVVKXaFxSgXi6iu9YGPmeAMQEAVtVh-eWHuPvLJOP88M2_P3VTGOkrSY5UWV9_57HQ-ncynt8X4fK-9YbXMw-zn5t4MX4vHd_M0Mi9D83W9jBYieaRV_Z81tL-12W1uW53d9k5zvWNpgh2wHMpD7hIhCSOSNQgwCITEkvAwpIESimLgEaFBwEJXgFQOdkIox3nDaTg-q6HVP--JjCMZ97x-MkjjsujpIMwy3-sFh1l5nGGBKbBfnDFi6w
ClassificationCodes TP389.1
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2B.
4A8
92I
93N
PSX
TCJ
DOI 10.15961/j.jsuese.202200555
DatabaseName Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
DocumentTitle_FL RGB-D Salient Object Detection with Three-branch Multi-level Transformer Feature Interaction
EndPage 256
ExternalDocumentID scdxxb_gckx202306025
GrantInformation_xml – fundername: (黑龙江省自然科学基金优秀青年项目); (安徽省自然科学基金面上项目); (安徽信息工程学院高层次人才科研启动项目); (安徽省教育厅自然科学重点项目)
  funderid: (黑龙江省自然科学基金优秀青年项目); (安徽省自然科学基金面上项目); (安徽信息工程学院高层次人才科研启动项目); (安徽省教育厅自然科学重点项目)
GroupedDBID -0C
-SC
-S~
2B.
2RA
4A8
5VR
92I
92M
93N
9D9
9DC
AFUIB
ALMA_UNASSIGNED_HOLDINGS
CAJEC
CQIGP
GROUPED_DOAJ
PB1
PB9
PSX
Q--
R-C
RT3
T8S
TCJ
U1F
U5C
ID FETCH-LOGICAL-s1075-724d4916a131a381535c6a0a14dd2ce6e2054f12cc3d965ae707d5d5d448787b3
ISSN 2096-3246
IngestDate Thu May 29 03:53:57 EDT 2025
IsPeerReviewed true
IsScholarly true
Issue 6
Keywords 密集卷积
coordinate attention
Transformer
显著图
dilated convolution
saliency map
feature interaction
显著性目标检测
salient object detection
坐标注意力
特征交互
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-s1075-724d4916a131a381535c6a0a14dd2ce6e2054f12cc3d965ae707d5d5d448787b3
PageCount 12
ParticipantIDs wanfang_journals_scdxxb_gckx202306025
PublicationCentury 2000
PublicationDate 2023
PublicationDateYYYYMMDD 2023-01-01
PublicationDate_xml – year: 2023
  text: 2023
PublicationDecade 2020
PublicationTitle 工程科学与技术
PublicationTitle_FL Advanced Engineering Sciences
PublicationYear 2023
Publisher 安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199%安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199
安徽信息工程学院电气与电子工程学院,安徽芜湖 241199%安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199
杭州电子科技大学管理学院,浙江杭州 310018%黑龙江大学计算机科学与技术学院,黑龙江哈尔滨 150006%南京水利科学研究院生态环境研究所,江苏南京 210017
Publisher_xml – name: 安徽信息工程学院电气与电子工程学院,安徽芜湖 241199%安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199
– name: 杭州电子科技大学管理学院,浙江杭州 310018%黑龙江大学计算机科学与技术学院,黑龙江哈尔滨 150006%南京水利科学研究院生态环境研究所,江苏南京 210017
– name: 安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199%安徽信息工程学院计算机与软件工程学院,安徽芜湖 241199
SSID ssib036435565
ssib050593459
ssib041261190
ssib030194745
ssib051371919
ssj0003313526
ssib027967859
Score 2.3021173
Snippet TP389.1;...
SourceID wanfang
SourceType Aggregation Database
StartPage 245
Title 3分支多层次Transformer特征交互的RGB-D显著性目标检测
URI https://d.wanfangdata.com.cn/periodical/scdxxb-gckx202306025
Volume 55
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMw3V29axRBFF_i2diIouI3KZxKVm9m57Ocze0ZBC0kgXRhb3YvonABL4GQKor4gZUiKLFRDGghioWFKfLX5Pb8M3xvdu9uY1JESzlYHjNv37yPY-b3hp03QXAFUoZUOdUN827XhdykNOxkwoTNnMkMAITjKR5wvnVbzs7zmwtiYarxufbV0upK55pbP_Bcyb9EFdogrnhK9i8iOxYKDUBDfOEJEYbnoWIckUQQrYmWJJHEcGLb2GI5MRaJmBLNsMvOEEvnRhgVopQoog2JjedKAE6ShJPY4qslYRjygBjN79yIw5YfQCNvoomhxChs0U1ilWeMiU38SE2ifZeNsBeIGFSM6xjYj6mIFfiiBe1jTygUi9q3iJVeC-jyMrWtRBkwY_wlcsVr2p439qrDUCBbTFg0scxbJ5FAuQZ11TUWibbEox5rvc5yjxTvZLAeecFrfEzU90zKA83-_-1VS9DDpXvjltexDUHw9tAqUH96YWy8QfGgMOqf-LcUEqXTwQsQoImDNMq3IzegJYeQzGYOUlKjr0E-ugA45VVAXhReYOJ_M2myADJIr0MA_LK-WpdFnatZac_SW5YlrVAcK8vV7wMIwsgSIdzDuy2xTi7DfdVK6t7K632Xra11Fpfc_TXmU3XID44ER5lSVNQ2b2DlYsoA6JskBrBqGl67RyIC3C_E5HsCTpkEW8crpcCLNWtVnQSNFDVVoUXElFFE8SILvClz5JSqhBoadH2_Of4MYq-b9pZqcHnuRHC8ynOnbTlpnQym1u-eClrR4NmT4vW3wdbm4Puj4suH2pQ0fP5zsPNwd3trd_vVcPOxn3SKtzu_Xr4pNj4N330t3j8tPm4UP16cDubbydzMbFhd4xL2KSQkoWI845CFpjSiKSQIIhJOps2U8ixjLpc5g7SxS5lzUWakSHPVVJmAH-ca4EQnOhM0esu9_GwwzR3gOtfVGY00TyVeGwTpqHCQ9WZUO34uIJXVi9U03V88KIrnD8l3ITiGdLnlejForDxYzS9BErLSuezj_xs9ONnn
linkProvider Directory of Open Access Journals
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=3%E5%88%86%E6%94%AF%E5%A4%9A%E5%B1%82%E6%AC%A1Transformer%E7%89%B9%E5%BE%81%E4%BA%A4%E4%BA%92%E7%9A%84RGB-D%E6%98%BE%E8%91%97%E6%80%A7%E7%9B%AE%E6%A0%87%E6%A3%80%E6%B5%8B&rft.jtitle=%E5%B7%A5%E7%A8%8B%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8A%80%E6%9C%AF&rft.au=%E5%AD%9F%E4%BB%A4%E5%85%B5&rft.au=%E8%A2%81%E6%A2%A6%E9%9B%85&rft.au=%E6%97%B6%E9%9B%AA%E6%B6%B5&rft.au=%E5%88%98%E6%99%B4%E6%99%B4&rft.date=2023&rft.pub=%E5%AE%89%E5%BE%BD%E4%BF%A1%E6%81%AF%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2%E8%AE%A1%E7%AE%97%E6%9C%BA%E4%B8%8E%E8%BD%AF%E4%BB%B6%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2%2C%E5%AE%89%E5%BE%BD%E8%8A%9C%E6%B9%96+241199%25%E5%AE%89%E5%BE%BD%E4%BF%A1%E6%81%AF%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2%E8%AE%A1%E7%AE%97%E6%9C%BA%E4%B8%8E%E8%BD%AF%E4%BB%B6%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2%2C%E5%AE%89%E5%BE%BD%E8%8A%9C%E6%B9%96+241199&rft.issn=2096-3246&rft.volume=55&rft.issue=6&rft.spage=245&rft.epage=256&rft_id=info:doi/10.15961%2Fj.jsuese.202200555&rft.externalDocID=scdxxb_gckx202306025
thumbnail_s http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fscdxxb-gckx%2Fscdxxb-gckx.jpg