面向属性识别和组合检索的区域感知时尚对比学习

TP391.4; 服装属性识别已成为一项关键技术,使用户能够自动识别服装的特征,并搜索具有相似属性的服装图片.然而,现有方法无法识别新添加的属性,并且可能无法捕获区域级别视觉特征.为解决上述问题,该研究提出一种区域感知时尚对比语言图像预训练(region-aware fashion contrastive language-image pre-training,RaF-CLIP)模型.该模型将裁剪和分割的图像与类别和多个细粒度属性文本进行对齐,通过对比学习实现时尚区域与相应文本的匹配.服装检索基于用户指定的服装类别和属性来找到合适的服装,为进一步提高检索的准确性,该研究在RaF-CLIP模型上...

Full description

Saved in:
Bibliographic Details
Published in东华大学学报(英文版) Vol. 41; no. 4; pp. 405 - 415
Main Authors 王康平, 赵鸣博
Format Journal Article
LanguageChinese
Published 东华大学信息科学与技术学院,上海 201620 2024
Subjects
Online AccessGet full text

Cover

Loading…