基于最优传输特征聚合的温室视觉位置识别方法
S24%TP183; 为实现温室场景中基于视觉的位置识别,解决现有视觉位置识别模型局部特征聚合范式对训练样本归纳偏置的强依赖,以及聚合过程中存在的冗余信息问题,构建了一种基于最优传输局部特征聚合的温室视觉位置识别方法.将温室场景图像局部特征聚合过程视为最优传输问题,根据局部特征集动态生成分配矩阵,解耦模型对归纳偏置的强依赖,同时在分配中引入"垃圾"簇来解决特征冗余.结合卷积神经网络(convolution neural network,CNN)和Transformer的优势,优化设计温室场景图像局部特征提取网络.试验结果表明,在种植作物为番茄的温室场景中,所提方法的位置识别...
Saved in:
Published in | 农业工程学报 Vol. 40; no. 22; pp. 161 - 172 |
---|---|
Main Authors | , , , , |
Format | Journal Article |
Language | Chinese |
Published |
沈阳农业大学信息与电气工程学院,沈阳 110866
01.11.2024
|
Subjects | |
Online Access | Get full text |
ISSN | 1002-6819 |
DOI | 10.11975/j.issn.1002-6819.202407155 |
Cover
Summary: | S24%TP183; 为实现温室场景中基于视觉的位置识别,解决现有视觉位置识别模型局部特征聚合范式对训练样本归纳偏置的强依赖,以及聚合过程中存在的冗余信息问题,构建了一种基于最优传输局部特征聚合的温室视觉位置识别方法.将温室场景图像局部特征聚合过程视为最优传输问题,根据局部特征集动态生成分配矩阵,解耦模型对归纳偏置的强依赖,同时在分配中引入"垃圾"簇来解决特征冗余.结合卷积神经网络(convolution neural network,CNN)和Transformer的优势,优化设计温室场景图像局部特征提取网络.试验结果表明,在种植作物为番茄的温室场景中,所提方法的位置识别 top-1 召回率(R@1)为 88.96%,与 NetVLAD、MixVPR 和 EigenPlaces 3 种方法相比,R@1 分别提高 29.67、2.97和2.89个百分点.与NetVLAD和MixVPR的聚合器相比,基于最优传输局部特征聚合的R@1分别提高21.65和1.09个百分点.相较于CNN网络,研究构建的温室场景图像局部特征提取网络在R@1指标上提升了 5.45个百分点.所提方法的实际温室场景位置识别率不低于81.94%,具有一定的实际应用能力.基于最优传输局部特征聚合及全局描述符生成方法对位置识别是有效的,场景图像局部特征提取网络能够提高位置识别性能,研究结果可为温室智能农机装备视觉系统设计提供技术参考. |
---|---|
ISSN: | 1002-6819 |
DOI: | 10.11975/j.issn.1002-6819.202407155 |