结合感受野增强和全卷积网络的场景文字检测方法

自然场景图像质量易受光照及采集设备的影响,且其背景复杂,图像中文字颜色、尺度、排列方向多变,因此,自然场景文字检测具有很大的挑战性.本文提出一种基于全卷积网络的端对端文字检测器,集中精力在网络结构和损失函数的设计,通过设计感受野模块并引入Focalloss,GIoUloss进行像素点分类和文字包围框回归,从而获得更加稳定且准确的多方向文字检测器.实验结果表明本文方法与现有先进方法相比,无论是在多方向场景文字数据集还是水平场景文字数据集均取得了具有可比性的成绩....

Full description

Saved in:
Bibliographic Details
Published in自动化学报 Vol. 48; no. 3; pp. 797 - 807
Main Authors 李晓玉, 宋永红, 余涛
Format Journal Article
LanguageChinese
Published 西安交通大学软件学院 西安710049%西安交通大学人工智能学院 西安710049 01.03.2022
Subjects
Online AccessGet full text
ISSN0254-4156
DOI10.16383/j.aas.c190376

Cover

More Information
Summary:自然场景图像质量易受光照及采集设备的影响,且其背景复杂,图像中文字颜色、尺度、排列方向多变,因此,自然场景文字检测具有很大的挑战性.本文提出一种基于全卷积网络的端对端文字检测器,集中精力在网络结构和损失函数的设计,通过设计感受野模块并引入Focalloss,GIoUloss进行像素点分类和文字包围框回归,从而获得更加稳定且准确的多方向文字检测器.实验结果表明本文方法与现有先进方法相比,无论是在多方向场景文字数据集还是水平场景文字数据集均取得了具有可比性的成绩.
ISSN:0254-4156
DOI:10.16383/j.aas.c190376