基于粘连符号分割和多特征融合的手写公式识别

TP391; 为了解决字符粘连影响脱机手写数学公式自动识别的问题,提出一种基于字符轮廓特征的单点粘连符号切分方法.首先利用字符上下两侧轮廓方向码信息得到切分点和切分方向;然后结合宽度、高度、角点个数、投影轮廓等几何特性对切分后的字符片段实现多特征融合的特殊符号识别,并将特殊符号从整体数学公式中进行有效分离;最后结合特殊符号与周围字符的上下左右、重叠、半包围等空间位置关系特性实现结构的解析,并将经过卷积神经网络识别后的普通字符代入结构解析序列,实现公式的整体识别.实验结果表明:该方法能有效处理数学公式中粘连情况及特殊符号识别;粘连符号的切分准确率达到87.25%,提高了手写数学公式的整体识别率....

Full description

Saved in:
Bibliographic Details
Published in北京工业大学学报 Vol. 47; no. 8; pp. 842 - 853
Main Authors 付鹏斌, 李建君, 杨惠荣
Format Journal Article
LanguageChinese
Published 北京工业大学信息学部, 北京 100124 01.08.2021
Subjects
Online AccessGet full text
ISSN0254-0037
DOI10.11936/bjutxb2020120030

Cover

More Information
Summary:TP391; 为了解决字符粘连影响脱机手写数学公式自动识别的问题,提出一种基于字符轮廓特征的单点粘连符号切分方法.首先利用字符上下两侧轮廓方向码信息得到切分点和切分方向;然后结合宽度、高度、角点个数、投影轮廓等几何特性对切分后的字符片段实现多特征融合的特殊符号识别,并将特殊符号从整体数学公式中进行有效分离;最后结合特殊符号与周围字符的上下左右、重叠、半包围等空间位置关系特性实现结构的解析,并将经过卷积神经网络识别后的普通字符代入结构解析序列,实现公式的整体识别.实验结果表明:该方法能有效处理数学公式中粘连情况及特殊符号识别;粘连符号的切分准确率达到87.25%,提高了手写数学公式的整体识别率.
ISSN:0254-0037
DOI:10.11936/bjutxb2020120030