Method apparatus system and computer program for high quality transformation model learning for document image and document recognition

The present invention relates to a method, an apparatus, a system and a computer program for training a high-quality conversion model for a document image and recognizing a document by using the same and, more specifically, to a method, an apparatus, a system and a computer program for training a hi...

Full description

Saved in:
Bibliographic Details
Main Authors JOE SEONGHO, KWON ILHWAN, GWON YOUNGJUNE, KIM JUDONG, SONG HYOSEOB, BAE CHANGHYEON, KWON KISANG
Format Patent
LanguageEnglish
Korean
Published 09.05.2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:The present invention relates to a method, an apparatus, a system and a computer program for training a high-quality conversion model for a document image and recognizing a document by using the same and, more specifically, to a method, an apparatus, a system and a computer program for training a high-quality conversion model for a document image and recognizing a document by using the same, capable of converting a document image into a high-quality image while suppressing the occurrence of an error during the conversion procedure and improving document recognition performance. In accordance with the present invention, the method includes: a step in which a computing device converts a given document image into a high-quality document image through a high-quality conversion module; a step in which the computing device determines whether error criteria according to predetermined criteria are satisfied based on character recognition data calculated through character recognition on the high-quality document image; a step in which the computing device corrects an error of the character recognition data and creates a corrected high-quality document image based thereon; and a step in which the computing device updates the high-quality conversion model by reflecting the corrected high-quality document image. 본 발명은 문서 이미지에 대한 고화질 변환 모델의 학습 및 이를 이용한 문서 인식 방법, 장치, 시스템 및 컴퓨터 프로그램에 관한 것으로서, 보다 구체적으로는 문서 이미지를 고화질로 변환하면서 변환 과정에서의 오류 발생을 억제하고 문서 인식 성능을 개선할 수 있는 고화질 변환 모델의 학습 및 이를 이용한 문서 인식 방법, 장치, 시스템 및 컴퓨터 프로그램에 관한 것이다. 본 발명에서는, 컴퓨팅 장치에서, 주어진 문서 이미지를 고화질 변환 모델을 사용하여 고화질 문서 이미지로 변환하는 단계; 상기 고화질 문서 이미지에 대한 문자 인식을 통해 산출된 문자 인식 데이터에 기초하여 미리 정해진 기준에 따른 오류 기준 충족 여부를 판단하는 단계; 상기 문자 인식 데이터의 오류를 수정하고 이를 기초로 보정된 고화질 문서 이미지를 생성하는 단계; 및 상기 보정된 고화질 문서 이미지를 반영하여 상기 고화질 변환 모델을 갱신하는 단계;를 포함하는 것을 특징으로 하는 문서 이미지에 대한 고화질 변환 모델 학습 방법을 개시한다.
Bibliography:Application Number: KR20210147338