Method apparatus system and computer program for high quality transformation model learning for document image and document recognition
The present invention relates to a method, an apparatus, a system and a computer program for training a high-quality conversion model for a document image and recognizing a document by using the same and, more specifically, to a method, an apparatus, a system and a computer program for training a hi...
Saved in:
Main Authors | , , , , , , |
---|---|
Format | Patent |
Language | English Korean |
Published |
09.05.2023
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | The present invention relates to a method, an apparatus, a system and a computer program for training a high-quality conversion model for a document image and recognizing a document by using the same and, more specifically, to a method, an apparatus, a system and a computer program for training a high-quality conversion model for a document image and recognizing a document by using the same, capable of converting a document image into a high-quality image while suppressing the occurrence of an error during the conversion procedure and improving document recognition performance. In accordance with the present invention, the method includes: a step in which a computing device converts a given document image into a high-quality document image through a high-quality conversion module; a step in which the computing device determines whether error criteria according to predetermined criteria are satisfied based on character recognition data calculated through character recognition on the high-quality document image; a step in which the computing device corrects an error of the character recognition data and creates a corrected high-quality document image based thereon; and a step in which the computing device updates the high-quality conversion model by reflecting the corrected high-quality document image.
본 발명은 문서 이미지에 대한 고화질 변환 모델의 학습 및 이를 이용한 문서 인식 방법, 장치, 시스템 및 컴퓨터 프로그램에 관한 것으로서, 보다 구체적으로는 문서 이미지를 고화질로 변환하면서 변환 과정에서의 오류 발생을 억제하고 문서 인식 성능을 개선할 수 있는 고화질 변환 모델의 학습 및 이를 이용한 문서 인식 방법, 장치, 시스템 및 컴퓨터 프로그램에 관한 것이다. 본 발명에서는, 컴퓨팅 장치에서, 주어진 문서 이미지를 고화질 변환 모델을 사용하여 고화질 문서 이미지로 변환하는 단계; 상기 고화질 문서 이미지에 대한 문자 인식을 통해 산출된 문자 인식 데이터에 기초하여 미리 정해진 기준에 따른 오류 기준 충족 여부를 판단하는 단계; 상기 문자 인식 데이터의 오류를 수정하고 이를 기초로 보정된 고화질 문서 이미지를 생성하는 단계; 및 상기 보정된 고화질 문서 이미지를 반영하여 상기 고화질 변환 모델을 갱신하는 단계;를 포함하는 것을 특징으로 하는 문서 이미지에 대한 고화질 변환 모델 학습 방법을 개시한다. |
---|---|
Bibliography: | Application Number: KR20210147338 |