METHOD OF IDENTIFYING HEADER BLOCK AND DATA BLOCK IN A FILE

The present invention discloses a method for identifying a header block and a data block in a file. The method comprises the steps of: generating a regular expression pattern for a header block from a sample part of a file; scanning a regular expression pattern for at least one line in the file in o...

Full description

Saved in:
Bibliographic Details
Main Authors PATNEY VIPLOV, JAYAKUMARAN JAGADEESH KUMAR
Format Patent
LanguageEnglish
Korean
Published 05.08.2016
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:The present invention discloses a method for identifying a header block and a data block in a file. The method comprises the steps of: generating a regular expression pattern for a header block from a sample part of a file; scanning a regular expression pattern for at least one line in the file in order to identify at least one header block in the file; and determining the at least one header block from the file when the number of times the regular expression pattern is scanned exceeds a predefined number. The regular expression pattern for the header block is generated from the sample part of the file through performing the steps of: extracting the sample part from the file; scanning individual lines in the sample part in order to determine lengths of the individual lines; determining the header block based on a predefined header length; constructing the regular expression pattern for the determined header block; and storing the regular expression pattern in local memory. 본 발명은 파일에서 헤더 블록과 데이터 블록을 식별하는 방법을 개시한다. 그 방법은 파일의 샘플 부분으로부터 헤더 블록에 대한 정규식 패턴을 생성하는 단계, 파일에 존재하는 하나 이상의 헤더 블록들을 식별하기 위해 파일에 존재하는 하나 이상의 라인들의 정규식 패턴을 스캐닝하는 단계, 및 정규식 패턴 발생이 미리 정의된 수를 초과할 경우 파일에서 하나 이상의 헤더 블록들을 결정하는 단계를 포함한다. 헤더 블록에 대한 정규식 패턴은, 파일로부터 샘플 부분을 추출하는 단계, 각각의 라인의 길이를 결정하기 위해 샘플 부분의 각각의 라인을 스캐닝하는 단계, 미리 정의된 헤더 길이에 기초하여 헤더 블록을 결정하는 단계, 결정된 헤더 블록에 대한 정규식 패턴을 구성하는 단계, 및 정규식 패턴을 로컬 메모리에 저장하는 단계를 포함하는 방법 단계들을 수행함으로써 파일의 샘플 부분으로부터 생성된다.
Bibliography:Application Number: KR20150113855