METHOD FOR GENERATING METADATA FOR AUTOMATICALLY DETERMINING TYPE OF DATA AND APPARATUS FOR DETERMINING TYPE OF DATA USING A MACHINE LEARNING/DEEP LEARNING MODEL FOR THE SAME

The present invention relates to a method for generating metadata by automatically determining a type of data, which can easily and simply perform a pre-processing process for data. The method for generating metadata by automatically determining a type of data, which includes a number type, letter t...

Full description

Saved in:
Bibliographic Details
Main Author MA BO HYEON
Format Patent
LanguageEnglish
Korean
Published 19.05.2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:The present invention relates to a method for generating metadata by automatically determining a type of data, which can easily and simply perform a pre-processing process for data. The method for generating metadata by automatically determining a type of data, which includes a number type, letter type, range type, and date type, by a metadata generation apparatus using a machine learning/deep learning model according to one embodiment of the present invention comprises: a step (a) of firstly determining whether a field value of received data is the date type; a step (b) of secondly determining whether the value is any one type of the range type or date type by applying a data type determination condition included in metadata generation rules to the field value of the received data when it has been firstly determined that the value is not the date type as a determination result of the step (a); a step (c) of finally determining whether the value is any one type of the number type, the letter type, the range type, or the date type and generating metadata by applying a field name of the received data to a field mapping table related to the determination of the data type included in the metadata generation rules when it has been secondly determined that the value is not any one type of the range type or the date type as a result of a determination result of the step (b); and a step (d) of learning the generated metadata with the machine learning/deep learning model to update the metadata generation rules. 본 발명의 일 실시 예에 따른 머신러닝(Machine Learning)/딥러닝(Deep Learning) 모델을 이용한 메타데이터(Metadata) 생성 장치가 데이터의 타입 - 상기 데이터의 타입은 숫자형, 문자형, 범주형 및 날짜형을 포함함 - 을 자동으로 판별하여 메타데이터를 생성하는 방법은 (a) 수신한 데이터의 필드값이 날짜형 타입인지 1차적으로 판단하는 단계, (b) 상기 (a) 단계의 판단 결과, 날짜형 타입이 아니라고 1차적으로 판단되었다면, 상기 수신한 데이터의 필드값에 메타데이터 생성 규칙이 포함하는 데이터 타입 결정 조건을 적용하여 범주형 및 날짜형 중 어느 하나의 타입인지 2차적으로 판단하는 단계, (c) 상기 (b) 단계의 판단 결과, 범주형 및 날짜형 중 어느 하나의 타입이 아니라고 2차적으로 판단되었다면, 상기 수신한 데이터의 필드명을 상기 메타데이터 생성 규칙이 포함하는 데이터 타입의 판별에 관한 필드 매핑 테이블(Field Mapping Table)에 적용하여 숫자형, 문자형, 범주형 및 날짜형 중 어느 하나의 타입인지 최종적으로 판단하고 메타데이터를 생성하는 단계 및 (d) 상기 생성한 메타데이터를 머신러닝/딥러닝 모델로 학습하여 상기 메타데이터 생성 규칙을 업데이트하는 단계를 포함한다.
Bibliography:Application Number: KR20210155465