METHOD AND SYSTEM FOR SELECTING MACHINE LEARNING MODEL BASED ON DATA DISTRIBUTION

The present disclosure relates to a method for selecting a machine learning model based on data distribution, which is performed by at least one processor. The method includes the following steps of: acquiring learning data including a learning time series data item and a plurality of learning label...

Full description

Saved in:
Bibliographic Details
Main Authors LEE BYUNGJAE, KIM HYO EUN, LIM GANGMUK
Format Patent
LanguageEnglish
Korean
Published 05.01.2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:The present disclosure relates to a method for selecting a machine learning model based on data distribution, which is performed by at least one processor. The method includes the following steps of: acquiring learning data including a learning time series data item and a plurality of learning labels corresponding to the learning time series data item; preprocessing a plurality of learning detailed data items corresponding to each of a plurality of learning label distributions from the learning data; instructing a plurality of machine learning models by using the plurality of preprocessed learning detailed data items and a plurality of learning detailed labels corresponding to the plurality of learning detailed data items; acquiring time series data and a plurality of labels corresponding to the time series data; and selecting at least one of the plurality of machine learning models based on similarity between the learning data and the time series data. Therefore, the present invention is capable of improving inference from a machine learning model. 본 개시는 적어도 하나의 프로세서에 의해 수행되는, 데이터 분포를 기초로 기계학습 모델을 선택하는 방법에 관한 것이다. 이 방법은, 학습 시계열 데이터 아이템 및 학습 시계열 데이터 아이템에 대응하는 복수의 학습 레이블을 포함한 학습 데이터를 획득하는 단계, 학습 데이터로부터 복수의 학습 레이블 분포의 각각에 대응하는 복수의 학습 세부 데이터 아이템에 대한 전처리를 수행하는 단계, 전처리된 복수의 학습 세부 데이터 아이템 및 복수의 학습 세부 데이터 아이템에 대응하는 복수의 학습 세부 레이블을 이용하여 복수의 기계학습 모델을 학습시키는 단계, 시계열 데이터 및 시계열 데이터에 대응하는 복수의 레이블을 획득하는 단계 및 학습 데이터와 시계열 데이터의 각각 사이의 유사도를 기초로 복수의 기계학습 모델 중 적어도 하나의 기계학습 모델을 선택하는 단계를 포함한다.
Bibliography:Application Number: KR20220016535