운전 조건이 다른 머신러닝 학습 데이터 표준화를 위한 방법론 연구

특징기반 머신러닝은 데이터 샘플의 특징 값을 이용하여 진단하는 방법으로, 학습 모델은 설비 사양, 운전 조건 등의 정보가 같은 상태의 데이터 세트를 구성하여 생성하여야 한다. 하지만, 조건이 다른 데이터 세트를 통해 학습할 경우 서로 다른 운전 조건에 의해 발생하는 진동 크기, 주파수성분 등의 차이로 인해 특징 값이 다르게 표현될 수 있으며, 이를 진단에 활용할 경우 새로운 데이터는 잘못 진단될 가능성이 존재한다. 본 연구는 실험을 통한 진동 데이터를 취득하였으며, 데이터 표준화 수행 전, 후의 학습 데이터 세트를 구성한 후 특징...

Full description

Saved in:
Bibliographic Details
Published in동력시스템공학회지 Vol. 27; no. 6; pp. 13 - 21
Main Authors 민태홍(Tae-Hong Min), 송정원(Jeong-Won Song), 임기정(Gi-Jeong Im), 박동희(Dong-Hee Park), 최병근(Byeong-Keun Choi)
Format Journal Article
LanguageKorean
Published 한국동력기계공학회 01.12.2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:특징기반 머신러닝은 데이터 샘플의 특징 값을 이용하여 진단하는 방법으로, 학습 모델은 설비 사양, 운전 조건 등의 정보가 같은 상태의 데이터 세트를 구성하여 생성하여야 한다. 하지만, 조건이 다른 데이터 세트를 통해 학습할 경우 서로 다른 운전 조건에 의해 발생하는 진동 크기, 주파수성분 등의 차이로 인해 특징 값이 다르게 표현될 수 있으며, 이를 진단에 활용할 경우 새로운 데이터는 잘못 진단될 가능성이 존재한다. 본 연구는 실험을 통한 진동 데이터를 취득하였으며, 데이터 표준화 수행 전, 후의 학습 데이터 세트를 구성한 후 특징 분석 결과의 비교 과정을 통해 데이터 표준화 적용 가능성을 평가하였다. 데이터 표준화 전의 특징 분석 결과는 진동 크기 및 주파수 성분으로인해 특징 값의 차이가 발생하여 각 상태의 데이터가 서로 다른 곳에 분포하여 나타났으나, 데이터표준화 후의 특징 분석 결과는 각 상태의 데이터가 서로 다른 곳에 분포하지 않고 동일한 상태끼리군집해 있는 것으로 나타났으며, 분류성능 또한 100%로 확인되었다. Feature-based machine learning is a method of diagnosing using feature values of data samples, and the training model should be created by composing a data set in which information such as facility specifications and operating conditions is the same. When training through data sets with different conditions, feature values may be expressed differently due to differences in vibration magnitude and frequency components. If used for diagnosis, new data may be misdiagnosed. This study acquired vibration data through experiments and evaluated the applicability of data standardization through the comparison process of feature analysis results after constructing a learning data set before and after data comparison process of feature analysis results after constructing a learning data set before and after data standardization. The results of feature analysis before data standardization showed that data in each state were distributed in different places due to differences in feature values due to vibration magnitude and frequency components; the results of feature analysis after data standardization showed that data in each state were not distributed in different places but clustered between the same states, and classification performance was also confirmed to be 100%. KCI Citation Count: 0
ISSN:2713-8429
2713-8437
DOI:10.9726/kspse.2023.27.6.013