Data Processing system and method for searching end-point of preset data cluster

Disclosed are a method for searching for an endpoint of a specific data cluster and a data processing system therefor. According to the present invention, the method for searching for an endpoint of a specific data cluster comprises the following steps: a) receiving, by a search system, a numerical...

Full description

Saved in:
Bibliographic Details
Main Authors LEE CHANG DAE, SUN WOO KIM, LEE DONG YOON
Format Patent
LanguageEnglish
Korean
Published 18.11.2019
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:Disclosed are a method for searching for an endpoint of a specific data cluster and a data processing system therefor. According to the present invention, the method for searching for an endpoint of a specific data cluster comprises the following steps: a) receiving, by a search system, a numerical value of each of a plurality of individual data contained in a data set; b) dividing a numerical range that the numerical value can have into a plurality of bins having a predetermined bin width by using the respective numerical values inputted by the search system, generating histogram data having the number of individual data corresponding to each of the divided bins as a bin value; and c) searching for a target bin present at the end of a specific cluster based on the histogram data generated by the search system. 특정 데이터 군집의 종단지점 탐색 방법 및 이를 위한 데이터 처리시스템이 개시된다. 상기 특정 데이터 군집의 종단지점 탐색 방법은 a) 탐색시스템이 데이터 세트에 포함된 다수의 개별 데이터 각각의 수치 값을 입력받는 단계, b) 상기 탐색시스템이 입력받은 상기 각각의 수치 값을 이용해 상기 수치 값이 가질 수 있는 수치범위를 미리 정해진 빈 폭을 갖는 복수 개의 빈들로 분할하고, 분할 된 빈들 각각에 해당하는 개별 데이터의 개수를 빈 값으로 갖는 히스토그램 데이터를 생성하는 단계, 및 c) 상기 탐색시스템이 생성한 히스토그램 데이터에 기초하여 특정 군집의 종단에 존재하는 목표 빈을 탐색하는 단계를 포함한다.
Bibliography:Application Number: KR20180052522