DATA SELECTION METHOD, DATA SELECTION DEVICE, AND PROGRAM
This data selection method, in which on the basis of a set of first data which is labeled and a set of second data which is not labeled, a target to be labeled is selected from among the set of second data, causes a computer to execute: a classification procedure for classifying data belonging to th...
Saved in:
Main Authors | , , , |
---|---|
Format | Patent |
Language | English French Japanese |
Published |
04.02.2021
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | This data selection method, in which on the basis of a set of first data which is labeled and a set of second data which is not labeled, a target to be labeled is selected from among the set of second data, causes a computer to execute: a classification procedure for classifying data belonging to the set of first data and data belonging to the set of second data into clusters that are at least one more than the number of label types; and a selection procedure for selecting second data to be labeled, from clusters that do not include the first data, among the clusters, thereby enabling data, which is effective for a target task, to be selected as the target to be labeled which is selected from the data set which is not labeled.
La présente invention concerne un procédé de sélection de données qui comprend les étapes consistant à : sur la base d'un ensemble de premières données qui sont étiquetées et d'un ensemble de secondes données qui ne sont pas étiquetées, sélectionner une cible à étiqueter parmi l'ensemble de secondes données pour amener un ordinateur à exécuter : une procédure de classification pour classer des données appartenant à l'ensemble de premières données et des données appartenant à l'ensemble de secondes données en groupes qui sont au moins un de plus que le nombre de types d'étiquettes ; et une procédure de sélection pour sélectionner des secondes données à étiqueter, à partir de groupes qui ne comprennent pas les premières données, parmi les groupes, permettant ainsi à des données, qui sont efficaces pour une tâche cible, d'être sélectionnées comme cible à étiqueter qui est sélectionnée parmi l'ensemble de données qui ne sont pas étiquetées.
ラベルが付与された第1のデータの集合とラベルが付与されていない第2のデータの集合とに基づいて、前記第2のデータの集合のなかからラベルを付与する対象を選択するデータ選択方法は、前記第1のデータの集合に属するデータと、前記第2のデータの集合に属するデータとを、前記ラベルの種類よりも少なくとも1つ多い数のクラスタに分類する分類手順と、前記クラスタのうち、前記第1のデータを含まないクラスタからラベルの付与対象とする前記第2のデータを選択する選択手順と、をコンピュータが実行することで、ラベルが付与されていないデータ集合の中から選択されるラベルの付与対象であって、目的のタスクに有効なデータを選択可能とする。 |
---|---|
Bibliography: | Application Number: WO2019JP29807 |