RECOGNIZER TRAINING DEVICE, RECOGNIZER TRAINING METHOD, AND RECOGNIZER TRAINING PROGRAM

In the present invention, a training unit 24 trains a recognizer that recognizes the labels of data on the basis of a plurality of items of training data to which training labels are applied. A score calculation unit 28 uses the trained recognizer and calculates a score outputted by the recognizer f...

Full description

Saved in:
Bibliographic Details
Main Authors MURASAKI, Kazuhiko, ANDO, Shingo, SHIMAMURA, Jun
Format Patent
LanguageEnglish
French
Japanese
Published 30.12.2021
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:In the present invention, a training unit 24 trains a recognizer that recognizes the labels of data on the basis of a plurality of items of training data to which training labels are applied. A score calculation unit 28 uses the trained recognizer and calculates a score outputted by the recognizer for each of the plurality of items of training data. A threshold value determination unit 30 determines a threshold value relating to the score for determining a label on the basis of the shape of an ROC curve showing the correlation between a true positive rate and a false positive rate, said ROC curve being obtained on the basis of the score calculated for each of the plurality of items of training data. A selector 32 selects the training data for which recognition by the recognizer is difficult, on the basis of the determined threshold value and the score calculated for each of the plurality of items of training data. The process for each unit is repeated until a preset iteration completion condition is met. Dans la présente invention, une unité d'entraînement 24 entraîne un reconnaisseur qui reconnaît les étiquettes de données sur la base d'une pluralité d'éléments de données d'entraînement auxquels des étiquettes d'entraînement sont appliquées. Une unité de calcul de score 28 utilise le reconnaisseur entraîné et calcule un score délivré par le reconnaisseur pour chaque élément de la pluralité d'éléments de données d'entraînement. Une unité de détermination de valeur de seuil 30 détermine une valeur de seuil relative au score pour déterminer une étiquette sur la base de la forme d'une courbe ROC montrant la corrélation entre un taux de vrai positif et un taux de faux positif, ladite courbe ROC étant obtenue sur la base du score calculé pour chaque élément de la pluralité d'éléments de données d'entraînement. Un sélecteur 32 sélectionne les données d'entraînement dont la reconnaissance est difficile pour le reconnaisseur, sur la base de la valeur de seuil déterminée et du score calculé pour chaque élément de la pluralité d'éléments de données d'entraînement. Le procédé pour chaque unité est répété jusqu'à ce qu'une condition de fin d'itération prédéfinie soit satisfaite. 学習部24が、学習用ラベルが与えられた複数の学習用データに基づいて、データのラベルを認識する認識器を学習する。スコア算出部28が、前記学習された認識器を用いて、前記複数の学習用データの各々について、前記認識器が出力するスコアを算出する。閾値決定部30が、前記複数の学習用データの各々について算出されたスコアに基づいて得られる、真陽性率と偽陽性率との対応関係を表すROC曲線の形状に基づいて、ラベルを決定するための前記スコアに関する閾値を決定する。選択部32が、前記決定された閾値と、前記複数の学習用データの各々について算出されたスコアとに基づいて、前記認識器による認識が困難な前記学習用データを選択する。上記の各部の処理を、予め定められた反復終了条件を満たすまで繰り返す。
Bibliography:Application Number: WO2020JP24412