METHOD FOR GENERATING TEACHING DATA IN ANALYSIS DATA MANAGEMENT SYSTEM

The present invention constructs, for each of one or multiple types of sample, a database that stores a sample identification tag in linkage with data that belongs to at least two types of categories among categories (1), (2) and (3). The data used as teaching data in supervised learning is selected...

Full description

Saved in:
Bibliographic Details
Main Authors YAMADA, Hiroaki, ITO, Wakana, TSUDA, Tomoya, NAGAI, Shiori, YAMAMOTO, Satoshi, KISHIMOTO, Hiroyuki, KAWASE, Tomohiro
Format Patent
LanguageEnglish
French
Japanese
Published 25.11.2021
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:The present invention constructs, for each of one or multiple types of sample, a database that stores a sample identification tag in linkage with data that belongs to at least two types of categories among categories (1), (2) and (3). The data used as teaching data in supervised learning is selected from the database. In this case, one or multiple data types are selected as explanatory variables from one of the categories. Furthermore, one or multiple data types are selected as objective variables from the other of the categories. Then, teaching data is generated, which is composed of data that corresponds to the selected explanatory variables as input and data that corresponds to the selected objective variables as correct-answer output. Category (1) represents multiple types of data relating to a method of producing a sample, category (2) represents multiple types of analysis data that are the results of analysis of the sample by one or multiple types of analyzer, and category (3) represents multiple types of physical property data that is information indicating the characteristics of the sample. La présente invention construit, pour chacun d'un ou de multiples types d'échantillon, une base de données qui stocke une étiquette d'identification d'échantillon en liaison avec des données qui appartiennent à au moins deux types de catégories parmi des catégories (1), (2) et (3). Les données utilisées en tant que données d'enseignement dans l'apprentissage supervisé sont sélectionnées dans la base de données. Dans ce cas, un ou plusieurs types de données sont sélectionnés en tant que variables explicatives à partir de l'une des catégories. En outre, un ou plusieurs types de données sont sélectionnés en tant que variables objectives à partir de l'autre des catégories. Ensuite, des données d'enseignement sont générées, qui sont composées de données qui correspondent aux variables explicatives sélectionnées en tant qu'entrée et de données qui correspondent aux variables objectives sélectionnées en tant que sortie de réponse correcte. Catégorie (1) représente de multiples types de données se rapportant à un procédé de production d'un échantillon, catégorie (2) représente de multiples types de données d'analyse qui sont les résultats d'analyse de l'échantillon par un ou plusieurs types d'analyseur, et catégorie (3) représente de multiples types de données de propriétés physiques qui sont des informations indiquant les caractéristiques de l'échantillon. 1または複数種類のサンプルのそれぞれについて、サンプル識別タグと、カテゴリ(1)(2)(3)のうち少なくとも2種類のカテゴリに属するデータとを紐づけて格納したデータベースを構築する。データベースから教師あり学習における教師データとして使用するデータを選択する。この時、カテゴリの1から、1または複数のデータの種別を説明変数として選択する。さらに、カテゴリの他から、1または複数のデータの種別を目的変数として選択する。そして、選択された説明変数に対応するデータを入力とし、選択された目的変数に対応するデータを正解出力とする教師データを生成する。カテゴリ(1)はサンプルの作製方法に関する複数種類のデータ、カテゴリ(2)はサンプルを1または複数種類の分析装置で分析した結果である複数種類の分析データ、カテゴリ(3)はサンプルの特性を表す情報である複数種類の物性データである。
Bibliography:Application Number: WO2021JP13665