MODEL ESTIMATION SYSTEM, MODEL ESTIMATION METHOD, AND MODEL ESTIMATION PROGRAM

An input unit 81 accepts, as input thereto, action data in which an environment state and an action performed in said environment are correlated, a prediction model for predicting a state that corresponds to an action on the basis of the action data, and an explanatory variable to an objective funct...

Full description

Saved in:
Bibliographic Details
Main Author ETO Riki
Format Patent
LanguageEnglish
French
Japanese
Published 03.10.2019
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:An input unit 81 accepts, as input thereto, action data in which an environment state and an action performed in said environment are correlated, a prediction model for predicting a state that corresponds to an action on the basis of the action data, and an explanatory variable to an objective function that evaluates the state and the action together. A structure setting unit 82 sets a branch structure in which an objective function is placed in the lowermost node of a hierarchical mixed expert model. A learning unit 83 learns the objective function that includes the explanatory variable and a branch condition in a node of the hierarchical mixed expert model on the basis of a state predicted by applying the prediction model to the action data, which is divided in accordance with the branch structure. L'invention concerne une unité d'entrée (81) qui reçoit en entrée des données d'action dans lesquelles un état d'environnement et une action effectuée dans ledit environnement sont corrélés, un modèle de prédiction permettant de prédire un état qui correspond à une action en fonction des données d'action, et une variable explicative à une fonction objective qui évalue l'état et l'action conjointement. Une unité de définition de structure (82) règle une structure de branche dans laquelle une fonction objective est placée dans le nœud le plus bas d'un modèle expert mixte hiérarchique. Une unité d'apprentissage (83) apprend la fonction objective qui comprend la variable explicative et une condition de branche dans un nœud du modèle d'expert mixte hiérarchique en fonction d'un état prédit par l'application du modèle de prédiction aux données d'action, qui sont divisées en fonction de la structure de branche. 入力部81は、環境の状態とその環境の元で行われる行動とを対応付けたデータである行動データ、行動データに基づいて行動に応じた状態を予測する予測モデル、および、状態と行動とを合わせて評価する目的関数の説明変数とを入力する。構造設定部82は、階層混合エキスパートモデルの最下層のノードに目的関数が配される分岐構造を設定する。学習部83は、分岐構造に従って分割される行動データに対して予測モデルを適用して予測される状態に基づいて、階層混合エキスパートモデルのノードにおける分岐条件および説明変数を含む目的関数を学習する。
Bibliography:Application Number: WO2018JP13589