LEARNING DEVICE, PERISHABLE PRODUCT STORAGE DEVICE, AND PROGRAM

[Problem] To perform reinforcement learning of control conditions of the environment of perishable products using information related to the freshness of the perishable products from a freshness sensor, and automatically control the environment of the perishable products. [Solution] The present inve...

Full description

Saved in:
Bibliographic Details
Main Authors TANNO, Shouichi, SATOU, Kiichirou, MATSUI, Hidenori
Format Patent
LanguageEnglish
French
Japanese
Published 07.10.2021
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:[Problem] To perform reinforcement learning of control conditions of the environment of perishable products using information related to the freshness of the perishable products from a freshness sensor, and automatically control the environment of the perishable products. [Solution] The present invention comprises: a freshness determination unit 520 that acquires information related to the freshness of perishable products stored in a storage warehouse; and an analysis unit 530 that learns, by reinforcement learning, the internal environment of the storage warehouse for the freshness of the perishable products acquired by the freshness determination unit 520, and determines a reward to be used in the learning. The analysis unit 530 determines a reward on the basis of a decrease in freshness over a certain period of time under the internal environment of the storage warehouse for the freshness, determined on the basis of the freshness acquired by the freshness determination unit 520. The analysis unit 530 learns the internal environment of the storage warehouse for the freshness on the basis of the determined reward. Le problème à résoudre dans le cadre de la présente invention consiste à effectuer un apprentissage par renforcement de conditions de commande de l'environnement de produits périssables à l'aide d'informations se rapportant à la fraîcheur des produits périssables provenant d'un capteur de fraîcheur, et à commander automatiquement l'environnement des produits périssables. La solution selon la présente invention comprend : une unité de détermination de fraîcheur (520) qui acquiert des informations se rapportant à la fraîcheur de produits périssables stockés dans un entrepôt de stockage ; et une unité d'analyse (530) qui apprend, au moyen d'un apprentissage par renforcement, l'environnement interne de l'entrepôt de stockage pour la fraîcheur des produits périssables acquise par l'unité de détermination de fraîcheur (520), et qui détermine une récompense à utiliser dans l'apprentissage. L'unité d'analyse (530) détermine une récompense sur la base d'une baisse de la fraîcheur pendant une certaine période de temps dans l'environnement interne de l'entrepôt de stockage pour la fraîcheur, déterminée sur la base de la fraîcheur acquise par l'unité de détermination de fraîcheur (520). L'unité d'analyse (530) apprend l'environnement interne de l'entrepôt de stockage pour la fraîcheur sur la base de la récompense déterminée. 【課題】鮮度センサによる生鮮品の鮮度の情報を用いて、生鮮品の環境の制御条件を強化学習し、生鮮品の環境を自動的に制御する。 【解決手段】収容庫内に収容される生鮮品の鮮度の情報を取得する鮮度判断部520と、鮮度判断部520によって取得された生鮮品の鮮度に対する収容庫内の庫内環境を強化学習により学習し、この学習において用いる報酬を決定する解析部530と、を備える。解析部530は、鮮度判断部520により取得された鮮度に基づいて決定されたこの鮮度に対する庫内環境下における一定期間の鮮度低下に基づいて報酬を決定する。そして、解析部530は、決定した報酬に基づいて鮮度に対する庫内環境を学習する。
Bibliography:Application Number: WO2021JP13482