TRAINING AND USING A NEURAL NETWORK FOR MANAGING AN ENVIRONMENT IN A COMMUNICATION NETWORK

Computer implemented methods for training a Student Neural Network, SNN, (600, 700, 800), and for managing an environment of a communication network using a trained SNN (900, 1000), are disclosed. The SNN is for generating an action prediction matrix for an environment in a communication network, th...

Full description

Saved in:
Bibliographic Details
Main Authors SANDBERG, David, KVERNVIK, Tor
Format Patent
LanguageEnglish
French
Published 04.08.2022
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:Computer implemented methods for training a Student Neural Network, SNN, (600, 700, 800), and for managing an environment of a communication network using a trained SNN (900, 1000), are disclosed. The SNN is for generating an action prediction matrix for an environment in a communication network, the action prediction matrix comprising action predictions for a plurality of nodes or resources in the environment. The training method (600, 700, 800) comprises using a Reinforcement Learning process to train a Teacher Neural Network, TNN, to generate an action prediction for a resource or node in the environment (610), and using the trained TNN to generate a first training data set including action predictions for individual nodes or resources (620). The training method further comprises generating a second training data set from the first training data set (630) such that the second training data set includes action prediction matrices, and using the second training data set to update values of the parameters of the SNN (640). La présente invention divulgue des procédés mis en œuvre par ordinateur pour entraîner un réseau de neurones artificiels étudiant, SNN, (600, 700, 800) et pour gérer un environnement d'un réseau de communication à l'aide d'un SNN entraîné (900, 1000). Le SNN est destiné à générer une matrice de prédictions d'action pour un environnement dans un réseau de communication, la matrice de prédictions d'action comprenant des prédictions d'action pour une pluralité de nœuds ou de ressources dans l'environnement. Le procédé d'entraînement (600, 700, 800) consiste à utiliser un processus d'apprentissage par renforcement pour entraîner un réseau de neurones artificiels enseignant, TNN, pour générer une prédiction d'action pour une ressource ou un nœud dans l'environnement (610) et à utiliser le TNN entraîné pour générer un premier ensemble de données d'entraînement comprenant des prédictions d'action pour des nœuds ou des ressources individuels (620). Le procédé d'entraînement consiste en outre à générer un second ensemble de données d'entraînement à partir du premier ensemble de données d'entraînement (630) de telle sorte que le second ensemble de données d'entraînement comprenne des matrices de prédictions d'action et à utiliser le second ensemble de données d'entraînement pour mettre à jour des valeurs des paramètres du SNN (640).
Bibliography:Application Number: WO2021EP51777