ANTENNA PHASE ERROR COMPENSATION WITH REINFORCED LEARNING
Systems and methods of the present disclosure are directed to a method performed by a network node for antenna phase error compensation via reinforcement learning. The method includes initializing M Multi-Arm Bandit (MAB) models to determine M phase offsets for phase deltas of N antenna branches wit...
Saved in:
Main Authors | , , , , |
---|---|
Format | Patent |
Language | English French |
Published |
14.09.2023
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | Systems and methods of the present disclosure are directed to a method performed by a network node for antenna phase error compensation via reinforcement learning. The method includes initializing M Multi-Arm Bandit (MAB) models to determine M phase offsets for phase deltas of N antenna branches with dual polarization where M = N-3. The method includes selecting M phase offsets with the M MABs. The method includes applying the M phase offsets to phase(s) of at least one antenna branch during transmission. The method includes, while applying the M phase offsets, determining reward values for the M phase offsets. The method includes, based on the reward values, updating the parameters of the M MAB models.
La présente invention concerne des systèmes et des procédés qui se rapportent à un procédé mis en œuvre par un nœud de réseau pour une compensation d'erreur de phase d'antenne par l'intermédiaire d'un apprentissage par renforcement. Le procédé comprend l'initialisation de M modèles de bandit manchot (MAB) pour déterminer M décalages de phase pour des deltas de phase de N branches d'antenne avec une double polarisation, où M = N-3. Le procédé comprend la sélection de M décalages de phase avec les M MAB. Le procédé comprend l'application des M décalages de phase à une ou plusieurs phases d'au moins une branche d'antenne pendant la transmission. Le procédé consiste, tout en appliquant les M décalages de phase, à déterminer des valeurs de récompense pour les M décalages de phase. Le procédé comprend, sur la base des valeurs de récompense, la mise à jour des paramètres des M modèles MAB. |
---|---|
Bibliography: | Application Number: WO2022IB52180 |