ANTENNA PHASE ERROR COMPENSATION WITH REINFORCED LEARNING

Systems and methods of the present disclosure are directed to a method performed by a network node for antenna phase error compensation via reinforcement learning. The method includes initializing M Multi-Arm Bandit (MAB) models to determine M phase offsets for phase deltas of N antenna branches wit...

Full description

Saved in:
Bibliographic Details
Main Authors MAH, Edward, LI, Haomin, KARLSSON, Jonas, CHEN, Xixian, LU, Guoqiang
Format Patent
LanguageEnglish
French
Published 14.09.2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:Systems and methods of the present disclosure are directed to a method performed by a network node for antenna phase error compensation via reinforcement learning. The method includes initializing M Multi-Arm Bandit (MAB) models to determine M phase offsets for phase deltas of N antenna branches with dual polarization where M = N-3. The method includes selecting M phase offsets with the M MABs. The method includes applying the M phase offsets to phase(s) of at least one antenna branch during transmission. The method includes, while applying the M phase offsets, determining reward values for the M phase offsets. The method includes, based on the reward values, updating the parameters of the M MAB models. La présente invention concerne des systèmes et des procédés qui se rapportent à un procédé mis en œuvre par un nœud de réseau pour une compensation d'erreur de phase d'antenne par l'intermédiaire d'un apprentissage par renforcement. Le procédé comprend l'initialisation de M modèles de bandit manchot (MAB) pour déterminer M décalages de phase pour des deltas de phase de N branches d'antenne avec une double polarisation, où M = N-3. Le procédé comprend la sélection de M décalages de phase avec les M MAB. Le procédé comprend l'application des M décalages de phase à une ou plusieurs phases d'au moins une branche d'antenne pendant la transmission. Le procédé consiste, tout en appliquant les M décalages de phase, à déterminer des valeurs de récompense pour les M décalages de phase. Le procédé comprend, sur la base des valeurs de récompense, la mise à jour des paramètres des M modèles MAB.
Bibliography:Application Number: WO2022IB52180