ANTENNA PHASE ERROR COMPENSATION WITH REINFORCED LEARNING

Systems and methods of the present disclosure are directed to a method performed by a network node for antenna phase error compensation via reinforcement learning. The method includes initializing M Multi-Arm Bandit (MAB) models to determine M phase offsets for phase deltas of N antenna branches wit...

Full description

Saved in:

Bibliographic Details
Main Authors	MAH, Edward, LI, Haomin, KARLSSON, Jonas, CHEN, Xixian, LU, Guoqiang
Format	Patent
Language	English French
Published	14.09.2023
Subjects	CALCULATING COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS COMPUTING COUNTING ELECTRIC COMMUNICATION TECHNIQUE ELECTRICITY PHYSICS TRANSMISSION
Online Access	Get full text

Cover

Loading…

More Information
Summary:	Systems and methods of the present disclosure are directed to a method performed by a network node for antenna phase error compensation via reinforcement learning. The method includes initializing M Multi-Arm Bandit (MAB) models to determine M phase offsets for phase deltas of N antenna branches with dual polarization where M = N-3. The method includes selecting M phase offsets with the M MABs. The method includes applying the M phase offsets to phase(s) of at least one antenna branch during transmission. The method includes, while applying the M phase offsets, determining reward values for the M phase offsets. The method includes, based on the reward values, updating the parameters of the M MAB models. La présente invention concerne des systèmes et des procédés qui se rapportent à un procédé mis en œuvre par un nœud de réseau pour une compensation d'erreur de phase d'antenne par l'intermédiaire d'un apprentissage par renforcement. Le procédé comprend l'initialisation de M modèles de bandit manchot (MAB) pour déterminer M décalages de phase pour des deltas de phase de N branches d'antenne avec une double polarisation, où M = N-3. Le procédé comprend la sélection de M décalages de phase avec les M MAB. Le procédé comprend l'application des M décalages de phase à une ou plusieurs phases d'au moins une branche d'antenne pendant la transmission. Le procédé consiste, tout en appliquant les M décalages de phase, à déterminer des valeurs de récompense pour les M décalages de phase. Le procédé comprend, sur la base des valeurs de récompense, la mise à jour des paramètres des M modèles MAB.
Bibliography:	Application Number: WO2022IB52180