AUTOMATED HANDLING OF DATA DRIFT IN EDGE CLOUD ENVIRONMENTS

A computer-implemented method for automated handling of data drift in a machine learning (ML) system including a plurality of trained ML models is provided. The method includes obtaining performance metrics requirements used for data drift handling; monitoring an input data stream of the ML system,...

Full description

Saved in:
Bibliographic Details
Main Authors GLITHO, Roch, FU, Chunyan, EBRAHIMZADEH, Amin, SHAYESTEH, Behshid
Format Patent
LanguageEnglish
French
Published 13.10.2022
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:A computer-implemented method for automated handling of data drift in a machine learning (ML) system including a plurality of trained ML models is provided. The method includes obtaining performance metrics requirements used for data drift handling; monitoring an input data stream of the ML system, wherein the monitoring includes a first monitoring for detecting data drift based on a distribution change of the input data and for determining a type and a range of data drift, and a second monitoring for detecting data drift based on a drop in accuracy of a first trained ML model; if the first monitoring and the second monitoring both detect data drift, selecting from a data repository storing a plurality of data drift adaptors one of the data drift adaptors based on the performance metrics requirements obtained, a type of the first trained ML model, and the determined type and range of data drift; testing the selected data drift adaptor to determine if the performance metrics requirements are met; and if the performance metrics requirements are met, applying the selected data drift adaptor to the first trained ML model to adapt the first trained ML model to handle the data drift. L'invention concerne un procédé mis en œuvre par ordinateur pour la gestion automatisée de la dérive de données dans un système d'apprentissage automatique (AA) comprenant une pluralité de modèles d'AA entraînés. Le procédé comprend l'obtention d'exigences de métriques de performance utilisées pour la gestion de la dérive de données ; la surveillance d'un flux de données d'entrée du système d'AA, la surveillance comprenant une première surveillance pour détecter une dérive de données sur la base d'un changement de distribution des données d'entrée et pour déterminer un type et une plage de dérive de données, et une seconde surveillance pour détecter une dérive de données sur la base d'une baisse de précision d'un premier modèle d'AA entraîné ; si la première surveillance et la seconde surveillance détectent toutes les deux une dérive de données, la sélection, dans un référentiel de données stockant une pluralité d'adaptateurs de dérive de données, de l'un des adaptateurs de dérive de données sur la base des exigences de métriques de performance obtenues, d'un type du premier modèle d'AA entraîné, et du type et de la plage de dérive de données déterminés ; le test de l'adaptateur de dérive de données sélectionné pour déterminer si les exigences de métriques de performance sont satisfaites ; et si les exigences de métriques de performance sont satisfaites, l'application de l'adaptateur de dérive de données sélectionné au premier modèle d'AA entraîné pour adapter le premier modèle d'AA entraîné afin de gérer la dérive de données.
Bibliography:Application Number: WO2021IB52815