METHOD AND SYSTEM FOR GENERATING SYNTHETICALLY ANONYMIZED DATA FOR A GIVEN TASK

A method and a system are disclosed for generating synthetically anonymized data, the method comprising providing first data to be anonymized; providing a data embedding comprising data features, wherein data features enable a representation of corresponding data, and wherein the data is representat...

Full description

Saved in:
Bibliographic Details
Main Authors JESSON, ANDREW, CHAPADOS, NICOLAS, CHANDELIER, FLORENT, LOW-KAM, CECILE, DIJORIO, LISA, HAVAEI, MOHAMMAD, SOUDAN, FLORIAN
Format Patent
LanguageEnglish
French
Published 22.08.2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:A method and a system are disclosed for generating synthetically anonymized data, the method comprising providing first data to be anonymized; providing a data embedding comprising data features, wherein data features enable a representation of corresponding data, and wherein the data is representative of the first data; providing an identifier embedding comprising identifiable features, wherein the identifiable features enable an identification of the data and the first data; providing a task-specific embedding comprising task-specific features, wherein said task-specific features enables a disentanglement of different classes relevant to the given task; generating synthetically anonymized data, the generating comprising a generative process using samples comprising a first sampling from the data embedding which ensures that a corresponding first sample originates away from a projection of the data and the first data in the identifier embedding and a second sampling from the task-specific embedding which ensures that a corresponding second sample originates close to the task-specific features and wherein the generating further mixes the first sample and the second sample in a generative process. La présente invention concerne un procédé et un système permettant de générer des données synthétiquement anonymisées. Le procédé comprend la fourniture de premières données à anonymiser; la fourniture d'une incorporation de données comprenant des caractéristiques de données, les caractéristiques de données permettant une représentation de données correspondantes et les données étant représentatives des premières données; la fourniture d'une incorporation d'identifiant comprenant des caractéristiques identifiables, les caractéristiques identifiables permettant une identification des données et des premières données; la fourniture d'une incorporation spécifique à une tâche comprenant des caractéristiques spécifiques à une tâche, les caractéristiques spécifiques à une tâche permettant une clarification de différentes classes pertinentes à la tâche donnée; la génération de données synthétiquement anonymisées, la génération comprenant un processus de génération utilisant des échantillons comprenant un premier échantillon provenant de l'incorporation de données qui assure qu'un premier échantillon correspondant provient d'une projection des données et des premières données dans l'incorporation d'identifiant et un second échantillon provenant de l'incorporation spécifique à une tâche qui assure qu'un second échantillon correspondant provient de près des caractéristiques spécifiques à une tâche, et la génération mélangeant en outre le premier échantillon et le second échantillon dans un processus de génération.
Bibliography:Application Number: CA20193105533