FINGERPRINT-BASED DATA CLASSIFICICATION

Systems and methods are provided for automated classification of data using fingerprints. The method includes: generating, by a computing device based on predetermined rules, a fingerprint of a data column in a data set to be classified, the fingerprint comprising dimensions, wherein each of the dim...

Full description

Saved in:
Bibliographic Details
Main Authors WANG, Wei, WANG, Xiaobo, WANG, Yi, SUN, Chun Hua, CAI, Xu Bin
Format Patent
LanguageEnglish
French
Published 08.06.2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:Systems and methods are provided for automated classification of data using fingerprints. The method includes: generating, by a computing device based on predetermined rules, a fingerprint of a data column in a data set to be classified, the fingerprint comprising dimensions, wherein each of the dimension is assigned an attribute representing a characteristic of data in the data column; determining, by the computing device, that the fingerprint matches one or more target fingerprints by comparing the fingerprint to the target fingerprints, wherein each target fingerprint is associated with a class and includes dimensions, and each dimension is assigned an attribute representing a characteristic of data in the class; and assigning, by the computing device, one or more classes to the data column based on the one or more target fingerprints, thereby generating classified data. L'invention concerne des systèmes et des procédés de classification automatisée de données à l'aide d'empreintes digitales. Le procédé comprend les étapes consistant à : générer, par un dispositif informatique sur la base de règles prédéterminées, une empreinte digitale d'une colonne de données dans un ensemble de données à classifier, l'empreinte digitale comprenant des dimensions, chacune des dimensions se voyant attribuer un attribut représentant une caractéristique de données dans la colonne de données; déterminer, par le dispositif informatique, que l'empreinte digitale correspond à une ou plusieurs empreintes digitales cibles par comparaison de l'empreinte digitale aux empreintes digitales cibles, chaque empreinte digitale cible étant associée à une classe et comprenant des dimensions, chaque dimension se voyant attribuer un attribut représentant une caractéristique de données dans la classe; et attribuer, par le dispositif informatique, une ou plusieurs classes à la colonne de données sur la base de la ou des empreintes digitales cibles, générant ainsi des données classifiées.
Bibliography:Application Number: WO2022CN134565