SYSTEM AND PROCESS FOR ANALYZING, QUALIFYING AND INGESTING SOURCES OF UNSTRUCTURED DATA VIA EMPIRICAL ATTRIBUTION

There is provided a method that includes (a) receiving data from a data source, (b) attributing the data source in accordance with rules, thus yielding an attribute, (c) analyzing the data to identify a confounding characteristic in the data, (d) calculating a qualitative measure of the attribute, t...

Full description

Saved in:
Bibliographic Details
Main Authors SUNBHANICH, YIEM, MATTHEWS, WARWICK, SCRIFFIGNANO, ANTHONY J, DAVIES, ROBIN FRY
Format Patent
LanguageEnglish
French
Published 20.04.2021
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:There is provided a method that includes (a) receiving data from a data source, (b) attributing the data source in accordance with rules, thus yielding an attribute, (c) analyzing the data to identify a confounding characteristic in the data, (d) calculating a qualitative measure of the attribute, thus yielding a weighted attribute, (e) calculating a qualitative measure of the confounding characteristic, thus yielding a weighted confounding characteristic, (f) analyzing the weighted attribute and the weighted confounding characteristic, to produce a disposition, (g) filtering the data in accordance with the disposition, thus yielding extracted data, and (h) transmitting the extracted data to a downstream process. There is also provided a system that executes the method, and a storage device that contains instructions for controlling a processor to perform the method. L'invention concerne un procédé consistant (a) à recevoir des données d'une source de données, (b) à attribuer la source de données conformément à des règles, produisant ainsi un attribut, (c) à analyser les données pour identifier une caractéristique de confusion des données, (d) à calculer une mesure qualitative de l'attribut, produisant ainsi un attribut pondéré, (e) à calculer une mesure qualitative de la caractéristique de confusion, produisant ainsi une caractéristique de confusion pondérée, (f) à analyser l'attribut pondéré et la caractéristique de confusion pondérée, pour produire une disposition, (g) à filtrer les données conformément à la disposition, produisant ainsi des données extraites, et (h) à transmettre les données extraites vers un traitement aval. L'invention concerne également un système qui exécute le procédé, et un dispositif de mémorisation qui contient des instructions destinées à commander un processeur pour qu'il mette en uvre le procédé.
Bibliography:Application Number: CA20152959651