LINGUISTIC SCHEMA MAPPING VIA SEMI-SUPERVISED LEARNING

Linguistic schema mapping via semi-supervised learning is used to map a customer schema to a particular industry-specific schema (ISS). The customer schema is received and a corresponding ISS is identified. An attribute in the customer schema is selected for labeling. Candidate pairs are generated t...

Full description

Saved in:
Bibliographic Details
Main Authors MUELLER, Andreas C, FLORATOU, Avrilia, BANDA, Dalitso Hansini, CAHOON, Joyce Yu, ZHANG, Yunjia, KRISHNAN, Subramaniam Venkatraman, PSALLIDAS, Fotis, PATEL, Jignesh M
Format Patent
LanguageEnglish
French
Published 07.12.2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:Linguistic schema mapping via semi-supervised learning is used to map a customer schema to a particular industry-specific schema (ISS). The customer schema is received and a corresponding ISS is identified. An attribute in the customer schema is selected for labeling. Candidate pairs are generated that include the first attribute and one or more second attributes which may describe the first attribute. A featurizer determines similarities between the first attribute and second attribute in each generated pair, one or more suggested labels are generated by a machine learning (ML) model, and one of the suggested labels is applied to the first attribute. Un mappage de schéma linguistique par apprentissage semi-supervisé est utilisé pour mapper un schéma de client à un schéma spécifique à l'industrie particulier (ISS). Le schéma de client est reçu et un ISS correspondant est identifié. Un attribut dans le schéma de client est sélectionné pour le marquage. Des paires candidates sont générées qui comprennent le premier attribut et un ou plusieurs seconds attributs qui peuvent décrire le premier attribut. Un caractériseur détermine des similarités entre le premier attribut et le second attribut dans chaque paire générée, une ou plusieurs étiquettes suggérées sont générées par un modèle d'apprentissage automatique (ML), et l'une des étiquettes suggérées est appliquée au premier attribut.
Bibliography:Application Number: WO2023US18246