SELECTIVELY GENERATING WORD VECTOR AND PARAGRAPH VECTOR REPRESENTATIONS OF FIELDS FOR MACHINE LEARNING

Word vectors are multi-dimensional vectors that represent words in a corpus of text and that are embedded in a semantically-encoded vector space; paragraph vectors extend word vectors to represent, in the same semantically-encoded space, the overall semantic content and context of a phrase, sentence...

Full description

Saved in:
Bibliographic Details
Main Authors GOVINDARAJAN, KANNAN, GANAPATHY, CHITRABHARATHI, JAYARAMAN, BASKAR, THAKUR, ANIRUDDHA MADHUSUDAN, RAMANNA, SHIVA SHANKAR
Format Patent
LanguageEnglish
French
Published 28.12.2021
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:Word vectors are multi-dimensional vectors that represent words in a corpus of text and that are embedded in a semantically-encoded vector space; paragraph vectors extend word vectors to represent, in the same semantically-encoded space, the overall semantic content and context of a phrase, sentence, paragraph, or other multi-word sample of text. Word and paragraph vectors can be used for sentiment analysis, comparison of the topic or content of samples of text, or other natural language processing tasks. However, the generation of word and paragraph vectors can be computationally expensive. Accordingly, word and paragraph vectors can be determined only for user-specified subsets of fields of incident reports in a database. Les plongements lexicaux sont des plongements multidimensionnels qui représentent des termes qui figurent dans un corpus de texte et qui sont intégrés à un espace vectoriel encodé par encodage sémantique. Des plongements de paragraphe sajoutent aux plongements lexicaux pour représenter le contenu sémantique total ainsi que le contenu dune phrase, dun paragraphe ou dun échantillon de texte ayant plusieurs mots, et ce, dans le même espace encodé par encodage sémantique. Les plongements lexicaux et les plongements de paragraphe peuvent servir aux fins danalyse de sentiments, de comparaison du sujet ou du contenu déchantillons de textes ou dautres tâches de traitement des langues naturelles. Toutefois, la génération de plongements lexicaux et de plongements de paragraphe peut être très exigeante pour lordinateur. Par conséquent, les plongements lexicaux et les plongements de paragraphe peuvent seulement être déterminés pour des sous-ensembles de champs de rapports dincident précisés par lutilisateur qui figurent dans une base de données.
Bibliography:Application Number: CA20193055823