PERSON PROFILE FINDER USING SEMANTIC SIMILARITY MEASUREMENT OF OBJECT BASED ON INTERNET SOURCE AND RELATED KEYWORDS

The present invention provides a method for profiling an object based on search input. The method comprises receiving (305) the search input of the object to be profiled, the inputs include keywords; harvesting (310) data from internet through a data harvesting bot (110); rotating keywords and pages...

Full description

Saved in:
Bibliographic Details
Main Authors MOHAMED KASSIM, Nardiatul Kasmi, GOON, Wooi Kin, JOHARI, Muhammad Awis Jamaluddin, KOH, May Fern, AMRUDDIN, Amru Yusrin
Format Patent
LanguageEnglish
French
Published 03.02.2022
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:The present invention provides a method for profiling an object based on search input. The method comprises receiving (305) the search input of the object to be profiled, the inputs include keywords; harvesting (310) data from internet through a data harvesting bot (110); rotating keywords and pages through a spiral keyword processor (120) for hopping between targeted pages/sites for avoiding anti-bot mechanisms on the targeted pages/sites; identifying (330) data relevancy based on semantic similarity of the keywords to get most relevant data from the harvested data; identifying (340) the keywords through named entity recognition, NER, processor (140) to extract most relevance data; and outputting (345) the profile of the object in a structured manner with highly relevant data. An object profiling system is also provided. La présente invention concerne un procédé de profilage d'un objet sur la base d'une entrée de recherche. Le procédé consiste à recevoir (305) l'entrée de recherche de l'objet à profiler, les entrées comprenant des mots-clés ; à récolter (310) des données à partir d'Internet par l'intermédiaire d'un robot de récolte de données (110) ; à mettre en rotation les mots-clés et les pages par l'intermédiaire d'un processeur de mots-clés en spirale (120) pour sauter entre des pages/sites ciblés afin d'éviter les mécanismes anti-robot sur les pages/sites ciblés ; à identifier (330) la pertinence des données sur la base de la similarité sémantique des mots-clés afin d'obtenir les données les plus pertinentes à partir des données récoltées ; à identifier (340) les mots-clés par le biais d'un processeur (140) de reconnaissance d'entités nommées (REN) afin d'extraire les données les plus pertinentes ; et à faire sortir (345) le profil de l'objet d'une manière structurée avec des données hautement pertinentes. La présente invention concerne également un système de profile d'objets.
Bibliography:Application Number: WO2020MY50167