INFORMATION GENERATION PROGRAM, DEVICE, METHOD, AND INFORMATION RETRIEVAL PROGRAM, DEVICE, METHOD

Four phases are executed, which are (A) summing from a target file group (F), (B) sorting in the descending order of appearance frequency, (C) extracting until the rank having an intended appearance ratio, and (D) creating a map. (A1) First, an information generation device reads the target file gro...

Full description

Saved in:
Bibliographic Details
Main Author KATAOKA, MASAHIRO
Format Patent
LanguageEnglish
French
Japanese
Published 01.12.2011
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:Four phases are executed, which are (A) summing from a target file group (F), (B) sorting in the descending order of appearance frequency, (C) extracting until the rank having an intended appearance ratio, and (D) creating a map. (A1) First, an information generation device reads the target file group (F) and counts appearance frequencies of basic words. (B1) When the counting of basic words is complete in the target file group (F), the information generation device sorts the basic word appearance frequency table (101) in the descending order of appearance frequency. Namely, the basic words are sorted in the order from highest appearance frequency, and ranked from the basic word having the highest appearance frequency. (C1) Next, the information generation device refers to the sorted (B1) basic word appearance frequency table (101), and extracts basic words until the rank having the intended appearance ratio (Pw). (D1) Lastly, the information generation device generates a specific basic word appearance map (M1) regarding a specific basic word group. La présente invention concerne un procédé selon lequel quatre phases sont exécutées, qui sont: (A) la sommation à partir d'un groupe de fichiers cibles (F), (B) le tri par ordre décroissant de fréquence d'apparition, (C) l'extraction jusqu'au rang présentant un rapport d'apparition prévu, et (D) la création d'une carte. (A1) D'abord, un dispositif d'information effectue la lecture du groupe de fichiers cibles (F) et le comptage des fréquences d'apparition de mots élémentaires. (B1) Lorsque le comptage de mots élémentaires est terminé dans le groupe de fichiers cibles (F), le dispositif de génération d'information effectue le tri d'une table de fréquences d'apparition (101) dans l'ordre décroissant de fréquences d'apparition, à savoir, les mots élémentaires sont triés dans l'ordre depuis la fréquence d'apparition la plus élevée, et classés depuis le mot élémentaire ayant la fréquence d'apparition la plus élevée. (C1) Ensuite, le dispositif de génération se réfère à la table de fréquences d'apparition de mots élémentaires triés (101), et extrait les mots élémentaires jusqu'au rang ayant le rapport d'apparition prévu (Pw). (D1) Enfin, le dispositif de génération d'information génère une carte d'apparitions de mots élémentaires spécifiques (M1) concernant un groupe de mots élémentaires spécifiques.
Bibliography:Application Number: WO2010JP59150