FORM DATA SEARCH SYSTEM, FORM DATA SEARCH METHOD, AND FORM DATA SEARCH PROGRAM

To provide a form data search system, a form data search method, and a form data search program capable of easily and exactly extracting necessary information from form data being electronic data.SOLUTION: In table item name model creation means 14, a word phrase relevancy model 26 composed of a plu...

Full description

Saved in:
Bibliographic Details
Main Authors KATO YASUKI, ICHIDA ETSUKO, TSUJI TAKATOSHI
Format Patent
LanguageEnglish
Japanese
Published 24.06.2022
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:To provide a form data search system, a form data search method, and a form data search program capable of easily and exactly extracting necessary information from form data being electronic data.SOLUTION: In table item name model creation means 14, a word phrase relevancy model 26 composed of a plurality of word phrases assumed to be contained in form data CD and information indicating a degree of relevancy of the word phrases with each other. The table item name model creation means 14: acquires a designated item name from an item name dictionary 24; extracts, as an item name candidate, word phrases having a degree of relevancy of a fixed degree or higher with the designated item name by using the word phrase relevancy model 26; calculates a probability of matching of the extracted item name candidate and the designated item name; and creates a table item name model 28. Item name block extracting means 16 and contents block extracting means 18 extract an item name block BR1 in which specific data TD are stored and a contents block BR2 by using the table item name model 28 and the item name dictionary 24.SELECTED DRAWING: Figure 1 【課題】電子データである帳票データの中から、必要な情報を容易且つ的確に抽出できる帳票データ検索システムと帳票データ検索方法及び帳票データ検索プログラムを提供する。【解決手段】表項目名モデル作成手段14には、帳票データCDに含まれると想定される複数の語句と、当該語句同士の関連度を示す情報とで構成される語句関連性モデル26が設定される。表項目名モデル作成手段14は、項目名辞書24から指定項目名を取得し、語句関連性モデル26を使用して、指定項目名と一定以上の関連度を有する語句を項目名候補として抽出するとともに、抽出した項目名候補が指定項目名に合致する確率値を算出し、項目名候補と確率値とを紐付けした表項目名モデル28を作成する。項目名ブロック抽出手段16及び内容ブロック抽出手段18は、表項目名モデル28及び項目名辞書24を使用して、特定データTDが格納された項目名ブロックBR1及び内容ブロックBR2を抽出する。【選択図】図1
Bibliography:Application Number: JP20200206474