DATA SPECIFICATION PROGRAM, DATA SPECIFICATION METHOD, AND INFORMATION PROCESSING APPARATUS

PROBLEM TO BE SOLVED: To accurately specify the position of information on a screen of a site acquired from the site.SOLUTION: An information processing apparatus 101 searches html data on a screen of a site S for text data having the same content as that of text data, which is obtained from image d...

Full description

Saved in:
Bibliographic Details
Main Authors TAKAHASHI MIEKO, SAITO NOBUHIRO, MAEHARA HARUNA, OI NAO, TANABE HIROYASU, TAKAOKA AKI, ISHII TOSHIHIRO, SASAGE HIROSHI
Format Patent
LanguageEnglish
Japanese
Published 25.06.2015
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:PROBLEM TO BE SOLVED: To accurately specify the position of information on a screen of a site acquired from the site.SOLUTION: An information processing apparatus 101 searches html data on a screen of a site S for text data having the same content as that of text data, which is obtained from image data on an area T set on image data on the screen of the site S. When a plurality of pieces of text data are searched for, the information processing apparatus 101 changes any one of text data on a plurality of pieces of text data in the html data on the screen of the site S into different text data. The information processing apparatus 101 determines whether or not text data obtained from image data on the area T on image data on the screen of the site S based on the html data on the site S after the change coincides with the changed different text data. The information processing apparatus 101 specifies the text data corresponding to the area T from the plurality of pieces of text data in the html data on the screen of the site S on the basis of a result of the determination. 【課題】サイトの画面情報における、サイトから取得する情報の位置を正確に特定すること。【解決手段】情報処理装置101は、サイトSの画面の画像データ上に設定された領域Tの画像データから得られるテキストデータと同一内容のテキストデータを、サイトSの画面のhtmlデータから検索する。情報処理装置101は、複数のテキストデータが検索された場合、サイトSの画面のhtmlデータ内の複数のテキストデータのいずれかのテキストデータを異なるテキストデータに変更する。情報処理装置101は、変更後のサイトSのhtmlデータに基づくサイトSの画面の画像データ上の領域Tの画像データから得られるテキストデータが、変更した異なるテキストデータと一致するか否かを判定する。情報処理装置101は、判定した判定結果に基づいて、サイトSの画面のhtmlデータ内の複数のテキストデータから領域Tに対応するテキストデータを特定する。【選択図】図1
Bibliography:Application Number: JP20130262166