INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND PROGRAM

The present invention comprises: a word expression model construction unit 13 which extracts a plurality of words from document data, calculates a characteristic value for each of the plurality of words, and constructs a word expression model that includes the characteristic values of the plurality...

Full description

Saved in:
Bibliographic Details
Main Authors YAMAMOTO Taizo, MIYOSHI Yu, UTAHARA Takashi, NISHIO Manabu, MORIYA Takaaki
Format Patent
LanguageEnglish
French
Japanese
Published 03.03.2022
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:The present invention comprises: a word expression model construction unit 13 which extracts a plurality of words from document data, calculates a characteristic value for each of the plurality of words, and constructs a word expression model that includes the characteristic values of the plurality of words; a word similarity score calculation unit 14 which calculates a word similarity score between pairs of words included in the plurality of words; a word similarity score matrix calculation unit 15 which generates a word similarity score matrix with respect to the plurality of words, with the word similarity scores between the pairs of words as matrix elements; a waveform similarity score calculation unit 18 which uses time series data, in which a prescribed type of time variable pertaining to a plurality of items respectively corresponding to the plurality of words is represented as a waveform, to calculate a waveform similarity score between the waveforms of pairs of items included in the plurality of items; a waveform similarity score matrix calculation unit 19 which generates a waveform similarity score matrix with respect to the plurality of items, with the waveform similarity scores between the waveforms of the pairs of items as matrix elements; and a difference calculation unit 20 which calculates a difference between the word similarity score matrix and the waveform similarity score matrix as an unexpected correlation score between items. La présente invention comprend : une unité de construction de modèle d'expression de mots (13) qui extrait une pluralité de mots à partir de données de document, calcule une valeur caractéristique pour chacun de la pluralité de mots, et construit un modèle d'expression de mots qui comprend les valeurs caractéristiques de la pluralité de mots ; une unité de calcul de score de similarité de mots (14) qui calcule un score de similarité de mots entre des paires de mots incluses dans la pluralité de mots ; une unité de calcul de matrice de scores de similarité de mots (15) qui génère une matrice de scores de similarité de mots par rapport à la pluralité de mots, avec les scores de similarité de mots entre les paires de mots en tant qu'éléments de matrice ; une unité de calcul de score de similarité de formes d'onde (18) qui utilise des données de série temporelle, dans lesquelles un type prescrit de variable de temps se rapportant à une pluralité d'éléments correspondant respectivement à la pluralité de mots est représenté sous la forme d'une forme d'onde, pour calculer un score de similarité de formes d'onde entre les formes d'onde de paires d'éléments incluses dans la pluralité d'éléments ; une unité de calcul de matrice de scores de similarité de formes d'onde (19) qui génère une matrice de scores de similarité de formes d'onde par rapport à la pluralité d'éléments, avec les scores de similarité de formes d'onde entre les formes d'onde des paires d'éléments en tant qu'éléments de matrice ; et une unité de calcul de différence (20) qui calcule une différence entre la matrice de scores de similarité de mots et la matrice de scores de similarité de formes d'onde en tant que score de corrélation inattendue entre des éléments. 文書データから複数の単語を抽出し、前記複数の単語の特徴値をそれぞれ計算し、前記複数の単語の特徴値を含む単語表現モデルを構築する単語表現モデル構築部13と、前記複数の単語に含まれる2単語間の単語類似度をそれぞれ計算する単語類似度計算部14と、前記複数の単語について前記2単語間の単語類似度のそれぞれを行列の要素とする単語類似度行列を生成する単語類似度行列計算部15と、前記複数の単語に対応する複数の品目に関する所定種類の時間変動値を波形で示した時系列データを用いて、前記複数の品目に含まれる2品目の波形間の波形類似度をそれぞれ計算する波形類似度計算部18と、前記複数の品目について前記2品目の波形間の波形類似度のそれぞれを行列の要素とする波形類似度行列を生成する波形類似度行列計算部19と、前記単語類似度行列と前記波形類似度行列との差を品目間の相関の意外度として計算する差分計算部20と、を備える。
Bibliography:Application Number: WO2020JP31997