INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND PROGRAM

An information processing device (100) according to an embodiment comprises a voice recognition unit (23), an image recognition unit (24), an extraction unit (25), a first correction unit (31), and a second correction unit (30). The voice recognition unit recognizes a plurality of first words (WVa)...

Full description

Saved in:
Bibliographic Details
Main Authors SHIBATA, Tomoko, OGASAWARA, Shiro, SHOJI, Yoshiaki
Format Patent
LanguageEnglish
French
Japanese
Published 13.10.2022
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:An information processing device (100) according to an embodiment comprises a voice recognition unit (23), an image recognition unit (24), an extraction unit (25), a first correction unit (31), and a second correction unit (30). The voice recognition unit recognizes a plurality of first words (WVa) on the basis of a first voice (Va). The image recognition unit recognizes a plurality of second words (WIa) on the basis of a first image (Ia). The extraction unit extracts a third word (WVb) included in the plurality of first words and not included in the plurality of second words and/or a fourth word (WIb) included in the plurality of second words and not included in the plurality of first words. The first correction unit corrects a fifth word (WIc) corresponding to the third word among the plurality of second words to the third word. The second correction unit corrects a sixth word (WVc) corresponding to the fourth word among the plurality of first words to the fourth word. Un dispositif de traitement d'informations (100), selon un mode de réalisation, comprend une unité de reconnaissance de voix (23), une unité de reconnaissance d'image (24), une unité d'extraction (25), une première unité de correction (31) et une seconde unité de correction (30). L'unité de reconnaissance de voix reconnaît une pluralité de premiers mots (WVa) sur la base d'une première voix (Va). L'unité de reconnaissance d'image reconnaît une pluralité de deuxièmes mots (WIa) sur la base d'une première image (Ia). L'unité d'extraction extrait un troisième mot (WVb) compris dans la pluralité de premiers mots et non compris dans la pluralité de deuxièmes mots et/ou un quatrième mot (WIb) compris dans la pluralité de deuxièmes mots et non compris dans la pluralité de premiers mots. La première unité de correction corrige un cinquième mot (WIc) correspondant au troisième mot parmi la pluralité de deuxièmes mots au troisième mot. La seconde unité de correction corrige un sixième mot (WVc) correspondant au quatrième mot parmi la pluralité de premiers mots au quatrième mot. 一実施形態の情報処理装置(100)は、音声認識部(23)と、画像認識部(24)と、抽出部(25)と、第1補正部(31)と、第2補正部(30)と、を備える。音声認識部は、第1音声(Va)に基づいて、複数の第1単語(WVa)を認識する。画像認識部は、第1画像(Ia)に基づいて、複数の第2単語(WIa)を認識する。抽出部は、複数の第1単語に含まれかつ複数の第2単語に含まれない第3単語(WVb)、及び複数の第2単語に含まれかつ複数の第1単語に含まれない第4単語(WIb)の少なくとも1つを抽出する。第1補正部は、複数の第2単語のうち第3単語に対応する第5単語(WIc)を、第3単語に補正する。第2補正部は、複数の第1単語のうち第4単語に対応する第6単語(WVc)を、第4単語に補正する。
Bibliography:Application Number: WO2021JP14619