Multi-Level Knowledge Injecting for Visual Commonsense Reasoning

When glancing at an image, human can infer what is hidden in the image beyond what is visually obvious, such as objects' functions, people's intents and mental states. However, such a visual reasoning paradigm is tremendously difficult for computer, requiring knowledge about how the world...

Full description

Saved in:

Bibliographic Details
Published in	IEEE transactions on circuits and systems for video technology Vol. 31; no. 3; pp. 1042 - 1054
Main Authors	Wen, Zhang, Peng, Yuxin
Format	Journal Article
Language	English
Published	New York IEEE 01.03.2021 The Institute of Electrical and Electronics Engineers, Inc. (IEEE)
Subjects	Cognition Image recognition Information transfer Knowledge Knowledge based systems Knowledge discovery Knowledge management knowledge representation Object recognition Reasoning Task analysis transfer learning Visual commonsense reasoning visual question answering Visual tasks Visualization
Online Access	Get full text

Cover

Loading…

Be the first to leave a comment!