Search Results - "multimodal large language model" :: K.UTB vyhledávací portál | TBU Library Retrieval Portal

Vyzkoušejte nový nástroj s podporou AI Summon Research Assistant BETA

Cover Image

An fMRI visual neural encoding method with multimodal large language model

by Ma, Shuxiao, Wang, Linyuan, Hou, Libin, Hou, Senbao, Yan, Bin
Published in Knowledge-based systems (27.09.2025)

Get full text

Journal Article

Cover Image

Coherent Interpretation of Entire Visual Field Test Reports Using a Multimodal Large Language Model (ChatGPT)

by Tan, Jeremy C. K.
Published in Vision (Basel) (11.04.2025)

Get full text

Journal Article

Cover Image

Next Token Is Enough: Realistic Image Quality and Aesthetic Scoring with Multimodal Large Language Model

by Li, Mingxing, Wang, Rui, Sun, Lei, Bai, Yancheng, Chu, Xiangxiang
Year of Publication 08.03.2025

Get full text

Journal Article

Cover Image

Visual Commonsense Causal Reasoning From a Still Image

by Wu, Xiaojing, Guo, Rui, Li, Qin, Zhu, Ning
Published in IEEE access (2025)

Get full text

Journal Article

Cover Image

Art appreciation based on graph retrieval augmented generation and few-shot learning

by LIU Tianyang, KOU Sijia, JIN Xu, WANG Wenjing, LU Xuesong
Published in 大数据 (01.09.2025)

Get full text

Journal Article

Cover Image

Art appreciation based on graph retrieval augmented generation and few-shot learning

by LIU Tianyang, KOU Sijia, JIN Xu, WANG Wenjing, LU Xuesong
Published in 大数据 (01.01.2025)

Get full text

Journal Article

Cover Image

GSVA: Generalized Segmentation via Multimodal Large Language Models

by Xia, Zhuofan, Han, Dongchen, Han, Yizeng, Pan, Xuran, Song, Shiji, Huang, Gao
Published in Proceedings (IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Online) (16.06.2024)

Get full text

Conference Proceeding

Cover Image

Analyzing the performance of multimodal large language models on visually-based questions in the Japanese National Examination for Dental Technicians

by Mine, Yuichi, Taji, Tsuyoshi, Okazaki, Shota, Takeda, Saori, Peng, Tzu-Yu, Shimoe, Saiji, Kaku, Masato, Nikawa, Hiroki, Kakimoto, Naoya, Murayama, Takeshi
Published in Journal of dental sciences (2025)

Get full text

Journal Article

Cover Image

MMMU: A Massive Multi-Discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI

by Yue, Xiang, Ni, Yuansheng, Zheng, Tianyu, Zhang, Kai, Liu, Ruoqi, Zhang, Ge, Stevens, Samuel, Jiang, Dongfu, Ren, Weiming, Sun, Yuxuan, Wei, Cong, Yu, Botao, Yuan, Ruibin, Sun, Renliang, Yin, Ming, Zheng, Boyuan, Yang, Zhenzhu, Liu, Yibo, Huang, Wenhao, Sun, Huan, Su, Yu, Chen, Wenhu
Published in Proceedings (IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Online) (16.06.2024)

Get full text

Conference Proceeding

Cover Image

MM-R1: Unleashing the Power of Unified Multimodal Large Language Models for Personalized Image Generation

by Liang, Qian, Wu, Yujia, Li, Kuncheng, Wei, Jiwei, He, Shiyuan, Guo, Jinyu, Xie, Ning
Year of Publication 26.08.2025

Get full text

Journal Article

Cover Image

MME-SCI: A Comprehensive and Challenging Science Benchmark for Multimodal Large Language Models

by Ruan, Jiacheng, Jiang, Dan, Gao, Xian, Liu, Ting, Fu, Yuzhuo, Kang, Yangyang
Year of Publication 19.08.2025

Get full text

Journal Article

Cover Image

GSVA: Generalized Segmentation via Multimodal Large Language Models

by Xia, Zhuofan, Han, Dongchen, Han, Yizeng, Pan, Xuran, Song, Shiji, Huang, Gao
Year of Publication 14.12.2023

Get full text

Journal Article

Cover Image

Towards Zero-Shot Differential Morphing Attack Detection with Multimodal Large Language Models

by Shekhawat, Ria, Li, Hailin, Ramachandra, Raghavendra, Venkatesh, Sushma
Published in IEEE International Conference and Workshops on Automatic Face and Gesture Recognition : FG (26.05.2025)

Get full text

Conference Proceeding

Cover Image

Towards Zero-Shot Differential Morphing Attack Detection with Multimodal Large Language Models

by Shekhawat, Ria, Li, Hailin, Ramachandra, Raghavendra, Venkatesh, Sushma
Year of Publication 21.05.2025

Get full text

Journal Article

Cover Image

Kosmos-G: Generating Images in Context with Multimodal Large Language Models

by Pan, Xichen, Dong, Li, Huang, Shaohan, Peng, Zhiliang, Chen, Wenhu, Wei, Furu
Year of Publication 04.10.2023

Get full text

Journal Article

Cover Image

Gemini Goes to Med School: Exploring the Capabilities of Multimodal Large Language Models on Medical Challenge Problems & Hallucinations

by Pal, Ankit, Sankarasubbu, Malaikannan
Year of Publication 10.02.2024

Get full text

Journal Article

Cover Image

GSVA: Generalized Segmentation via Multimodal Large Language Models

by Xia, Zhuofan, Han, Dongchen, Han, Yizeng, Pan, Xuran, Song, Shiji, Huang, Gao
Published in arXiv.org (21.03.2024)

Get full text

Paper

Cover Image

Kosmos-G: Generating Images in Context with Multimodal Large Language Models

by Pan, Xichen, Li, Dong, Huang, Shaohan, Peng, Zhiliang, Chen, Wenhu, Furu Wei
Published in arXiv.org (15.03.2024)

Get full text

Paper

Cover Image

Gemini Goes to Med School: Exploring the Capabilities of Multimodal Large Language Models on Medical Challenge Problems & Hallucinations

by Pal, Ankit, Sankarasubbu, Malaikannan
Published in arXiv.org (10.02.2024)

Get full text

Paper

Cover Image

AV-FOS: A Transformer-Based Audio-Visual Multi-modal Interaction Style Recognition for Children with Autism Based on the Family Observation Schedule (FOS-II)

by Zhao, Zhenhao, Chung, Eunsun, Chung, Kyong-Mee, Park, Chung Hyuk
Published in IEEE journal of biomedical and health informatics (13.02.2025)

Get full text

Journal Article