Search Results - "vision-language model" :: K.UTB vyhledávací portál

Loading…

Alzheimer’s disease recognition using graph neural network by leveraging image-text similarity from vision language model

by Lee, Byounghwa, Bang, Jeong-Uk, Song, Hwa Jeon, Kang, Byung Ok
Published in Scientific reports (06.01.2025)

Get full text

Journal Article

Loading…

Feature distillation from vision-language model for semisupervised action classification

by ÇELİK, ASLI, KÜÇÜKMANİSA, AYHAN, URHAN, OĞUZHAN
Published in Elektrik : Turkish journal of electrical engineering & computer sciences (01.01.2023)

Get full text

Journal Article

Loading…

Cropper: Vision-Language Model for Image Cropping through In-Context Learning

by Lee, Seung Hyun, Jiang, Jijun, Xu, Yiran, Li, Zhuofang, Ke, Junjie, Li, Yinxiao, He, Junfeng, Hickson, Steven, Datsenko, Katie, Kim, Sangpil, Yang, Ming-Hsuan, Essa, Irfan, Yang, Feng
Published in Proceedings (IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Online) (10.06.2025)

Get full text

Conference Proceeding

Loading…

DesignMinds: Enhancing Video-Based Design Ideation with Vision-Language Model and Context-Injected Large Language Model

by He, Tianhao, Stankovic, Andrija, Niforatos, Evangelos, Kortuem, Gerd
Year of Publication 06.11.2024

Get full text

Journal Article

Loading…

Cropper: Vision-Language Model for Image Cropping through In-Context Learning

by Lee, Seung Hyun, Jiang, Jijun, Xu, Yiran, Li, Zhuofang, Ke, Junjie, Li, Yinxiao, He, Junfeng, Hickson, Steven, Datsenko, Katie, Kim, Sangpil, Yang, Ming-Hsuan, Essa, Irfan, Yang, Feng
Year of Publication 14.08.2024

Get full text

Journal Article

Loading…

Standardization of Neuromuscular Reflex Analysis -- Role of Fine-Tuned Vision-Language Model Consortium and OpenAI gpt-oss Reasoning LLM Enabled Decision Support System

by Bandara, Eranga, Gore, Ross, Shetty, Sachin, Mukkamala, Ravi, Rhea, Christopher, Yarlagadda, Atmaram, Kaushik, Shaifali, De Silva, L. H. M. P, Maznychenko, Andriy, Sokolowska, Inna, Hass, Amin, De Zoysa, Kasun
Year of Publication 17.08.2025

Get full text

Journal Article

Loading…

THRONE: An Object-Based Hallucination Benchmark for the Free-Form Generations of Large Vision-Language Models

by Kaul, Prannay, Li, Zhizhong, Yang, Hao, Dukler, Yonatan, Swaminathan, Ashwin, Taylor, C. J., Soatto, Stefano
Published in Proceedings (IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Online) (16.06.2024)

Get full text

Conference Proceeding

Loading…

Coherent Interpretation of Entire Visual Field Test Reports Using a Multimodal Large Language Model (ChatGPT)

by Tan, Jeremy C. K.
Published in Vision (Basel) (11.04.2025)

Get full text

Journal Article

Loading…

OBJECT DETECTION BY LEARNING FROM VISION-LANGUAGE MODEL AND DATA

by Zhang, Hang, Wang, Zhe, Sun, Peize, Ding, Zhuangzhuang
Year of Publication 10.07.2025

Get full text

Patent

Loading…

DesignMinds: Enhancing Video-Based Design Ideation with Vision-Language Model and Context-Injected Large Language Model

by He, Tianhao, Stankovic, Andrija, Niforatos, Evangelos, Kortuem, Gerd
Published in arXiv.org (06.11.2024)

Get full text

Paper

Loading…

Cropper: Vision-Language Model for Image Cropping through In-Context Learning

by Lee, Seung Hyun, Ke, Junjie, Li, Yinxiao, He, Junfeng, Hickson, Steven, Datsenko, Katie, Kim, Sangpil, Ming-Hsuan Yang, Essa, Irfan, Yang, Feng
Published in arXiv.org (14.08.2024)

Get full text

Paper

Loading…

VISUAL INSPECTION METHOD AND RATIONALE-GENERATIVE ESTIMATION METHOD USING LARGE VISION-LANGUAGE MODEL

by KATO Kunihito, YOSHIDA Haruto, NAKATSUKA Shunsuke, YAMADA Yusei, HAYASHI Yoshikazu, AIZAWA Hiroaki, UENO Shiryu, TAKI Yukiya, OSHITA Takumi, TERADA Kazunori
Year of Publication 05.06.2025

Get full text

Patent

Loading…

Alifuse: Aligning and Fusing Multimodal Medical Data for Computer-Aided Diagnosis

by Chen, Qiuhui, Hong, Yi
Published in Proceedings (IEEE International Conference on Bioinformatics and Biomedicine) (03.12.2024)

Get full text

Conference Proceeding

Loading…

A novel approach with vision-language models for custom e-commerce product listings

by Huynh Ngoc Nhu, Y, Nguyen, Quoc-Dung, Kingkan, Cherdsak
Published in Multimedia tools and applications (30.04.2025)

Get full text

Journal Article

Loading…

SocialCounterfactuals: Probing and Mitigating Intersectional Social Biases in Vision-Language Models with Counterfactual Examples

by Howard, Phillip, Madasu, Avinash, Le, Tiep, Moreno, Gustavo Lujan, Bhiwandiwalla, Anahita, Lal, Vasudev
Published in Proceedings (IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Online) (16.06.2024)

Get full text

Conference Proceeding

Loading…

Vision Language Models are Biased

by Vo, An, Nguyen, Khai-Nguyen, Taesiri, Mohammad Reza, Dang, Vy Tuong, Nguyen, Anh Totti, Kim, Daeyoung
Year of Publication 29.05.2025

Get full text

Journal Article

Loading…

Low-Rank Few-Shot Adaptation of Vision-Language Models

by Zanella, Maxime, Ayed, Ismail Ben
Published in IEEE Computer Society Conference on Computer Vision and Pattern Recognition workshops (17.06.2024)

Get full text

Conference Proceeding

Loading…

What matters when building vision-language models?

by Laurençon, Hugo, Tronchon, Léo, Cord, Matthieu, Sanh, Victor
Year of Publication 03.05.2024

Get full text

Journal Article

Loading…

VisTW: Benchmarking Vision-Language Models for Traditional Chinese in Taiwan

by Tam, Zhi Rui, Pai, Ya-Ting, Lee, Yen-Wei, Chen, Yun-Nung
Year of Publication 13.03.2025

Get full text

Journal Article

Loading…

Behavioral Bias of Vision-Language Models: A Behavioral Finance View

by Xiao, Yuhang, Lin, Yudi, Chiu, Ming-Chang
Year of Publication 23.09.2024

Get full text

Journal Article

Refine Results

Format

Subject Area

Topic

Language

Year of Publication

Database