Search Results - "ZHAO ZIJIA" :: K.UTB vyhledávací portál

SC-Tune: Unleashing Self-Consistent Referential Comprehension in Large Vision Language Models

by Yue, Tongtian, Cheng, Jie, Guo, Longteng, Dai, Xingyuan, Zhao, Zijia, He, Xingjian, Xiong, Gang, Lv, Yisheng, Liu, Jing
Year of Publication 19.03.2024

Get full text

Journal Article

Loading…

Exploring the Design Space of Visual Context Representation in Video MLLMs

by Du, Yifan, Huo, Yuqi, Zhou, Kun, Zhao, Zijia, Lu, Haoyu, Huang, Han, Zhao, Wayne Xin, Wang, Bingning, Chen, Weipeng, Wen, Ji-Rong
Year of Publication 17.10.2024

Get full text

Journal Article

Loading…

Oxygenation clothes

by ZHAO ZIJIA
Year of Publication 04.01.2022

Get full text

Patent

Loading…

Device for collecting extruded drainage liquid of drainage bag

by ZHAO ZIJIA
Year of Publication 04.01.2022

Get full text

Patent

Loading…

Towards Event-oriented Long Video Understanding

by Du, Yifan, Zhou, Kun, Huo, Yuqi, Li, Yifan, Zhao, Wayne Xin, Lu, Haoyu, Zhao, Zijia, Wang, Bingning, Chen, Weipeng, Wen, Ji-Rong
Year of Publication 20.06.2024

Get full text

Journal Article

Loading…

ChatSearch: a Dataset and a Generative Retrieval Model for General Conversational Image Retrieval

by Zhao, Zijia, Guo, Longteng, Tongtian Yue, Hu, Erdong, Shao, Shuai, Yuan, Zehuan, Huang, Hua, Liu, Jing
Published in arXiv.org (24.10.2024)

Get full text

Paper

Loading…

OneDiff: A Generalist Model for Image Difference Captioning

by Hu, Erdong, Guo, Longteng, Tongtian Yue, Zhao, Zijia, Xue, Shuning, Liu, Jing
Published in arXiv.org (16.07.2024)

Get full text

Paper

Loading…

VL-Mamba: Exploring State Space Models for Multimodal Learning

by Qiao, Yanyuan, Zheng, Yu, Guo, Longteng, Chen, Sihan, Zhao, Zijia, Sun, Mingzhen, Wu, Qi, Liu, Jing
Published in arXiv.org (20.03.2024)

Get full text

Paper

Loading…

Beyond Literal Descriptions: Understanding and Locating Open-World Objects Aligned with Human Intentions

by Wang, Wenxuan, Zhang, Yisi, He, Xingjian, Yan, Yichen, Zhao, Zijia, Wang, Xinlong, Liu, Jing
Published in arXiv.org (17.02.2024)

Get full text

Paper

Loading…

Needle In A Video Haystack: A Scalable Synthetic Evaluator for Video MLLMs

by Zhao, Zijia, Lu, Haoyu, Huo, Yuqi, Du, Yifan, Tongtian Yue, Guo, Longteng, Wang, Bingning, Chen, Weipeng, Liu, Jing
Published in arXiv.org (24.10.2024)

Get full text

Paper

Loading…

Beyond Filtering: Adaptive Image-Text Quality Enhancement for MLLM Pretraining

by Huang, Han, Huo, Yuqi, Zhao, Zijia, Lu, Haoyu, Wu, Shu, Wang, Bingning, Liu, Qiang, Chen, Weipeng, Wang, Liang
Published in arXiv.org (21.10.2024)

Get full text

Paper

Loading…

OPT: Omni-Perception Pre-Trainer for Cross-Modal Understanding and Generation

by Liu, Jing, Zhu, Xinxin, Liu, Fei, Guo, Longteng, Zhao, Zijia, Sun, Mingzhen, Wang, Weining, Lu, Hanqing, Zhou, Shiyu, Zhang, Jiajun, Wang, Jinqiao
Year of Publication 01.07.2021

Get full text

Journal Article

Loading…

VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset

by Chen, Sihan, Li, Handong, Wang, Qunbo, Zhao, Zijia, Sun, Mingzhen, Zhu, Xinxin, Liu, Jing
Published in arXiv.org (29.05.2023)

Get full text

Paper

Loading…

ChatBridge: Bridging Modalities with Large Language Model as a Language Catalyst

by Zhao, Zijia, Guo, Longteng, Tongtian Yue, Chen, Sihan, Shao, Shuai, Zhu, Xinxin, Yuan, Zehuan, Liu, Jing
Published in arXiv.org (25.05.2023)

Get full text

Paper

Loading…

SC-Tune: Unleashing Self-Consistent Referential Comprehension in Large Vision Language Models

by Tongtian Yue, Cheng, Jie, Guo, Longteng, Dai, Xingyuan, Zhao, Zijia, He, Xingjian, Xiong, Gang, Lv, Yisheng, Liu, Jing
Published in arXiv.org (20.03.2024)

Get full text

Paper

Loading…

Exploring the Design Space of Visual Context Representation in Video MLLMs

by Du, Yifan, Huo, Yuqi, Zhou, Kun, Zhao, Zijia, Lu, Haoyu, Huang, Han, Wayne Xin Zhao, Wang, Bingning, Chen, Weipeng, Ji-Rong, Wen
Published in arXiv.org (17.10.2024)

Get full text

Paper

Loading…

Accelerator-driven subcritical tritium production reactor core

by ZHAO ZIJIA, CHEN ZHONG, ZHAO MAN
Year of Publication 15.03.2024

Get full text

Patent

Loading…

Towards Event-oriented Long Video Understanding

by Du, Yifan, Zhou, Kun, Huo, Yuqi, Li, Yifan, Wayne Xin Zhao, Lu, Haoyu, Zhao, Zijia, Wang, Bingning, Chen, Weipeng, Ji-Rong, Wen
Published in arXiv.org (20.06.2024)

Get full text

Paper