Search Results - "LU YUMAO" :: K.UTB vyhledávací portál

Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks

by Xiao, Bin, Wu, Haiping, Xu, Weijian, Dai, Xiyang, Hu, Houdong, Lu, Yumao, Zeng, Michael, Liu, Ce, Lu, Yuan
Published in arXiv.org (10.11.2023)

Get full text

Paper

Loading…

Providing recommended contents

by Lu, Yumao, Deng, Yongjian, Shou, Linjun, Zhou, Jie, Fan, Baoquan, Pan, Jun, Cai, Wenbin
Year of Publication 08.11.2022

Get full text

Patent

Loading…

An Empirical Study of GPT-3 for Few-Shot Knowledge-Based VQA

by Yang, Zhengyuan, Gan, Zhe, Wang, Jianfeng, Hu, Xiaowei, Lu, Yumao, Liu, Zicheng, Wang, Lijuan
Published in arXiv.org (14.09.2022)

Get full text

Paper

Loading…

UniTAB: Unifying Text and Box Outputs for Grounded Vision-Language Modeling

by Yang, Zhengyuan, Gan, Zhe, Wang, Jianfeng, Hu, Xiaowei, Ahmed, Faisal, Liu, Zicheng, Lu, Yumao, Wang, Lijuan
Published in arXiv.org (27.07.2022)

Get full text

Paper

Loading…

Search system that provides personalized results

by Lu, Yumao, Krishnamurthi, Priyanka, Deng, Yongjian, Sureshchandra, Bhimani Kalpesh, Parthasarathy, Ashwin Mallur
Year of Publication 24.05.2022

Get full text

Patent

Loading…

Florence: A New Foundation Model for Computer Vision

by Yuan, Lu, Chen, Dongdong, Chen, Yi-Ling, Codella, Noel, Dai, Xiyang, Gao, Jianfeng, Hu, Houdong, Huang, Xuedong, Li, Boxin, Li, Chunyuan, Liu, Ce, Liu, Mengchen, Liu, Zicheng, Lu, Yumao, Shi, Yu, Wang, Lijuan, Wang, Jianfeng, Xiao, Bin, Xiao, Zhen, Yang, Jianwei, Zeng, Michael, Zhou, Luowei, Zhang, Pengchuan
Year of Publication 22.11.2021

Get full text

Journal Article

Loading…

Scaling Up Vision-Language Pre-training for Image Captioning

by Hu, Xiaowei, Gan, Zhe, Wang, Jianfeng, Yang, Zhengyuan, Liu, Zicheng, Lu, Yumao, Wang, Lijuan
Published in arXiv.org (26.03.2022)

Get full text

Paper

Loading…

MM-VID: Advancing Video Understanding with GPT-4V(ision)

by Lin, Kevin, Ahmed, Faisal, Li, Linjie, Chung-Ching, Lin, Azarnasab, Ehsan, Yang, Zhengyuan, Wang, Jianfeng, Lin, Liang, Liu, Zicheng, Lu, Yumao, Liu, Ce, Wang, Lijuan
Published in arXiv.org (30.10.2023)

Get full text

Paper

Loading…

UFO: A UniFied TransfOrmer for Vision-Language Representation Learning

by Wang, Jianfeng, Hu, Xiaowei, Gan, Zhe, Yang, Zhengyuan, Dai, Xiyang, Liu, Zicheng, Lu, Yumao, Wang, Lijuan
Published in arXiv.org (19.11.2021)

Get full text

Paper

Loading…

SwinBERT: End-to-End Transformers with Sparse Attention for Video Captioning

by Lin, Kevin, Li, Linjie, Chung-Ching, Lin, Ahmed, Faisal, Gan, Zhe, Liu, Zicheng, Lu, Yumao, Wang, Lijuan
Published in arXiv.org (18.06.2022)

Get full text

Paper

Loading…

PROVIDING RECOMMENDED CONTENTS

by Lu, Yumao, Deng, Yongjian, Shou, Linjun, Zhou, Jie, Fan, Baoquan, Pan, Jun, Cai, Wenbin
Year of Publication 20.02.2020

Get full text

Patent

Loading…

Florence: A New Foundation Model for Computer Vision

by Lu, Yuan, Chen, Dongdong, Yi-Ling, Chen, Codella, Noel, Dai, Xiyang, Gao, Jianfeng, Hu, Houdong, Huang, Xuedong, Li, Boxin, Li, Chunyuan, Liu, Ce, Liu, Mengchen, Liu, Zicheng, Lu, Yumao, Shi, Yu, Wang, Lijuan, Wang, Jianfeng, Xiao, Bin, Xiao, Zhen, Yang, Jianwei, Zeng, Michael, Zhou, Luowei, Zhang, Pengchuan
Published in arXiv.org (22.11.2021)

Get full text

Paper