Search Results - "HUANG SITENG" :: K.UTB vyhledávací portál

Sparse-Tuning: Adapting Vision Transformers with Efficient Fine-tuning and Inference

by Liu, Ting, Liu, Xuyang, Huang, Siteng, Shi, Liangtao, Xu, Zunnan, Xin, Yi, Yin, Quanjun, Liu, Xiaohong
Year of Publication 23.05.2024

Get full text

Journal Article

Loading…

DARA: Domain- and Relation-aware Adapters Make Parameter-efficient Tuning for Visual Grounding

by Liu, Ting, Liu, Xuyang, Huang, Siteng, Chen, Honggang, Yin, Quanjun, Qin, Long, Wang, Donglin, Hu, Yue
Year of Publication 09.05.2024

Get full text

Journal Article

Loading…

Tree Structure-Aware Few-Shot Image Classification via Hierarchical Aggregation

by Zhang, Min, Huang, Siteng, Li, Wenbin, Wang, Donglin
Year of Publication 14.07.2022

Get full text

Journal Article

Loading…

Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference

by Zhao, Han, Zhang, Min, Zhao, Wei, Ding, Pengxiang, Huang, Siteng, Wang, Donglin
Year of Publication 21.03.2024

Get full text

Journal Article

Loading…

QUAR-VLA: Vision-Language-Action Model for Quadruped Robots

by Ding, Pengxiang, Zhao, Han, Song, Wenxuan, Zhang, Wenjie, Zhang, Min, Huang, Siteng, Yang, Ningxi, Wang, Donglin
Year of Publication 22.12.2023

Get full text

Journal Article

Loading…

Prompt-based Distribution Alignment for Unsupervised Domain Adaptation

by Bai, Shuanghao, Zhang, Min, Zhou, Wanqi, Huang, Siteng, Luan, Zhirong, Wang, Donglin, Chen, Badong
Year of Publication 15.12.2023

Get full text

Journal Article

Loading…

Check, Locate, Rectify: A Training-Free Layout Calibration System for Text-to-Image Generation

by Gong, Biao, Huang, Siteng, Feng, Yutong, Zhang, Shiwei, Li, Yuyuan, Liu, Yu
Year of Publication 27.11.2023

Get full text

Journal Article

Loading…

Learning Disentangled Identifiers for Action-Customized Text-to-Image Generation

by Huang, Siteng, Gong, Biao, Feng, Yutong, Chen, Xi, Fu, Yuqian, Liu, Yu, Wang, Donglin
Year of Publication 27.11.2023

Get full text

Journal Article

Loading…

Troika: Multi-Path Cross-Modal Traction for Compositional Zero-Shot Learning

by Huang, Siteng, Gong, Biao, Feng, Yutong, Zhang, Min, Lv, Yiliang, Wang, Donglin
Year of Publication 27.03.2023

Get full text

Journal Article

Loading…

Pareto Self-Supervised Training for Few-Shot Learning

by Chen, Zhengyu, Ge, Jixie, Zhan, Heshen, Huang, Siteng, Wang, Donglin
Year of Publication 15.04.2021

Get full text

Journal Article

Loading…

VoP: Text-Video Co-operative Prompt Tuning for Cross-Modal Retrieval

by Huang, Siteng, Gong, Biao, Pan, Yulin, Jiang, Jianwen, Lv, Yiliang, Li, Yuyuan, Wang, Donglin
Year of Publication 23.11.2022

Get full text

Journal Article

Loading…

Reference-Limited Compositional Zero-Shot Learning

by Huang, Siteng, Qiyao Wei, Wang, Donglin
Published in arXiv.org (29.04.2023)

Get full text

Paper

Loading…

Accelerating Diffusion Transformers with Token-wise Feature Caching

by Zou, Chang, Liu, Xuyang, Liu, Ting, Huang, Siteng, Zhang, Linfeng
Published in arXiv.org (14.10.2024)

Get full text

Paper

Loading…

Attributes-Guided and Pure-Visual Attention Alignment for Few-Shot Recognition

by Huang, Siteng, Zhang, Min, Kang, Yachen, Wang, Donglin
Year of Publication 10.09.2020

Get full text

Journal Article

Loading…

Focus-Consistent Multi-Level Aggregation for Compositional Zero-Shot Learning

by Dai, Fengyuan, Huang, Siteng, Zhang, Min, Gong, Biao, Wang, Donglin
Published in arXiv.org (30.08.2024)

Get full text

Paper

Loading…

VGDiffZero: Text-to-image Diffusion Models Can Be Zero-shot Visual Grounders

by Liu, Xuyang, Huang, Siteng, Kang, Yachen, Chen, Honggang, Wang, Donglin
Published in arXiv.org (23.01.2024)

Get full text

Paper

Loading…

$M$^2$IST: Multi-Modal Interactive Side-Tuning for Efficient Referring Expression Comprehension$

M$^2$IST: Multi-Modal Interactive Side-Tuning for Efficient Referring Expression Comprehension

by Liu, Xuyang, Liu, Ting, Huang, Siteng, Yi, Xin, Hu, Yue, Yin, Quanjun, Wang, Donglin, Chen, Honggang
Published in arXiv.org (29.10.2024)

Get full text

Paper

Loading…

ProFD: Prompt-Guided Feature Disentangling for Occluded Person Re-Identification

by Cui, Can, Huang, Siteng, Song, Wenxuan, Ding, Pengxiang, Zhang, Min, Wang, Donglin
Published in arXiv.org (30.09.2024)

Get full text

Paper

Loading…

PiTe: Pixel-Temporal Alignment for Large Video-Language Model

by Liu, Yang, Ding, Pengxiang, Huang, Siteng, Zhang, Min, Zhao, Han, Wang, Donglin
Published in arXiv.org (11.09.2024)

Get full text

Paper

Loading…

Sparse-Tuning: Adapting Vision Transformers with Efficient Fine-tuning and Inference

by Liu, Ting, Liu, Xuyang, Huang, Siteng, Shi, Liangtao, Xu, Zunnan, Yi, Xin, Yin, Quanjun, Liu, Xiaohong
Published in arXiv.org (29.08.2024)

Get full text

Paper

Refine Results

Format

Subject Area

Topic

Language

Year of Publication

Database