Search Results - "Chen, Zhehuai" :: K.UTB vyhledávací portál

by Żelasko, Piotr, Chen, Zhehuai, Wang, Mengru, Galvez, Daniel, Hrinchuk, Oleksii, Ding, Shuoyang, Hu, Ke, Balam, Jagadeesh, Lavrukhin, Vitaly, Ginsburg, Boris
Published in arXiv.org (20.09.2024)

Get full text

Paper

Loading…

Chain-of-Thought Prompting for Speech Translation

by Hu, Ke, Chen, Zhehuai, Chao-Han, Huck Yang, Żelasko, Piotr, Hrinchuk, Oleksii, Lavrukhin, Vitaly, Balam, Jagadeesh, Ginsburg, Boris
Published in arXiv.org (17.09.2024)

Get full text

Paper

Loading…

BESTOW: Efficient and Streamable Speech Language Model with the Best of Two Worlds in GPT and T5

by Chen, Zhehuai, Huang, He, Hrinchuk, Oleksii, Puvvada, Krishna C, Nithin Rao Koluguri, Żelasko, Piotr, Balam, Jagadeesh, Ginsburg, Boris
Published in arXiv.org (28.06.2024)

Get full text

Paper

Loading…

DeSTA: Enhancing Speech Language Models through Descriptive Speech-Text Alignment

by Ke-Han, Lu, Chen, Zhehuai, Szu-Wei Fu, Huang, He, Ginsburg, Boris, Yu-Chiang, Frank Wang, Hung-yi, Lee
Published in arXiv.org (27.06.2024)

Get full text

Paper

Loading…

Progressive Joint Modeling in Unsupervised Single-channel Overlapped Speech Recognition

by Chen, Zhehuai, Droppo, Jasha, Li, Jinyu, Xiong, Wayne
Published in arXiv.org (20.10.2017)

Get full text

Paper Journal Article

Loading…

GenTranslate: Large Language Models are Generative Multilingual Speech and Machine Translators

by Hu, Yuchen, Chen, Chen, Chao-Han, Huck Yang, Li, Ruizhe, Zhang, Dong, Chen, Zhehuai, Chng, Eng Siong
Published in arXiv.org (16.05.2024)

Get full text

Paper

Loading…

Understanding Shared Speech-Text Representations

by Wang, Gary, Kastner, Kyle, Bapna, Ankur, Chen, Zhehuai, Rosenberg, Andrew, Ramabhadran, Bhuvana, Zhang, Yu
Published in arXiv.org (27.04.2023)

Get full text

Paper

Loading…

Developing Instruction-Following Speech Language Model Without Speech Instruction-Tuning Data

by Ke-Han, Lu, Chen, Zhehuai, Szu-Wei Fu, Chao-Han, Huck Yang, Balam, Jagadeesh, Ginsburg, Boris, Yu-Chiang, Frank Wang, Hung-yi, Lee
Published in arXiv.org (30.09.2024)

Get full text

Paper

Loading…

SALM: Speech-augmented Language Model with In-context Learning for Speech Recognition and Translation

by Chen, Zhehuai, Huang, He, Andrusenko, Andrei, Hrinchuk, Oleksii, Puvvada, Krishna C, Li, Jason, Ghosh, Subhankar, Balam, Jagadeesh, Ginsburg, Boris
Published in arXiv.org (13.10.2023)

Get full text

Paper

Loading…

Accelerating RNN-T Training and Inference Using CTC guidance

by Wang, Yongqiang, Chen, Zhehuai, Zheng, Chengjian, Zhang, Yu, Han, Wei, Haghani, Parisa
Published in arXiv.org (29.10.2022)

Get full text

Paper

Loading…

Maestro-U: Leveraging joint speech-text representation learning for zero supervised speech ASR

by Chen, Zhehuai, Bapna, Ankur, Rosenberg, Andrew, Zhang, Yu, Ramabhadran, Bhuvana, Moreno, Pedro, Chen, Nanxin
Published in arXiv.org (21.10.2022)

Get full text

Paper

Loading…

Using Text Injection to Improve Recognition of Personal Identifiers in Speech

by Blau, Yochai, Agrawal, Rohan, Madmony, Lior, Wang, Gary, Rosenberg, Andrew, Chen, Zhehuai, Gekhman, Zorik, Beryozkin, Genady, Haghani, Parisa, Ramabhadran, Bhuvana
Published in arXiv.org (14.08.2023)

Get full text

Paper

Loading…

Less is More: Accurate Speech Recognition & Translation without Web-Scale Data

by Puvvada, Krishna C, Żelasko, Piotr, Huang, He, Hrinchuk, Oleksii, Nithin Rao Koluguri, Dhawan, Kunal, Majumdar, Somshubra, Rastorgueva, Elena, Chen, Zhehuai, Lavrukhin, Vitaly, Balam, Jagadeesh, Ginsburg, Boris
Published in arXiv.org (28.06.2024)

Get full text

Paper

Loading…

MAESTRO: Matched Speech Text Representations through Modality Matching

by Chen, Zhehuai, Zhang, Yu, Rosenberg, Andrew, Ramabhadran, Bhuvana, Moreno, Pedro, Bapna, Ankur, Zen, Heiga
Published in arXiv.org (01.07.2022)

Get full text

Paper

Loading…

Virtuoso: Massive Multilingual Speech-Text Joint Semi-Supervised Learning for Text-To-Speech

by Saeki, Takaaki, Zen, Heiga, Chen, Zhehuai, Morioka, Nobuyuki, Wang, Gary, Zhang, Yu, Bapna, Ankur, Rosenberg, Andrew, Ramabhadran, Bhuvana
Published in arXiv.org (15.03.2023)

Get full text

Paper

Loading…

Unsupervised Data Selection via Discrete Speech Representation for ASR

by Lu, Zhiyun, Wang, Yongqiang, Zhang, Yu, Han, Wei, Chen, Zhehuai, Haghani, Parisa
Published in arXiv.org (05.04.2022)

Get full text

Paper

Refine Results

Format

Subject Area

Topic

Language

Year of Publication

Database