Search Results - "Dalmia, Siddharth" :: K.UTB vyhledávací portál

Sequence-Based Multi-Lingual Low Resource Speech Recognition

by Dalmia, Siddharth, Sanabria, Ramon, Metze, Florian, Black, Alan W.
Published in 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (01.04.2018)

Get full text

Conference Proceeding

Loading…

Transformer-Transducers for Code-Switched Speech Recognition

by Dalmia, Siddharth, Liu, Yuzong, Ronanki, Srikanth, Kirchhoff, Katrin
Published in ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (01.01.2021)

Get full text

Conference Proceeding

Loading…

Universal Phone Recognition with a Multilingual Allophone System

by Li, Xinjian, Dalmia, Siddharth, Li, Juncheng, Lee, Matthew, Littell, Patrick, Yao, Jiali, Anastasopoulos, Antonios, Mortensen, David R., Neubig, Graham, Black, Alan W, Metze, Florian
Published in ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (01.05.2020)

Get full text

Conference Proceeding

Loading…

ESPnet-SLU: Advancing Spoken Language Understanding Through ESPnet

by Arora, Siddhant, Dalmia, Siddharth, Denisov, Pavel, Chang, Xuankai, Ueda, Yushi, Peng, Yifan, Zhang, Yuekai, Kumar, Sujay, Ganesan, Karthik, Yan, Brian, Thang Vu, Ngoc, Black, Alan W, Watanabe, Shinji
Published in ICASSP 2022 - 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (23.05.2022)

Get full text

Conference Proceeding

Loading…

Align, Write, Re-Order: Explainable End-to-End Speech Translation via Operation Sequence Generation

by Omachi, Motoi, Yan, Brian, Dalmia, Siddharth, Fujita, Yuya, Watanabe, Shinji
Published in ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (04.06.2023)

Get full text

Conference Proceeding

Loading…

LegoNN: Building Modular Encoder-Decoder Models

by Dalmia, Siddharth, Okhonko, Dmytro, Lewis, Mike, Edunov, Sergey, Watanabe, Shinji, Metze, Florian, Zettlemoyer, Luke, Mohamed, Abdelrahman
Published in IEEE/ACM transactions on audio, speech, and language processing (01.01.2023)

Get full text

Journal Article

Loading…

Joint Modeling of Code-Switched and Monolingual ASR via Conditional Factorization

by Yan, Brian, Zhang, Chunlei, Yu, Meng, Zhang, Shi-Xiong, Dalmia, Siddharth, Berrebbi, Dan, Weng, Chao, Watanabe, Shinji, Yu, Dong
Published in ICASSP 2022 - 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (23.05.2022)

Get full text

Conference Proceeding

Loading…

Multimodal Modeling for Spoken Language Identification

by Bharadwaj, Shikhar, Ma, Min, Vashishth, Shikhar, Bapna, Ankur, Ganapathy, Sriram, Axelrod, Vera, Dalmia, Siddharth, Han, Wei, Zhang, Yu, Van Esch, Daan, Ritchie, Sandy, Talukdar, Partha, Riesa, Jason
Published in ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (14.04.2024)

Get full text

Conference Proceeding

Loading…

Phoneme Level Language Models for Sequence Based Low Resource ASR

by Dalmia, Siddharth, Li, Xinjian, Black, Alan W, Metze, Florian
Published in ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (01.05.2019)

Get full text

Conference Proceeding

Loading…

FLEURS: FEW-Shot Learning Evaluation of Universal Representations of Speech

by Conneau, Alexis, Ma, Min, Khanuja, Simran, Zhang, Yu, Axelrod, Vera, Dalmia, Siddharth, Riesa, Jason, Rivera, Clara, Bapna, Ankur
Published in 2022 IEEE Spoken Language Technology Workshop (SLT) (09.01.2023)

Get full text

Conference Proceeding

Loading…

Fast-MD: Fast Multi-Decoder End-to-End Speech Translation with Non-Autoregressive Hidden Intermediates

by Inaguma, Hirofumi, Dalmia, Siddharth, Yan, Brian, Watanabe, Shinji
Published in 2021 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) (13.12.2021)

Get full text

Conference Proceeding

Loading…

Align, Write, Re-order: Explainable End-to-End Speech Translation via Operation Sequence Generation

by Omachi, Motoi, Yan, Brian, Dalmia, Siddharth, Fujita, Yuya, Watanabe, Shinji
Year of Publication 10.11.2022

Get full text

Journal Article

Loading…

Transforming LLMs into Cross-modal and Cross-lingual Retrieval Systems

by Gomez, Frank Palma, Sanabria, Ramon, Sung, Yun-hsuan, Cer, Daniel, Dalmia, Siddharth, Abrego, Gustavo Hernandez
Year of Publication 01.04.2024

Get full text

Journal Article

Loading…

Branchformer: Parallel MLP-Attention Architectures to Capture Local and Global Context for Speech Recognition and Understanding

by Peng, Yifan, Dalmia, Siddharth, Lane, Ian, Watanabe, Shinji
Year of Publication 06.07.2022

Get full text

Journal Article

Loading…

A Study on the Integration of Pre-Trained SSL, ASR, LM and SLU Models for Spoken Language Understanding

by Peng, Yifan, Arora, Siddhant, Higuchi, Yosuke, Ueda, Yushi, Kumar, Sujay, Ganesan, Karthik, Dalmia, Siddharth, Chang, Xuankai, Watanabe, Shinji
Published in 2022 IEEE Spoken Language Technology Workshop (SLT) (09.01.2023)

Get full text

Conference Proceeding

Loading…

Domain Robust Feature Extraction for Rapid Low Resource ASR Development

by Dalmia, Siddharth, Li, Xinjian, Metze, Florian, Black, Alan W.
Published in 2018 IEEE Spoken Language Technology Workshop (SLT) (01.12.2018)

Get full text

Conference Proceeding

Loading…

Fast-MD: Fast Multi-Decoder End-to-End Speech Translation with Non-Autoregressive Hidden Intermediates

by Inaguma, Hirofumi, Dalmia, Siddharth, Yan, Brian, Watanabe, Shinji
Year of Publication 27.09.2021

Get full text

Journal Article

Loading…

LLM Augmented LLMs: Expanding Capabilities through Composition

by Bansal, Rachit, Samanta, Bidisha, Dalmia, Siddharth, Gupta, Nitish, Vashishth, Shikhar, Ganapathy, Sriram, Bapna, Abhishek, Jain, Prateek, Talukdar, Partha
Year of Publication 04.01.2024

Get full text

Journal Article