Search Results - "Sisman, Berrak" :: K.UTB vyhledávací portál

Loading…

Emotional voice conversion: Theory, databases and ESD

by Zhou, Kun, Sisman, Berrak, Liu, Rui, Li, Haizhou
Published in Speech communication (01.02.2022)

Get full text

Journal Article

Loading…

An Overview of Voice Conversion and Its Challenges: From Statistical Modeling to Deep Learning

by Sisman, Berrak, Yamagishi, Junichi, King, Simon, Li, Haizhou
Published in IEEE/ACM transactions on audio, speech, and language processing (2021)

Get full text

Journal Article

Loading…

emoDARTS: Joint Optimization of CNN and Sequential Neural Network Architectures for Superior Speech Emotion Recognition

by Rajapakshe, Thejan, Rana, Rajib, Khalifa, Sara, Sisman, Berrak, Schuller, Bjorn W., Busso, Carlos
Published in IEEE access (2024)

Get full text

Journal Article

Loading…

On the Study of Generative Adversarial Networks for Cross-Lingual Voice Conversion

by Sisman, Berrak, Zhang, Mingyang, Dong, Minghui, Li, Haizhou
Published in 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) (01.12.2019)

Get full text

Conference Proceeding

Loading…

Seen and Unseen Emotional Style Transfer for Voice Conversion with A New Emotional Speech Dataset

by Zhou, Kun, Sisman, Berrak, Liu, Rui, Li, Haizhou
Published in ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (06.06.2021)

Get full text

Conference Proceeding

Loading…

Transformation of prosody in voice conversion

by Sisman, Berrak, Li, Haizhou, Tan, Kay Chen
Published in 2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) (01.12.2017)

Get full text

Conference Proceeding

Loading…

FastTalker: A neural text-to-speech architecture with shallow and group autoregression

by Liu, Rui, Sisman, Berrak, Lin, Yixing, Li, Haizhou
Published in Neural networks (01.09.2021)

Get full text

Journal Article

Loading…

DeepConversion: Voice conversion with limited parallel training data

by Zhang, Mingyang, Sisman, Berrak, Zhao, Li, Li, Haizhou
Published in Speech communication (01.09.2020)

Get full text

Journal Article

Loading…

Expressive TTS Training With Frame and Style Reconstruction Loss

by Liu, Rui, Sisman, Berrak, Gao, Guanglai, Li, Haizhou
Published in IEEE/ACM transactions on audio, speech, and language processing (2021)

Get full text

Journal Article

Loading…

Group Sparse Representation With WaveNet Vocoder Adaptation for Spectrum and Prosody Conversion

by Sisman, Berrak, Mingyang Zhang, Haizhou Li
Published in IEEE/ACM transactions on audio, speech, and language processing (01.06.2019)

Get full text

Journal Article

Loading…

Graphspeech: Syntax-Aware Graph Attention Network for Neural Speech Synthesis

by Liu, Rui, Sisman, Berrak, Li, Haizhou
Published in ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (06.06.2021)

Get full text

Conference Proceeding

Loading…

Emotion Intensity and its Control for Emotional Voice Conversion

by Zhou, Kun, Sisman, Berrak, Rana, Rajib, Schuller, Bjorn W., Li, Haizhou
Published in IEEE transactions on affective computing (01.01.2023)

Get full text

Journal Article

Loading…

Error Reduction Network for DBLSTM-based Voice Conversion

by Zhang, Mingyang, Sisman, Berrak, Rallabandi, Sai Sirisha, Li, Haizhou, Zhao, Li
Published in 2018 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) (01.11.2018)

Get full text

Conference Proceeding

Loading…

Modeling Prosodic Phrasing with Multi-Task Learning in Tacotron-based TTS

by Liu, Rui, Sisman, Berrak, Bao, Feilong, Gao, Guang Lai, Li, Haizhou
Published in IEEE signal processing letters (01.01.2020)

Get full text

Journal Article

Loading…

Controllable Accented Text-to-Speech Synthesis With Fine and Coarse-Grained Intensity Rendering

by Liu, Rui, Sisman, Berrak, Gao, Guanglai, Li, Haizhou
Published in IEEE/ACM transactions on audio, speech, and language processing (01.01.2024)

Get full text

Journal Article

Loading…

Decoding Knowledge Transfer for Neural Text-to-Speech Training

by Liu, Rui, Sisman, Berrak, Gao, Guanglai, Li, Haizhou
Published in IEEE/ACM transactions on audio, speech, and language processing (2022)

Get full text

Journal Article

Loading…

Versatile Audio-Visual Learning for Emotion Recognition

by Goncalves, Lucas, Leem, Seong-Gyun, Lin, Wei-Cheng, Sisman, Berrak, Busso, Carlos
Published in IEEE transactions on affective computing (24.07.2024)

Get full text

Journal Article

Loading…

Revealing Emotional Clusters in Speaker Embeddings: A Contrastive Learning Strategy for Speech Emotion Recognition

by Ulgen, Ismail Rasim, Du, Zongyang, Busso, Carlos, Sisman, Berrak
Published in ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (14.04.2024)

Get full text

Conference Proceeding

Loading…

Visualtts: TTS with Accurate Lip-Speech Synchronization for Automatic Voice Over

by Lu, Junchen, Sisman, Berrak, Liu, Rui, Zhang, Mingyang, Li, Haizhou
Published in ICASSP 2022 - 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (23.05.2022)

Get full text

Conference Proceeding

Loading…

Speech Synthesis with Mixed Emotions

by Zhou, Kun, Sisman, Berrak, Rana, Rajib, Schuller, Bjorn W., Li, Haizhou
Published in IEEE transactions on affective computing (01.10.2023)

Get full text

Journal Article

Refine Results

Format

Subject Area

Topic

Language

Year of Publication

Database