面向非平行语料的语音转换技术综述

TP391; 语音转换是语音及人工智能领域的一项研究课题,其目标是在保持源语音内容不变的情况下改变语音的音色,使其听上去像是由另一个目标说话人说出的,同时还需保证语音的质量和自然度.面向非平行语料的语音转换技术是当下的热门研究内容,其使用非平行的多说话人语音数据集进行模型训练,能完成多对多以及任意对任意的语音转换.对近年来面向非平行语料的语音转换进行了全面的总结和分析.首先概述了早期面向平行语料的语音转换及其缺陷,然后对当下面向非平行语料的语音转换的各类实现方法进行介绍和对比分析,最后对语音转换技术进行了总结和展望....

Full description

Saved in:
Bibliographic Details
Published in大数据 Vol. 10; no. 3; pp. 65 - 81
Main Authors 李鹏程, 张旭龙, 王健宗, 程宁, 肖京
Format Journal Article
LanguageChinese
Published 平安科技(深圳)有限公司, 广东 深圳 518063 01.05.2024
中国科学技术大学,安徽 合肥 230026%平安科技(深圳)有限公司, 广东 深圳 518063
China InfoCom Media Group
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:TP391; 语音转换是语音及人工智能领域的一项研究课题,其目标是在保持源语音内容不变的情况下改变语音的音色,使其听上去像是由另一个目标说话人说出的,同时还需保证语音的质量和自然度.面向非平行语料的语音转换技术是当下的热门研究内容,其使用非平行的多说话人语音数据集进行模型训练,能完成多对多以及任意对任意的语音转换.对近年来面向非平行语料的语音转换进行了全面的总结和分析.首先概述了早期面向平行语料的语音转换及其缺陷,然后对当下面向非平行语料的语音转换的各类实现方法进行介绍和对比分析,最后对语音转换技术进行了总结和展望.
ISSN:2096-0271
DOI:10.11959/j.issn.2096-0271.2024011