语音识别中说话人自适应方法研究综述

TN912.34%TP18; 语音是人机交互方式之一,语音识别技术是人工智能的重要组成部分.近年来神经网络技术在语音识别领域的应用快速发展,已经成为语音识别领域中主流的声学建模技术.然而测试条件中目标说话人语音与训练数据存在差异,导致模型不适配的问题.因此说话人自适应(SA)方法是为了解决说话人差异导致的不匹配问题,研究说话人自适应方法成为语音识别领域的一个热门方向.相比传统语音识别模型中的说话人自适应方法,使用神经网络的语音识别系统中的自适应存在着模型参数庞大,而自适应数据量相对较少等特点,这使得基于神经网络的语音识别系统中的说话人自适应方法成为一个研究难题.首先回顾说话人自适应方法的发展历...

Full description

Saved in:

Bibliographic Details
Published in	计算机科学与探索 Vol. 15; no. 12; pp. 2241 - 2255
Main Authors	朱方圆, 马志强, 陈艳, 张晓旭, 王洪彬, 宝财吉拉呼
Format	Journal Article
Language	Chinese
Published	内蒙古工业大学内蒙古自治区基于大数据的软件服务工程技术研究中心,呼和浩特 010080 2021 内蒙古工业大学数据科学与应用学院,呼和浩特 010080%内蒙古工业大学数据科学与应用学院,呼和浩特 010080
Subjects	语音识别;说话人自适应(SA);神经网络
Online Access	Get full text

Cover

Loading…

More Information
Summary:	TN912.34%TP18; 语音是人机交互方式之一,语音识别技术是人工智能的重要组成部分.近年来神经网络技术在语音识别领域的应用快速发展,已经成为语音识别领域中主流的声学建模技术.然而测试条件中目标说话人语音与训练数据存在差异,导致模型不适配的问题.因此说话人自适应(SA)方法是为了解决说话人差异导致的不匹配问题,研究说话人自适应方法成为语音识别领域的一个热门方向.相比传统语音识别模型中的说话人自适应方法,使用神经网络的语音识别系统中的自适应存在着模型参数庞大,而自适应数据量相对较少等特点,这使得基于神经网络的语音识别系统中的说话人自适应方法成为一个研究难题.首先回顾说话人自适应方法的发展历程和基于神经网络的说话人自适应方法研究遇到的各种问题,其次将说话人自适应方法分为基于特征域和基于模型域的说话人自适应方法并介绍对应原理和改进方法,最后指出说话人自适应方法在语音识别中仍然存在的问题及未来的发展方向.
ISSN:	1673-9418
DOI:	10.3778/j.issn.1673-9418.2104068