基于双通道卷积注意力网络的语音增强方法
TN912.35; 传统的单通道网络模型因表征能力有限,无法充分提取语音深层特征,导致模型的语音增强效果不明显.鉴于此,提出一种双通道卷积注意力网络的语音增强方法.首先,使用卷积神经网络和长短时记忆网络构建并行的双通道学习模块,结合两种不同神经网络的优势,充分挖掘语音的深层特征;其次,在两个通道中分别添加注意力模块,依照关注度对通道的输出特征进行加权,达到强调有益信息的目的;最后,将两个通道的输出进行融合得到增强特征.结果表明,在低信噪比和非平稳噪声环境中,包含双通道结构和注意力模块的模型,其增强效果明显优于其他对比模型,有效提高了增强语音的质量和可懂度,验证了所提模型的可行性....
Saved in:
Published in | 河南理工大学学报(自然科学版) Vol. 41; no. 5; pp. 127 - 136 |
---|---|
Main Authors | , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
河南理工大学 物理与电子信息学院,河南 焦作 454000%河南理工大学 电气工程与自动化学院,河南 焦作 454000
01.09.2022
|
Subjects | |
Online Access | Get full text |
ISSN | 1673-9787 |
DOI | 10.16186/j.cnki.1673-9787.2020060014 |
Cover
Loading…
Summary: | TN912.35; 传统的单通道网络模型因表征能力有限,无法充分提取语音深层特征,导致模型的语音增强效果不明显.鉴于此,提出一种双通道卷积注意力网络的语音增强方法.首先,使用卷积神经网络和长短时记忆网络构建并行的双通道学习模块,结合两种不同神经网络的优势,充分挖掘语音的深层特征;其次,在两个通道中分别添加注意力模块,依照关注度对通道的输出特征进行加权,达到强调有益信息的目的;最后,将两个通道的输出进行融合得到增强特征.结果表明,在低信噪比和非平稳噪声环境中,包含双通道结构和注意力模块的模型,其增强效果明显优于其他对比模型,有效提高了增强语音的质量和可懂度,验证了所提模型的可行性. |
---|---|
ISSN: | 1673-9787 |
DOI: | 10.16186/j.cnki.1673-9787.2020060014 |