基于双通道卷积注意力网络的语音增强方法

TN912.35; 传统的单通道网络模型因表征能力有限,无法充分提取语音深层特征,导致模型的语音增强效果不明显.鉴于此,提出一种双通道卷积注意力网络的语音增强方法.首先,使用卷积神经网络和长短时记忆网络构建并行的双通道学习模块,结合两种不同神经网络的优势,充分挖掘语音的深层特征;其次,在两个通道中分别添加注意力模块,依照关注度对通道的输出特征进行加权,达到强调有益信息的目的;最后,将两个通道的输出进行融合得到增强特征.结果表明,在低信噪比和非平稳噪声环境中,包含双通道结构和注意力模块的模型,其增强效果明显优于其他对比模型,有效提高了增强语音的质量和可懂度,验证了所提模型的可行性....

Full description

Saved in:
Bibliographic Details
Published in河南理工大学学报(自然科学版) Vol. 41; no. 5; pp. 127 - 136
Main Authors 李辉, 景浩, 严康华, 邹波蓉, 侯庆华, 武会斌
Format Journal Article
LanguageChinese
Published 河南理工大学 物理与电子信息学院,河南 焦作 454000%河南理工大学 电气工程与自动化学院,河南 焦作 454000 01.09.2022
Subjects
Online AccessGet full text
ISSN1673-9787
DOI10.16186/j.cnki.1673-9787.2020060014

Cover

Loading…
More Information
Summary:TN912.35; 传统的单通道网络模型因表征能力有限,无法充分提取语音深层特征,导致模型的语音增强效果不明显.鉴于此,提出一种双通道卷积注意力网络的语音增强方法.首先,使用卷积神经网络和长短时记忆网络构建并行的双通道学习模块,结合两种不同神经网络的优势,充分挖掘语音的深层特征;其次,在两个通道中分别添加注意力模块,依照关注度对通道的输出特征进行加权,达到强调有益信息的目的;最后,将两个通道的输出进行融合得到增强特征.结果表明,在低信噪比和非平稳噪声环境中,包含双通道结构和注意力模块的模型,其增强效果明显优于其他对比模型,有效提高了增强语音的质量和可懂度,验证了所提模型的可行性.
ISSN:1673-9787
DOI:10.16186/j.cnki.1673-9787.2020060014