基于NMF与CNN联合优化的声学场景分类

O42; 针对声学场景分类任务中复杂声学环境的特征表示问题,提出一种联合训练特征提取和分类模型的优化算法.将非负矩阵分解与卷积神经网络的训练相结合,利用网络的损失值实现对特征提取和网络参数的共同更新,以学习到更具判别性的有监督特征.在TUT2017数据集上提取对数声谱图作为基础特征,搭建深度卷积神经网络进行实验验证.仿真结果表明,所提算法的识别准确率相比优化前提升3.9%,且优于其他两种常用声学特征,证明该算法能够有效提升整体分类效果....

Full description

Saved in:
Bibliographic Details
Published in系统工程与电子技术 Vol. 44; no. 5; pp. 1433 - 1438
Main Authors 韦娟, 杨皇卫, 宁方立
Format Journal Article
LanguageChinese
Published 西安电子科技大学通信工程学院,陕西西安710071%西北工业大学机电学院,陕西西安710072 01.05.2022
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:O42; 针对声学场景分类任务中复杂声学环境的特征表示问题,提出一种联合训练特征提取和分类模型的优化算法.将非负矩阵分解与卷积神经网络的训练相结合,利用网络的损失值实现对特征提取和网络参数的共同更新,以学习到更具判别性的有监督特征.在TUT2017数据集上提取对数声谱图作为基础特征,搭建深度卷积神经网络进行实验验证.仿真结果表明,所提算法的识别准确率相比优化前提升3.9%,且优于其他两种常用声学特征,证明该算法能够有效提升整体分类效果.
ISSN:1001-506X
DOI:10.12305/j.issn.1001-506X.2022.05.01