特征标记依赖自编码器的多标记特征提取方法

TP391; 在多标记学习中,如何处理高维特征一直是研究难点之一,而特征提取算法可以有效解决数据特征高维性导致的分类性能降低问题.但目前已有的多标记特征提取算法很少充分利用特征信息并充分提取"特征-标记"独立信息及融合信息.基于此,提出一种基于特征标记依赖自编码器的多标记特征提取方法.使用核极限学习机自编码器将原标记空间与原特征空间融合并产生重构后的新特征空间.一方面最大化希尔伯特-施密特范数以充分利用标记信息;另一方面通过主成分分析来降低特征提取过程中的信息损失,结合二者并分别提取"特征-特征"和"特征-标记"信息.通过在Yahoo...

Full description

Saved in:
Bibliographic Details
Published in计算机科学与探索 Vol. 14; no. 3; pp. 470 - 481
Main Authors 程玉胜, 李志伟, 庞淑芳
Format Journal Article
LanguageChinese
Published 安徽省高校智能感知与计算重点实验室,安徽 安庆 246011%安庆师范大学 计算机与信息学院,安徽 安庆,246011 01.03.2020
安庆师范大学 计算机与信息学院,安徽 安庆 246011
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:TP391; 在多标记学习中,如何处理高维特征一直是研究难点之一,而特征提取算法可以有效解决数据特征高维性导致的分类性能降低问题.但目前已有的多标记特征提取算法很少充分利用特征信息并充分提取"特征-标记"独立信息及融合信息.基于此,提出一种基于特征标记依赖自编码器的多标记特征提取方法.使用核极限学习机自编码器将原标记空间与原特征空间融合并产生重构后的新特征空间.一方面最大化希尔伯特-施密特范数以充分利用标记信息;另一方面通过主成分分析来降低特征提取过程中的信息损失,结合二者并分别提取"特征-特征"和"特征-标记"信息.通过在Yahoo多组高维多标记数据集上的对比实验表明,该算法的性能优于当前五种主要的多标记特征提取方法,验证了所提算法的有效性.
ISSN:1673-9418
DOI:10.3778/j.issn.1673-9418.1903053