基于分类间隔增强的不平衡多标签学习算法
TP391; 传统的多标签学习算法一般没有考虑标签的不均衡性,从而忽略了标签不平衡给分类带来的影响.但统计发现,目前常用的多标签数据集均存在标签不均衡问题,且少数类标签往往更加重要.基于此,本文提出了一种基于分类间隔增强的不平衡多标签学习算法(Imbalanced multi-label learning algorithm based on classification interval enhanced,MLCIE),旨在利用各标签分类间隔的重构来增强分类器对少数类标签样本的学习效率,提升样本标签质量,从而减少多标签不平衡对分类器学习精度的影响.首先利用各标签密度与条件熵计算各标签的不确定...
Saved in:
Published in | 数据采集与处理 Vol. 36; no. 3; pp. 519 - 528 |
---|---|
Main Authors | , |
Format | Journal Article |
Language | Chinese |
Published |
安庆师范大学创新团队,安庆246133%安庆师范大学创新团队,安庆246133
01.05.2021
安徽省高校智能感知与计算重点实验室(安庆师范大学),安庆246133 |
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | TP391; 传统的多标签学习算法一般没有考虑标签的不均衡性,从而忽略了标签不平衡给分类带来的影响.但统计发现,目前常用的多标签数据集均存在标签不均衡问题,且少数类标签往往更加重要.基于此,本文提出了一种基于分类间隔增强的不平衡多标签学习算法(Imbalanced multi-label learning algorithm based on classification interval enhanced,MLCIE),旨在利用各标签分类间隔的重构来增强分类器对少数类标签样本的学习效率,提升样本标签质量,从而减少多标签不平衡对分类器学习精度的影响.首先利用各标签密度与条件熵计算各标签的不确定性系数;然后构建分类间隔增强矩阵,将各标签独有的密度信息融入到原始标签矩阵中,获取平衡的标签空间;最后使用极限学习机作为线性分类器进行分类.本文在11个多标签标准数据集上与其他7种多标签学习算法进行对比实验,结果表明本文算法在解决标签不平衡问题上有一定效果. |
---|---|
ISSN: | 1004-9037 |
DOI: | 10.16337/j.1004-9037.2021.03.010 |