基于样本重采样的电路非平衡数据预处理方法
TP206.1; 针对机载设备电子电路故障状态测试数据少、整体测试数据不均衡的问题,提出了一种基于样本重采样的数据预处理方法.首先,采用超限学习机对原始数据集进行训练以挑选出分类准确的样本.然后,对其中的少数类和多数类分别采用合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)进行过采样和局部密度欠采样处理;并将错误分类的多数类样本作为干扰因素进行删除.通过以上两种手段可以均衡数据集,并控制数据规模防止过拟合,提高对故障样本的检测率.实测数据处理结果表明,相比于其他重采样算法,所提算法整体效果优良且稳定,对电子电路故障诊断具有一...
Saved in:
Published in | 系统工程与电子技术 Vol. 42; no. 11; pp. 2654 - 2660 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | Chinese |
Published |
海军航空大学,山东烟台264001
01.11.2020
|
Subjects | |
Online Access | Get full text |
ISSN | 1001-506X |
DOI | 10.3969/j.issn.1001-506X.2020.11.30 |
Cover
Summary: | TP206.1; 针对机载设备电子电路故障状态测试数据少、整体测试数据不均衡的问题,提出了一种基于样本重采样的数据预处理方法.首先,采用超限学习机对原始数据集进行训练以挑选出分类准确的样本.然后,对其中的少数类和多数类分别采用合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)进行过采样和局部密度欠采样处理;并将错误分类的多数类样本作为干扰因素进行删除.通过以上两种手段可以均衡数据集,并控制数据规模防止过拟合,提高对故障样本的检测率.实测数据处理结果表明,相比于其他重采样算法,所提算法整体效果优良且稳定,对电子电路故障诊断具有一定的应用价值. |
---|---|
ISSN: | 1001-506X |
DOI: | 10.3969/j.issn.1001-506X.2020.11.30 |