改进的朴素贝叶斯算法在垃圾邮件过滤中的研究
TP309; 提出了一种利用支持向量机改进的朴素贝叶斯算法——TSVM-NB算法.首先利用NB算法对样本集进行初次训练,利用支持向量机构造一个最优分类超平面,每个样本根据与其距离最近样本的类型是否相同进行取舍,这样既降低样本空间规模,又提高每个样本类别的独立性,最后再次用朴素贝叶斯算法训练样本集从而生成分类模型.仿真实验结果表明,该算法在样本空间进行取舍过程当中消除了冗余属性,可以快速得到分类特征子集,提高了垃圾邮件过滤的分类速度、召回率和正确率....
Saved in:
Published in | 通信学报 Vol. 38; no. 4; pp. 140 - 148 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | Chinese |
Published |
哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨,150001%哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨150001
2017
中国科学院信息工程研究所,北京100093 |
Subjects | |
Online Access | Get full text |
ISSN | 1000-436X |
DOI | 10.11959/j.issn.1000-436x.2017084 |
Cover
Loading…
Summary: | TP309; 提出了一种利用支持向量机改进的朴素贝叶斯算法——TSVM-NB算法.首先利用NB算法对样本集进行初次训练,利用支持向量机构造一个最优分类超平面,每个样本根据与其距离最近样本的类型是否相同进行取舍,这样既降低样本空间规模,又提高每个样本类别的独立性,最后再次用朴素贝叶斯算法训练样本集从而生成分类模型.仿真实验结果表明,该算法在样本空间进行取舍过程当中消除了冗余属性,可以快速得到分类特征子集,提高了垃圾邮件过滤的分类速度、召回率和正确率. |
---|---|
ISSN: | 1000-436X |
DOI: | 10.11959/j.issn.1000-436x.2017084 |