改进的朴素贝叶斯算法在垃圾邮件过滤中的研究

TP309; 提出了一种利用支持向量机改进的朴素贝叶斯算法——TSVM-NB算法.首先利用NB算法对样本集进行初次训练,利用支持向量机构造一个最优分类超平面,每个样本根据与其距离最近样本的类型是否相同进行取舍,这样既降低样本空间规模,又提高每个样本类别的独立性,最后再次用朴素贝叶斯算法训练样本集从而生成分类模型.仿真实验结果表明,该算法在样本空间进行取舍过程当中消除了冗余属性,可以快速得到分类特征子集,提高了垃圾邮件过滤的分类速度、召回率和正确率....

Full description

Saved in:
Bibliographic Details
Published in通信学报 Vol. 38; no. 4; pp. 140 - 148
Main Authors 杨雷, 曹翠玲, 孙建国, 张立国
Format Journal Article
LanguageChinese
Published 哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨,150001%哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨150001 2017
中国科学院信息工程研究所,北京100093
Subjects
Online AccessGet full text
ISSN1000-436X
DOI10.11959/j.issn.1000-436x.2017084

Cover

Loading…
More Information
Summary:TP309; 提出了一种利用支持向量机改进的朴素贝叶斯算法——TSVM-NB算法.首先利用NB算法对样本集进行初次训练,利用支持向量机构造一个最优分类超平面,每个样本根据与其距离最近样本的类型是否相同进行取舍,这样既降低样本空间规模,又提高每个样本类别的独立性,最后再次用朴素贝叶斯算法训练样本集从而生成分类模型.仿真实验结果表明,该算法在样本空间进行取舍过程当中消除了冗余属性,可以快速得到分类特征子集,提高了垃圾邮件过滤的分类速度、召回率和正确率.
ISSN:1000-436X
DOI:10.11959/j.issn.1000-436x.2017084