多类属性加权与正交变换融合的朴素贝叶斯

TP391; 由于朴素贝叶斯算法忽略了数据多维属性的相关性,从而导致分类算法的极大应用局限.对此提出多类属性加权与正交变换融合的朴素贝叶斯改进算法.利用贡献度与相关互信息去量化离散属性以及离散属性值之间的相关程度,以获得其权重;利用正交变换方法消除连续属性之间的线性关系;将加权后的离散属性和正交变换后的连续属性的条件概率进行区分计算,从而得到较高的分类精度并提高算法的泛化能力.通过在公开数据集以及校园一卡通数据集上的k折交叉验证,实验结果表明,与最新的5种改进朴素贝叶斯算法相比,该算法的准确率高了7.19~9.94个百分点,加权平均F1值高了6.4~11.64个百分点....

Full description

Saved in:
Bibliographic Details
Published in计算机工程与应用 Vol. 59; no. 18; pp. 84 - 97
Main Authors 刘海涛, 陈春梅, 庞忠祥, 梁志强, 李晴
Format Journal Article
LanguageChinese
Published 西南科技大学 信息工程学院,四川 绵阳 621002 15.09.2023
Subjects
Online AccessGet full text
ISSN1002-8331
DOI10.3778/j.issn.1002-8331.2211-0411

Cover

More Information
Summary:TP391; 由于朴素贝叶斯算法忽略了数据多维属性的相关性,从而导致分类算法的极大应用局限.对此提出多类属性加权与正交变换融合的朴素贝叶斯改进算法.利用贡献度与相关互信息去量化离散属性以及离散属性值之间的相关程度,以获得其权重;利用正交变换方法消除连续属性之间的线性关系;将加权后的离散属性和正交变换后的连续属性的条件概率进行区分计算,从而得到较高的分类精度并提高算法的泛化能力.通过在公开数据集以及校园一卡通数据集上的k折交叉验证,实验结果表明,与最新的5种改进朴素贝叶斯算法相比,该算法的准确率高了7.19~9.94个百分点,加权平均F1值高了6.4~11.64个百分点.
ISSN:1002-8331
DOI:10.3778/j.issn.1002-8331.2211-0411