针对不确定正例和未标记学习的最近邻算法

TP181; 研究了在正例和未标记样本场景下不确定样本的分类问题,提出了一种新的算法NNPU(nearest neighbor algorithm for positive and unlabeled learning).NNPU具有两种实现方式:NNPUa和NNPUu.在UCI标准数据集上的实验结果表明,充分考虑数据不确定信息的NNPUu算法要比仅仅考虑样本中不确定信息均值的NNPUa算法具有更好的分类能力;同时,NNPU算法在对精确数据进行分类时,比NN-d、OCC以及aPUNB算法性能更优....

Full description

Saved in:
Bibliographic Details
Published in计算机科学与探索 Vol. 4; no. 9; pp. 769 - 779
Main Authors 潘世瑞, 张阳, 李雪, 王勇
Format Journal Article
LanguageChinese
Published 南京大学,计算机软件新技术国家重点实验室,南京,210093%昆士兰大学,计算机及电子工程系,布里斯班,4072,澳大利亚%西北工业大学,计算机学院,西安,710072 2010
西北农林科技大学,信息工程学院,陕西,杨凌,712100%西北农林科技大学,信息工程学院,陕西,杨凌,712100
Subjects
Online AccessGet full text
ISSN1673-9418
DOI10.3778/j.issn.1673-9418.2010.09.001

Cover

More Information
Summary:TP181; 研究了在正例和未标记样本场景下不确定样本的分类问题,提出了一种新的算法NNPU(nearest neighbor algorithm for positive and unlabeled learning).NNPU具有两种实现方式:NNPUa和NNPUu.在UCI标准数据集上的实验结果表明,充分考虑数据不确定信息的NNPUu算法要比仅仅考虑样本中不确定信息均值的NNPUa算法具有更好的分类能力;同时,NNPU算法在对精确数据进行分类时,比NN-d、OCC以及aPUNB算法性能更优.
ISSN:1673-9418
DOI:10.3778/j.issn.1673-9418.2010.09.001