针对不确定正例和未标记学习的最近邻算法
TP181; 研究了在正例和未标记样本场景下不确定样本的分类问题,提出了一种新的算法NNPU(nearest neighbor algorithm for positive and unlabeled learning).NNPU具有两种实现方式:NNPUa和NNPUu.在UCI标准数据集上的实验结果表明,充分考虑数据不确定信息的NNPUu算法要比仅仅考虑样本中不确定信息均值的NNPUa算法具有更好的分类能力;同时,NNPU算法在对精确数据进行分类时,比NN-d、OCC以及aPUNB算法性能更优....
Saved in:
Published in | 计算机科学与探索 Vol. 4; no. 9; pp. 769 - 779 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | Chinese |
Published |
南京大学,计算机软件新技术国家重点实验室,南京,210093%昆士兰大学,计算机及电子工程系,布里斯班,4072,澳大利亚%西北工业大学,计算机学院,西安,710072
2010
西北农林科技大学,信息工程学院,陕西,杨凌,712100%西北农林科技大学,信息工程学院,陕西,杨凌,712100 |
Subjects | |
Online Access | Get full text |
ISSN | 1673-9418 |
DOI | 10.3778/j.issn.1673-9418.2010.09.001 |
Cover
Summary: | TP181; 研究了在正例和未标记样本场景下不确定样本的分类问题,提出了一种新的算法NNPU(nearest neighbor algorithm for positive and unlabeled learning).NNPU具有两种实现方式:NNPUa和NNPUu.在UCI标准数据集上的实验结果表明,充分考虑数据不确定信息的NNPUu算法要比仅仅考虑样本中不确定信息均值的NNPUa算法具有更好的分类能力;同时,NNPU算法在对精确数据进行分类时,比NN-d、OCC以及aPUNB算法性能更优. |
---|---|
ISSN: | 1673-9418 |
DOI: | 10.3778/j.issn.1673-9418.2010.09.001 |