一种大规模高维数据快速聚类算法

提出了一种面向大规模高维数据的自组织映射聚类算法.算法通过压缩神经元的特征集合,仅选择与神经元代表的文档类相关的特征构造神经元的特征向量,从而减少了聚类时间.同时由于选取的特征能够将映射到不同神经元的文档类进行有效区分,避免了无关特征的干扰,因而提升了聚类的精度.实验结果表明该方法能够有效加快聚类的速度,提升聚类的准确度,达到比较理想的聚类效果....

Full description

Saved in:

Bibliographic Details
Published in	Zi dong hua xue bao no. 7; pp. 859 - 866
Main Author	刘铭王晓龙刘远超
Format	Journal Article
Language	Chinese
Published	2009
Subjects	向量压缩神经元合并类内相似度类间区分度
Online Access	Get full text

Cover

Loading…

More Information
Summary:	提出了一种面向大规模高维数据的自组织映射聚类算法.算法通过压缩神经元的特征集合,仅选择与神经元代表的文档类相关的特征构造神经元的特征向量,从而减少了聚类时间.同时由于选取的特征能够将映射到不同神经元的文档类进行有效区分,避免了无关特征的干扰,因而提升了聚类的精度.实验结果表明该方法能够有效加快聚类的速度,提升聚类的准确度,达到比较理想的聚类效果.
Bibliography:	TP18 11-2109/TP Vector compression, neuron combination, intra-cluster similarity, inter-cluster distinctness
ISSN:	0254-4156 1874-1029