一种大规模高维数据快速聚类算法

提出了一种面向大规模高维数据的自组织映射聚类算法.算法通过压缩神经元的特征集合,仅选择与神经元代表的文档类相关的特征构造神经元的特征向量,从而减少了聚类时间.同时由于选取的特征能够将映射到不同神经元的文档类进行有效区分,避免了无关特征的干扰,因而提升了聚类的精度.实验结果表明该方法能够有效加快聚类的速度,提升聚类的准确度,达到比较理想的聚类效果....

Full description

Saved in:
Bibliographic Details
Published inZi dong hua xue bao no. 7; pp. 859 - 866
Main Author 刘铭 王晓龙 刘远超
Format Journal Article
LanguageChinese
Published 2009
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:提出了一种面向大规模高维数据的自组织映射聚类算法.算法通过压缩神经元的特征集合,仅选择与神经元代表的文档类相关的特征构造神经元的特征向量,从而减少了聚类时间.同时由于选取的特征能够将映射到不同神经元的文档类进行有效区分,避免了无关特征的干扰,因而提升了聚类的精度.实验结果表明该方法能够有效加快聚类的速度,提升聚类的准确度,达到比较理想的聚类效果.
Bibliography:TP18
11-2109/TP
Vector compression, neuron combination, intra-cluster similarity, inter-cluster distinctness
ISSN:0254-4156
1874-1029