基于ECM的多视图模糊聚类算法
TP391.4; 目的 传统聚类算法多属于单视图聚类的范畴,在数据结构形式日趋复杂的今天,单视图聚类越来越难以对数据集进行全面而准确的知识表达.特别地,虽然证据C-均值聚类算法的数据结构揭示能力比较突出,但是囿于单视图的算法设计,其对于数据集的综合描述能力较为薄弱.方法 为解决该问题,提出一种基于证据C-均值聚类的多视图模糊聚类算法.该算法在信念函数的理论框架下形成凭证分区,然后计算各特征在不同视图下的权重,并将该权重赋予不同视角下的各个分区,从而生成最终的聚类结果.一方面扩展了硬划分、模糊划分和可能性划分的概念,可同时继承证据C-均值聚类算法和多视图模糊聚类的优点,挖掘不同视图下的有价值信息...
Saved in:
Published in | 河南理工大学学报(自然科学版) Vol. 43; no. 3; pp. 154 - 160 |
---|---|
Main Authors | , |
Format | Journal Article |
Language | Chinese |
Published |
河南理工大学 计算机科学与技术学院,河南 焦作 454000
01.05.2024
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | TP391.4; 目的 传统聚类算法多属于单视图聚类的范畴,在数据结构形式日趋复杂的今天,单视图聚类越来越难以对数据集进行全面而准确的知识表达.特别地,虽然证据C-均值聚类算法的数据结构揭示能力比较突出,但是囿于单视图的算法设计,其对于数据集的综合描述能力较为薄弱.方法 为解决该问题,提出一种基于证据C-均值聚类的多视图模糊聚类算法.该算法在信念函数的理论框架下形成凭证分区,然后计算各特征在不同视图下的权重,并将该权重赋予不同视角下的各个分区,从而生成最终的聚类结果.一方面扩展了硬划分、模糊划分和可能性划分的概念,可同时继承证据C-均值聚类算法和多视图模糊聚类的优点,挖掘不同视图下的有价值信息,另一方面能够根据视图重要程度自动分配权重,据此提高聚类准确率.结果 为验证算法的聚类效果,在4个多视图数据集上与其他5种算法进行了对比实验,实验内容包括聚类准确率、聚类效率和参数分析3部分.实验结果表明,所提算法在准确率、F度量和标准化互信息3个量化指标上表现较好,说明在聚类准确率方面优于对比算法;在聚类效率上,除去在个别数据集上因迭代次数过多导致聚类时间略长外,总体接近于对比算法中的最优表现.结论 这些表现进一步证明了所提算法在处理多视图数据集时的有效性. |
---|---|
ISSN: | 1673-9787 |
DOI: | 10.16186/j.cnki.1673-9787.2021110037 |