CMDC:一种差异互补的迭代式多维度文本聚类算法
TP301; 针对传统多维度文本聚类算法把文本表示与聚类过程分离,忽略了维度间的互补特性的问题,提出了一种差异互补的迭代式多维度文本聚类算法——CMDC,实现文本聚类与特征调整过程的统一优化.CMDC算法挑选维度聚类间结果的互补文本,基于局部度量学习算法利用互补文本促进聚类的特征调优,以维度的度量一致性来解决多维度文本聚类的划分一致性.实验结果表明,CMDC算法有效地提升了多维度聚类性能....
Saved in:
Published in | 通信学报 Vol. 41; no. 8; pp. 155 - 164 |
---|---|
Main Authors | , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
贵州大学计算机科学与技术学院,贵州 贵阳 550025
25.08.2020
贵州省智能人机交互工程技术研究中心,贵州 贵阳 550025 贵州省公共大数据重点实验室,贵州 贵阳 550025%贵州大学计算机科学与技术学院,贵州 贵阳 550025%贵州大学计算机科学与技术学院,贵州 贵阳 550025 |
Subjects | |
Online Access | Get full text |
ISSN | 1000-436X |
DOI | 10.11959/j.issn.1000-436x.2020152 |
Cover
Summary: | TP301; 针对传统多维度文本聚类算法把文本表示与聚类过程分离,忽略了维度间的互补特性的问题,提出了一种差异互补的迭代式多维度文本聚类算法——CMDC,实现文本聚类与特征调整过程的统一优化.CMDC算法挑选维度聚类间结果的互补文本,基于局部度量学习算法利用互补文本促进聚类的特征调优,以维度的度量一致性来解决多维度文本聚类的划分一致性.实验结果表明,CMDC算法有效地提升了多维度聚类性能. |
---|---|
ISSN: | 1000-436X |
DOI: | 10.11959/j.issn.1000-436x.2020152 |