CMDC:一种差异互补的迭代式多维度文本聚类算法

TP301; 针对传统多维度文本聚类算法把文本表示与聚类过程分离,忽略了维度间的互补特性的问题,提出了一种差异互补的迭代式多维度文本聚类算法——CMDC,实现文本聚类与特征调整过程的统一优化.CMDC算法挑选维度聚类间结果的互补文本,基于局部度量学习算法利用互补文本促进聚类的特征调优,以维度的度量一致性来解决多维度文本聚类的划分一致性.实验结果表明,CMDC算法有效地提升了多维度聚类性能....

Full description

Saved in:
Bibliographic Details
Published in通信学报 Vol. 41; no. 8; pp. 155 - 164
Main Authors 黄瑞章, 白瑞娜, 陈艳平, 秦永彬, 程欣宇, 田有亮
Format Journal Article
LanguageChinese
Published 贵州大学计算机科学与技术学院,贵州 贵阳 550025 25.08.2020
贵州省智能人机交互工程技术研究中心,贵州 贵阳 550025
贵州省公共大数据重点实验室,贵州 贵阳 550025%贵州大学计算机科学与技术学院,贵州 贵阳 550025%贵州大学计算机科学与技术学院,贵州 贵阳 550025
Subjects
Online AccessGet full text
ISSN1000-436X
DOI10.11959/j.issn.1000-436x.2020152

Cover

More Information
Summary:TP301; 针对传统多维度文本聚类算法把文本表示与聚类过程分离,忽略了维度间的互补特性的问题,提出了一种差异互补的迭代式多维度文本聚类算法——CMDC,实现文本聚类与特征调整过程的统一优化.CMDC算法挑选维度聚类间结果的互补文本,基于局部度量学习算法利用互补文本促进聚类的特征调优,以维度的度量一致性来解决多维度文本聚类的划分一致性.实验结果表明,CMDC算法有效地提升了多维度聚类性能.
ISSN:1000-436X
DOI:10.11959/j.issn.1000-436x.2020152