基于改进快速密度峰值算法的电力负荷曲线聚类分析

为解决传统聚类算法对大数据背景下高维海量、类簇形状差异巨大的电力负荷曲线进行聚类分析时存在的聚类结果不稳定、聚类效果较差、聚类速度慢和内存消耗过大等问题,提出一种改进的快速密度峰值聚类算法.首先应用主成分分析法对归一化后的负荷曲线集进行降维处理,以减少样本向量间欧式距离的计算量和加快后续操作.然后利用kd树算法对降维后的数据进行快速K近邻搜索生成KNN矩阵.最后以KNN矩阵代替原算法的距离矩阵作为输入数据.在基于KNN改进的样本局部密度和距离计算准则的基础上,运用快速密度峰值算法对负荷曲线进行聚类分析.通过实验和算例分析验证了所提改进算法的实用性和有效性....

Full description

Saved in:
Bibliographic Details
Published in电力系统保护与控制 Vol. 46; no. 20; pp. 85 - 93
Main Authors 陈俊艺, 丁坚勇, 田世明, 卜凡鹏, 朱炳翔, 黄事成, 周凯
Format Journal Article
LanguageChinese
Published 武汉大学电气工程学院,湖北武汉,430072%中国电力科学研究院,北京,100192 16.10.2018
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:为解决传统聚类算法对大数据背景下高维海量、类簇形状差异巨大的电力负荷曲线进行聚类分析时存在的聚类结果不稳定、聚类效果较差、聚类速度慢和内存消耗过大等问题,提出一种改进的快速密度峰值聚类算法.首先应用主成分分析法对归一化后的负荷曲线集进行降维处理,以减少样本向量间欧式距离的计算量和加快后续操作.然后利用kd树算法对降维后的数据进行快速K近邻搜索生成KNN矩阵.最后以KNN矩阵代替原算法的距离矩阵作为输入数据.在基于KNN改进的样本局部密度和距离计算准则的基础上,运用快速密度峰值算法对负荷曲线进行聚类分析.通过实验和算例分析验证了所提改进算法的实用性和有效性.
ISSN:1674-3415
DOI:10.7667/PSPC171386