基于平均差异度优选初始聚类中心的改进K-均值聚类算法
来源期刊:控制与决策2017年第4期
论文作者:李武 赵娇燕 严太山
文章页码:759 - 762
关键词:K-均值聚类;初始聚类中心;样本差异度;
摘 要:针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,提出一种基于数据空间分布选取初始聚类中心的改进算法.该算法首先定义样本距离、样本平均差异度和样本集总体平均差异度;然后将每个样本按平均差异度排序,选择平均差异度较大且与已选聚类中心的差异度大于样本集总体平均差异度的样本作为初始聚类中心.实验表明,改进后的算法不仅提高了聚类结果的稳定性和正确率,而且迭代次数明显减少,收敛速度快.
李武,赵娇燕,严太山
湖南理工学院信息与通信工程学院
摘 要:针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,提出一种基于数据空间分布选取初始聚类中心的改进算法.该算法首先定义样本距离、样本平均差异度和样本集总体平均差异度;然后将每个样本按平均差异度排序,选择平均差异度较大且与已选聚类中心的差异度大于样本集总体平均差异度的样本作为初始聚类中心.实验表明,改进后的算法不仅提高了聚类结果的稳定性和正确率,而且迭代次数明显减少,收敛速度快.
关键词:K-均值聚类;初始聚类中心;样本差异度;