基于密度的划分式聚类过程参数选择算法
来源期刊:控制与决策2016年第1期
论文作者:吴杨 王韬 李进东
文章页码:21 - 29
关键词:聚类算法;聚类中心;样本密度;关系树;最大最小距离;
摘 要:为确定-means等聚类算法的初始聚类中心,首先由样本总量及其取值区间长度确定对应维上的样本密度统计区间数,并将满足筛选条件的密度峰值所在区间内的样本均值作为候选初始聚类中心;然后,根据密度峰值区间在各维上的映射关系建立候选初始聚类中心关系树,进一步采用最大最小距离算法获得初始聚类中心;最后为确定最佳聚类数,基于类内样本密度及类密度建立聚类有效性评估函数.针对人工数据集及UCI数据集的实验结果表明了所提出算法的有效性.
吴杨,王韬,李进东
中国人民解放军军械工程学院信息工程系
摘 要:为确定-means等聚类算法的初始聚类中心,首先由样本总量及其取值区间长度确定对应维上的样本密度统计区间数,并将满足筛选条件的密度峰值所在区间内的样本均值作为候选初始聚类中心;然后,根据密度峰值区间在各维上的映射关系建立候选初始聚类中心关系树,进一步采用最大最小距离算法获得初始聚类中心;最后为确定最佳聚类数,基于类内样本密度及类密度建立聚类有效性评估函数.针对人工数据集及UCI数据集的实验结果表明了所提出算法的有效性.
关键词:聚类算法;聚类中心;样本密度;关系树;最大最小距离;