基于密度的混合属性数据流聚类算法
来源期刊:控制与决策2010年第3期
论文作者:黄德才 吴天虹
文章页码:416 - 421
关键词:数据流;数据挖掘;聚类;混合属性;密度;
摘 要:数据流聚类分析是当前数据挖掘研究的热点问题,为了克服数据流聚类框架CluStream算法不能处理混合属性数据流的缺陷,提出了基于密度的混合属性数据流聚类算法MCStream.在微聚类中使用面向维度的距离来度量对象之间的相似度,在宏聚类中使用改进的密度聚类算法M-DBSCAN对微簇进行聚类.实验结果表明,MCStream算法能快速有效地处理混合属性数据流聚类问题.
黄德才,吴天虹
浙江工业大学计算机科学与技术学院
摘 要:数据流聚类分析是当前数据挖掘研究的热点问题,为了克服数据流聚类框架CluStream算法不能处理混合属性数据流的缺陷,提出了基于密度的混合属性数据流聚类算法MCStream.在微聚类中使用面向维度的距离来度量对象之间的相似度,在宏聚类中使用改进的密度聚类算法M-DBSCAN对微簇进行聚类.实验结果表明,MCStream算法能快速有效地处理混合属性数据流聚类问题.
关键词:数据流;数据挖掘;聚类;混合属性;密度;