基于非结构化数据挖掘结构模型的Web文本聚类算法
来源期刊:工程科学学报2008年第2期
论文作者:胡健 杨炳儒 宋泽锋 钱榕
文章页码:217 - 220
关键词:Web文本挖掘;文本聚类;聚类评价;非结构化数据挖掘结构模型;
摘 要:在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识.
胡健1,杨炳儒2,宋泽锋2,钱榕2
1. 江西理工大学信息工程学院2. 北京科技大学信息工程学院
摘 要:在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识.
关键词:Web文本挖掘;文本聚类;聚类评价;非结构化数据挖掘结构模型;