一种分布式Web使用模式挖掘模型及算法
来源期刊:工程科学学报2006年第9期
论文作者:张克君 杨炳儒 赵耿 曲文龙 李欣
文章页码:896 - 901
关键词:分布式数据挖掘;Web使用模式挖掘;Web日志挖掘;频繁路径;
摘 要:给出了一种分布式Web日志挖掘模型DWLMS.根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难.在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性.
张克君1,杨炳儒2,赵耿1,曲文龙2,李欣2
1. 北京电子科技学院计算机科学与技术系2. 北京科技大学信息工程学院
摘 要:给出了一种分布式Web日志挖掘模型DWLMS.根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难.在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性.
关键词:分布式数据挖掘;Web使用模式挖掘;Web日志挖掘;频繁路径;