基于上三角矩阵构造多叉树的多维关联规则挖掘算法
来源期刊:软件工程2017年第6期
论文作者:叶涛 于利霞 张亚平
文章页码:8 - 15
关键词:多维关联规则;上三角矩阵;频繁项集树;有效属性层次数;
摘 要:针对基于Iapriori算法的多维关联规则数据挖掘存在I/O负载过大,候选项集指数倍增加,优化算法随机性强,容易陷入局部最优解等问题。本文提出一种基于上三角矩阵和多叉树结合(UTMTU)的多维关联规则挖掘算法,算法对原数据编码筛选后映射为上三角矩阵,再映射为频繁项集树,实现整个过程只扫描一次数据库而不产生候选项集,将时间和空间成本尽量降到最低,并利用有效属性层次数提高内存和I/O的利用率。通过UTMTU与Iapriori对比分析表明,其算法的效率和精度得到显著地提高,有效改善原始算法的两个瓶颈问题。
叶涛1,于利霞2,张亚平2
1. 青海民族大学计算机学院2. 天津大学计算机学院
摘 要:针对基于Iapriori算法的多维关联规则数据挖掘存在I/O负载过大,候选项集指数倍增加,优化算法随机性强,容易陷入局部最优解等问题。本文提出一种基于上三角矩阵和多叉树结合(UTMTU)的多维关联规则挖掘算法,算法对原数据编码筛选后映射为上三角矩阵,再映射为频繁项集树,实现整个过程只扫描一次数据库而不产生候选项集,将时间和空间成本尽量降到最低,并利用有效属性层次数提高内存和I/O的利用率。通过UTMTU与Iapriori对比分析表明,其算法的效率和精度得到显著地提高,有效改善原始算法的两个瓶颈问题。
关键词:多维关联规则;上三角矩阵;频繁项集树;有效属性层次数;