基于索引效用的Top-k高效用项集挖掘方法
来源期刊:东北大学学报(自然科学版)2016年第1期
论文作者:林树宽 王晓丛 乔建忠 王蕊
文章页码:24 - 28
关键词:项集效用;索引效用;Top-k高效用项集;尾超项集;效用矩阵;
摘 要:已有的Top-k高效用项集挖掘为了保持向下封闭性,利用项集的事务效用代替其真实效用,使得项集效用被估计得过大,导致剪枝效果不好,挖掘效率较低.针对这一问题,提出了索引效用的概念,在此基础上建立两级索引,并进行索引剪枝,增强了挖掘中剪枝的效果,提高了Top-k高效用项集挖掘的效率;此外,通过建立效用矩阵,支持对项集效用的快速计算,进一步提高了挖掘效率.不同类型数据集上的实验验证了所提出的Top-k高效用项集挖掘方法的有效性和高效性.
林树宽,王晓丛,乔建忠,王蕊
东北大学信息科学与工程学院
摘 要:已有的Top-k高效用项集挖掘为了保持向下封闭性,利用项集的事务效用代替其真实效用,使得项集效用被估计得过大,导致剪枝效果不好,挖掘效率较低.针对这一问题,提出了索引效用的概念,在此基础上建立两级索引,并进行索引剪枝,增强了挖掘中剪枝的效果,提高了Top-k高效用项集挖掘的效率;此外,通过建立效用矩阵,支持对项集效用的快速计算,进一步提高了挖掘效率.不同类型数据集上的实验验证了所提出的Top-k高效用项集挖掘方法的有效性和高效性.
关键词:项集效用;索引效用;Top-k高效用项集;尾超项集;效用矩阵;