含正负项目的基于位串频繁项集挖掘算法研究
来源期刊:控制与决策2010年第1期
论文作者:张玉芳 熊忠阳 王灿 刘春泳
文章页码:37 - 42
关键词:负项目;关联规则;频繁模式树;频繁项集;
摘 要:对频繁模式树中的每个节点引入一个位串存储前缀路径,提出了包含正负项目的频繁模式树的构造方法,它不需要反复遍历节点就可获得包含正负项目的频繁项集.与直接使用FP-growth算法相比,无需对原始数据库进行负项目的扩展,也不用再构造并销毁额外的数据结构,只需在原始的频繁模式树上修改,因而在时空开销上都具有一定的优势.实验表明,所提出的算法比现有的同类挖掘算法和直接FP-growth算法具有更好的效率.
张玉芳1,熊忠阳2,王灿3,刘春泳1
1. 重庆大学计算机学院2. 重庆大学电气工程博士后流动站3. 华为技术有限公司成都研究所
摘 要:对频繁模式树中的每个节点引入一个位串存储前缀路径,提出了包含正负项目的频繁模式树的构造方法,它不需要反复遍历节点就可获得包含正负项目的频繁项集.与直接使用FP-growth算法相比,无需对原始数据库进行负项目的扩展,也不用再构造并销毁额外的数据结构,只需在原始的频繁模式树上修改,因而在时空开销上都具有一定的优势.实验表明,所提出的算法比现有的同类挖掘算法和直接FP-growth算法具有更好的效率.
关键词:负项目;关联规则;频繁模式树;频繁项集;