基于不确定数据的频繁项查询算法
来源期刊:东北大学学报(自然科学版)2011年第3期
论文作者:王爽 杨广明 朱志良
文章页码:344 - 347
关键词:频繁项;不确定数据;剪枝规则;不确定数据模型;查询处理;
摘 要:频繁项的查询是一项非常重要的技术,但在新兴的不确定数据领域却是一项新的研究课题.基于不确定数据,提出了一种新的频繁项定义,并提出了两条过滤规则,可以有效地减少检测数据的数量.最后提出高效的频繁项查询算法UFI,该算法通过找到概率求解中的递推规律,极大提高了单点检测效率.实验结果显示:提出的方法可以有效地减少候选集,降低搜索空间,改善在不确定数据上的查询性能.
王爽,杨广明,朱志良
东北大学软件学院
摘 要:频繁项的查询是一项非常重要的技术,但在新兴的不确定数据领域却是一项新的研究课题.基于不确定数据,提出了一种新的频繁项定义,并提出了两条过滤规则,可以有效地减少检测数据的数量.最后提出高效的频繁项查询算法UFI,该算法通过找到概率求解中的递推规律,极大提高了单点检测效率.实验结果显示:提出的方法可以有效地减少候选集,降低搜索空间,改善在不确定数据上的查询性能.
关键词:频繁项;不确定数据;剪枝规则;不确定数据模型;查询处理;