简介概要

基于中文图书评论的特征挖掘算法的研究

来源期刊:北方工业大学学报2016年第3期

论文作者:何丽 郝文静

文章页码:34 - 110

关键词:中文图书评论;产品特征;数据挖掘;FP-Growth算法;

摘    要:针对中文图书评论中的产品特征提取问题,本文基于FP-Growth算法进行图书评论特征提取,并在此基础上对挖掘过程进行了适应性改进.首先利用冗余词典减少冗余度以解决挖掘结果冗余度大的问题;然后根据评论长度赋予不同支持度的权重改进FP-Growth算法;最后根据独立支持度和各特征词的置信度对候选特征词进行过滤筛选.本文采用亚马逊网站上的真实图书评论数据进行实验验证,实验结果证明,该算法与传统FP-Growth算法、Apriori算法和TF-IDF算法挖掘结果相比,查全率显著提高,综合值也有所提高.

详情信息展示

基于中文图书评论的特征挖掘算法的研究

何丽,郝文静

北方工业大学计算机学院

摘 要:针对中文图书评论中的产品特征提取问题,本文基于FP-Growth算法进行图书评论特征提取,并在此基础上对挖掘过程进行了适应性改进.首先利用冗余词典减少冗余度以解决挖掘结果冗余度大的问题;然后根据评论长度赋予不同支持度的权重改进FP-Growth算法;最后根据独立支持度和各特征词的置信度对候选特征词进行过滤筛选.本文采用亚马逊网站上的真实图书评论数据进行实验验证,实验结果证明,该算法与传统FP-Growth算法、Apriori算法和TF-IDF算法挖掘结果相比,查全率显著提高,综合值也有所提高.

关键词:中文图书评论;产品特征;数据挖掘;FP-Growth算法;

<上一页 1 下一页 >

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号