基于云模型的文本特征自动提取算法

来源期刊:中南大学学报(自然科学版)2011年第3期

论文作者:代劲 何中市 胡峰

文章页码:714 - 720

关键词:文本分类;特征提取;云模型;隶属度;动态聚类

Key words:text classification; feature selection; cloud model; membership degree; dynamic clustering

摘    要:在综合考虑特征整体与局部分布基础上,提出一种高性能的文本特征自动提取算法。算法引入云隶属度概念对特征分布进行修正,不需任何先验知识,能根据特征分布特点自动获取云隶属度高的特征集。实验结果表明:该特征集具有特征个数少、分类精度高的特点,性能明显比当前主要的特征选择方法的性能优。

Abstract: Combining the overall with the local distribution of features in categories, a high performance algorithm for feature automation selection (Named FAS) was proposed. By using FAS, the feature set was obtained automatically and the distribution of features was amended by using cloud model theory. The results show the selected feature set has fewer features and better classification performance than the existing methods.

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号