一种集成本体和SVM的文本分类方法
来源期刊:江西理工大学学报2012年第1期
论文作者:朱平 范少辉 岳永德
文章页码:68 - 72
关键词:文本分类;本体;支持向量机;
摘 要:针对现有的基于SVM的分类方法缺乏对概念语义的处理这一缺点,提出一种集成本体和SVM的文本分类方法.该方法基于领域本体将词特征映射为概念特征,将概念特征及其权重送入SVM进行训练和分类.采用集成本体和SVM的分类方法降低了分类空间的维数,从而节省了分类器的训练时间,也节省了分类期间用于相似度比较的时间.基于概念上下位扩展,解决了父子概念实际联系非常紧密,但在分类的时候却完全视为不同特征词的缺陷.经过对竹藤领域的文本分类实验证明,该方法相比传统的基于SVM的分类方法在分类的准确度上有了较大的提高.
朱平,范少辉,岳永德
国家林业局国际竹藤网络中心
摘 要:针对现有的基于SVM的分类方法缺乏对概念语义的处理这一缺点,提出一种集成本体和SVM的文本分类方法.该方法基于领域本体将词特征映射为概念特征,将概念特征及其权重送入SVM进行训练和分类.采用集成本体和SVM的分类方法降低了分类空间的维数,从而节省了分类器的训练时间,也节省了分类期间用于相似度比较的时间.基于概念上下位扩展,解决了父子概念实际联系非常紧密,但在分类的时候却完全视为不同特征词的缺陷.经过对竹藤领域的文本分类实验证明,该方法相比传统的基于SVM的分类方法在分类的准确度上有了较大的提高.
关键词:文本分类;本体;支持向量机;