基于极限学习机和混合特征的中文书目自动分类模型研究
来源期刊:北方工业大学学报2018年第5期
论文作者:刘高军 陈强强
文章页码:99 - 104
关键词:LDA;中图法;极限学习机;混合特征;自动分类;
摘 要:为了提高中文图书自动分类的效率,解决图书编目人员手工分类难以适应快速增长的图书出版量的问题,本文提出了一种基于极限学习机(ELM)和混合特征的中文图书分类模型.通过LDA主题模型获取图书摘要信息中的主题分布、TF-IDF模型获取图书标题中的特征信息,并将二者组合起来构成图书的混合特征,在此基础上使用极限学习机算法构建出面向中图法的层次分类器.实验表明,基于ELM和混合特征构建的层次分类器在中图法的第1层、2层和3层分类效果可分别达到89%、84%、79%,相比传统的支持向量机(SVM)算法分类效果可提高3%~5%,而且相比SVM训练时间可以缩短1/2.研究结果表明基于ELM和混合特征的分类模型可以有效提高中文图书自动分类的准确率与时效性.
刘高军,陈强强
北方工业大学计算机学院
摘 要:为了提高中文图书自动分类的效率,解决图书编目人员手工分类难以适应快速增长的图书出版量的问题,本文提出了一种基于极限学习机(ELM)和混合特征的中文图书分类模型.通过LDA主题模型获取图书摘要信息中的主题分布、TF-IDF模型获取图书标题中的特征信息,并将二者组合起来构成图书的混合特征,在此基础上使用极限学习机算法构建出面向中图法的层次分类器.实验表明,基于ELM和混合特征构建的层次分类器在中图法的第1层、2层和3层分类效果可分别达到89%、84%、79%,相比传统的支持向量机(SVM)算法分类效果可提高3%~5%,而且相比SVM训练时间可以缩短1/2.研究结果表明基于ELM和混合特征的分类模型可以有效提高中文图书自动分类的准确率与时效性.
关键词:LDA;中图法;极限学习机;混合特征;自动分类;