基于投票信息熵的AdaBoost改进算法
来源期刊:控制与决策2010年第4期
论文作者:唐焕玲 鲁明羽 邬俊
文章页码:487 - 492
关键词:AdaBoost;朴素贝叶斯;文本分类;样本权重;投票信息熵;
摘 要:针对AdaBoost算法不能有效提升NB(Naive Bayesian)的分类性能,提出一种改进的样本权重维护策略.权重的调整不仅依据样本是否分错,还需考虑前几轮的多个基分类器对它的投票分歧.基分类器的信任度不但与错误率有关,还与基分类器间的差异性有关.这样可以提高基分类器的正确性,增加基分类器的差异性.实验结果表明,改进的BoostVE-NB算法能有效地提升NB文本分类性能.
唐焕玲,鲁明羽,邬俊
大连海事大学信息科学技术学院
摘 要:针对AdaBoost算法不能有效提升NB(Naive Bayesian)的分类性能,提出一种改进的样本权重维护策略.权重的调整不仅依据样本是否分错,还需考虑前几轮的多个基分类器对它的投票分歧.基分类器的信任度不但与错误率有关,还与基分类器间的差异性有关.这样可以提高基分类器的正确性,增加基分类器的差异性.实验结果表明,改进的BoostVE-NB算法能有效地提升NB文本分类性能.
关键词:AdaBoost;朴素贝叶斯;文本分类;样本权重;投票信息熵;