基于协同进化机制的欠采样方法
来源期刊:工程科学学报2011年第12期
论文作者:翟云 杨炳儒 王树鹏 张德政 安冰
文章页码:1550 - 1557
关键词:非平衡数据集;分类;采样;协同进化;自适应算法;
摘 要:针对非平衡数据集分类中"少数类样本精度难以提高"这一瓶颈问题,提出了一种基于协同进化机制的欠采样方法.此方法将少数类样本与多数类样本划分为两类种群,采用种群协同进化原理,利用提出的动态交叉变异算子自适应协同进化过程,实现种群间自动调节和自动适应.仿真试验结果表明,此采样方法增强了局部随机搜索能力,改善了种群的分布特性,加强了算法的全局收敛能力,在不降低多数类样本分类性能的基础上有效提高了少数类样本的精度.与其他经典重采样方法相比,本文办法抗噪能力好,具有更强的鲁棒性.
翟云1,2,杨炳儒2,王树鹏3,张德政2,安冰1
1. 聊城大学计算机学院2. 北京科技大学计算机与通信工程学院3. 中国科学院计算技术研究所
摘 要:针对非平衡数据集分类中"少数类样本精度难以提高"这一瓶颈问题,提出了一种基于协同进化机制的欠采样方法.此方法将少数类样本与多数类样本划分为两类种群,采用种群协同进化原理,利用提出的动态交叉变异算子自适应协同进化过程,实现种群间自动调节和自动适应.仿真试验结果表明,此采样方法增强了局部随机搜索能力,改善了种群的分布特性,加强了算法的全局收敛能力,在不降低多数类样本分类性能的基础上有效提高了少数类样本的精度.与其他经典重采样方法相比,本文办法抗噪能力好,具有更强的鲁棒性.
关键词:非平衡数据集;分类;采样;协同进化;自适应算法;