简介概要

一种用于数据挖掘算法的数据生成方法

来源期刊：东北大学学报(自然科学版)2008年第3期

论文作者：魏伟杰张斌王波张明卫

文章页码：328 - 331

关键词：数据挖掘;算法测试;模拟数据集生成;遗传算法;熵;

摘要：由于受到保密性、时间和数据多样性等一些原因的限制,测试数据集的获取一直困扰着数据挖掘算法的研究.因此,提出一种基于遗传算法和熵的测试数据集的模拟生成方法,生成方法利用遗传算法具有继承性的特性对采集到的少量的真实数据进行扩充和模拟,用熵衡量生成数据与真实数据的相似程度,最终生成规模大的测试数据集,并给出了描述型数据的生成算法.使用此方法,可以生成同真实数据集具有相同的属性,相同的属性取值区间和属性值分布,类似属性关联关系的测试数据集,加速数据挖掘算法的研究进程.

详情信息展示

一种用于数据挖掘算法的数据生成方法

魏伟杰，张斌，王波，张明卫

摘要：由于受到保密性、时间和数据多样性等一些原因的限制,测试数据集的获取一直困扰着数据挖掘算法的研究.因此,提出一种基于遗传算法和熵的测试数据集的模拟生成方法,生成方法利用遗传算法具有继承性的特性对采集到的少量的真实数据进行扩充和模拟,用熵衡量生成数据与真实数据的相似程度,最终生成规模大的测试数据集,并给出了描述型数据的生成算法.使用此方法,可以生成同真实数据集具有相同的属性,相同的属性取值区间和属性值分布,类似属性关联关系的测试数据集,加速数据挖掘算法的研究进程.

关键词：数据挖掘;算法测试;模拟数据集生成;遗传算法;熵;

<上一页 1 下一页 >

相关论文

基于模糊遗传算法的数据库异常数据挖掘

基于遗传算法的数据挖掘方法及应用

一种基于信息熵的异常数据挖掘算法

铝合金活塞杆关键数据挖掘方法优化研究

数据挖掘在安钢电极预测建模中的应用

矿山砂岩基于数据挖掘的破坏过程研究

基于遗传算法的彩色图象分割

数据挖掘研究现状及发展趋势

基于双曲方程特征分解的水生态数据挖掘

一种基于遗传算法的最小交叉熵阈值选择方法

相关知识点

数据挖掘的步骤

矿山数据挖掘方法

遗传算法的基本操作

遗传算法的发展概况

遗传算法原理与方法

遗传算法的应用

遗传算法的基本思想

遗传算法的基本特点

遗传算法结语

遗传算法的实质

有色金属在线官网 | 会议 | 在线投稿 | 购买纸书 | 科技图书馆

中南大学出版社技术支持版权声明电话：0731-88830515 88830516 传真：0731-88710482 Email:administrator@cnnmol.com

互联网出版许可证：（署）网出证（京）字第342号京ICP备17050991号-6 京公网安备11010802042557号