基于相关系数的加权朴素贝叶斯分类算法
来源期刊:东北大学学报(自然科学版)2008年第7期
论文作者:张明卫 王波 张斌 朱志良
文章页码:952 - 955
关键词:数据挖掘;分类算法;朴素贝叶斯;加权朴素贝叶斯;相关系数;
摘 要:朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有效地提高了朴素贝叶斯算法的分类性能.首先给出了基于相关系数的属性权值求解方法,然后描述了相应的算法,并对算法原理进行了分析与证明.通过在中医小儿肺炎病例数据集和UCI数据集上的仿真实验,验证了该方法的有效性.
张明卫,王波,张斌,朱志良
摘 要:朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有效地提高了朴素贝叶斯算法的分类性能.首先给出了基于相关系数的属性权值求解方法,然后描述了相应的算法,并对算法原理进行了分析与证明.通过在中医小儿肺炎病例数据集和UCI数据集上的仿真实验,验证了该方法的有效性.
关键词:数据挖掘;分类算法;朴素贝叶斯;加权朴素贝叶斯;相关系数;