面向不平衡数据集的一种改进的k-近邻分类器
来源期刊:东北大学学报(自然科学版)2019年第7期
论文作者:刘鹏 杜佳芝 吕伟刚 窦明武
文章页码:932 - 936
关键词:心律失常;心电图;模式分类;k-近邻算法;不平衡数据集;
摘 要:心脏心律失常数据集的心电图(ECG)数据往往存在各心律失常类型下样本数量不平衡问题.针对此问题,提出了一种新的模式识别分类方法,即改进的基于核的差重建的加权k-近邻分类器(modified kernel difference-w eighted k-nearest neighbor classifier,M KDF-WKNN),通过引入修正因子对含样本数较多的类别进行权值抑制,对含样本数较少的类别进行权值的加大,并使用UCI心脏心律失常数据集对ECG数据进行分类.实验结果表明,提出的算法和其他一些基于KNN的算法如KNN,DS-WKNN,DF-WKNN和KDF-WKNN相比,对于不平衡的心律失常数据集的分类有更好的效果.
刘鹏,杜佳芝,吕伟刚,窦明武
摘 要:心脏心律失常数据集的心电图(ECG)数据往往存在各心律失常类型下样本数量不平衡问题.针对此问题,提出了一种新的模式识别分类方法,即改进的基于核的差重建的加权k-近邻分类器(modified kernel difference-w eighted k-nearest neighbor classifier,M KDF-WKNN),通过引入修正因子对含样本数较多的类别进行权值抑制,对含样本数较少的类别进行权值的加大,并使用UCI心脏心律失常数据集对ECG数据进行分类.实验结果表明,提出的算法和其他一些基于KNN的算法如KNN,DS-WKNN,DF-WKNN和KDF-WKNN相比,对于不平衡的心律失常数据集的分类有更好的效果.
关键词:心律失常;心电图;模式分类;k-近邻算法;不平衡数据集;