简介概要

基于属性相关性的K N N近邻填补算法改进

来源期刊:江西理工大学学报2019年第1期

论文作者:谢霖铨 赵楠 徐浩 毕永朋

文章页码:95 - 101

关键词:KNN填补;主成分分析;协方差;离差;属性影响量;

摘    要:为了进一步提高缺失数据的填补效果和降低数据缺失比例带来的影响,提出了基于属性相关的KNN近邻填补算法.将主成份分析算法应用到KNN填补算法中,先用KNN算法计算得到的数值作为主体填补值,然后使用主成分分析过程中产生的协方差矩阵作为整体属性的相关性.由缺失项和K个近邻的离差和相应相关性算出属性影响量,最后并入到KNN计算值之中,得到的数值就是算法改进后的最终估算数值.经数据集仿真实验,算法改进后填补效果更好准确度更高.

详情信息展示

基于属性相关性的K N N近邻填补算法改进

谢霖铨,赵楠,徐浩,毕永朋

江西理工大学理学院

摘 要:为了进一步提高缺失数据的填补效果和降低数据缺失比例带来的影响,提出了基于属性相关的KNN近邻填补算法.将主成份分析算法应用到KNN填补算法中,先用KNN算法计算得到的数值作为主体填补值,然后使用主成分分析过程中产生的协方差矩阵作为整体属性的相关性.由缺失项和K个近邻的离差和相应相关性算出属性影响量,最后并入到KNN计算值之中,得到的数值就是算法改进后的最终估算数值.经数据集仿真实验,算法改进后填补效果更好准确度更高.

关键词:KNN填补;主成分分析;协方差;离差;属性影响量;

<上一页 1 下一页 >

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号