简介概要

异构数据联合式的真值发现算法

来源期刊：东北大学学报(自然科学版)2017年第10期

论文作者：陈超申德荣寇月于戈

文章页码：1373 - 2763

关键词：真值;真值发现;KMeans聚类;最优化;异构数据;

摘要：互联网上提供的同一事实的信息通常会存在冲突,影响数据集成和知识发现.为了甄别真值,提出了一种基于距离的异构数据联合真值发现算法.首先,关于同一数据项,基于数据源声明值与真值的距离,计算数据项向量;采用KMeans聚类算法,获得数据项初始聚类.然后,迭代进行信任分析和聚类,即在每个类簇内,采用最优化思想,联合异构类型数据,更新事实的可信度和数据源的类簇内可靠性,重新计算每个数据项向量,再次聚类,迭代直至类簇达到稳定.实验结果表明:由于细粒度的数据源质量划分,联合考虑异构数据类型,可以获得更高的真值发现准确度.

详情信息展示

异构数据联合式的真值发现算法

陈超^1,2，申德荣¹，寇月¹，于戈¹

1. 东北大学计算机科学与工程学院2. 渤海大学信息科学与技术学院

摘要：互联网上提供的同一事实的信息通常会存在冲突,影响数据集成和知识发现.为了甄别真值,提出了一种基于距离的异构数据联合真值发现算法.首先,关于同一数据项,基于数据源声明值与真值的距离,计算数据项向量;采用KMeans聚类算法,获得数据项初始聚类.然后,迭代进行信任分析和聚类,即在每个类簇内,采用最优化思想,联合异构类型数据,更新事实的可信度和数据源的类簇内可靠性,重新计算每个数据项向量,再次聚类,迭代直至类簇达到稳定.实验结果表明:由于细粒度的数据源质量划分,联合考虑异构数据类型,可以获得更高的真值发现准确度.

关键词：真值;真值发现;KMeans聚类;最优化;异构数据;

<上一页 1 下一页 >

相关论文

基于异构数据融合技术的地下矿生产计划优化

分布计算与异构数据环境分析

智慧矿山异构数据集成平台设计

数字化矿山中异构数据集成研究

集成异构数据源的在线考试系统研究

基于异构数据集成的煤与瓦斯突出监控预警系统

数控机床IETM系统中异构数据集成技术研究

灰色异构数据信息下的随机多准则决策方法

水声装配试验生产线异构数据采集系统设计

面向异构数据源和多样化应用的企业计量信息系统

相关知识点

测量真值的估计

算术平均值代替真值的均方根误差

氧化铝含量控制模型

碳化硅材料的优化

操作制度优化

矿井通风的优化研究

氧化铝含量控制问题的提出

粉末成分及杂质含量的控制

测量绝对误差

铝箔轧制工艺参数的优化

熔体氢含量检测技术

有色金属在线官网 | 会议 | 在线投稿 | 购买纸书 | 科技图书馆

中南大学出版社技术支持版权声明电话：0731-88830515 88830516 传真：0731-88710482 Email:administrator@cnnmol.com

互联网出版许可证：（署）网出证（京）字第342号京ICP备17050991号-6 京公网安备11010802042557号