联邦搜索中基于词向量的多样化信息源选择算法
来源期刊:软件工程2018年第11期
论文作者:王雅蓉 李亮 吴胜利
文章页码:1 - 6
关键词:联邦搜索;信息源选择;检索结果多样化;词向量;
摘 要:对支持检索结果多样化任务的信息源选择进行了研究。分析了现有研究的不足,提出利用词向量提取文本的语义特征,在此基础上实现文档建模和信息源选择。采用ClueWeb12b-13数据集构建实验平台和进行实验,基于R方法的评价结果表明,所提出的方法优于现有的方法GLS和MnStD,且在不同条件下性能稳定。
王雅蓉,李亮,吴胜利
江苏大学
摘 要:对支持检索结果多样化任务的信息源选择进行了研究。分析了现有研究的不足,提出利用词向量提取文本的语义特征,在此基础上实现文档建模和信息源选择。采用ClueWeb12b-13数据集构建实验平台和进行实验,基于R方法的评价结果表明,所提出的方法优于现有的方法GLS和MnStD,且在不同条件下性能稳定。
关键词:联邦搜索;信息源选择;检索结果多样化;词向量;