基于文献的地质实体关系抽取方法研究
来源期刊:中国矿业2017年第10期
论文作者:吕鹏飞 王春宁 朱月琴
文章页码:167 - 172
关键词:文献;关系抽取;统计语言模型;Bootstrapping;
摘 要:实体关系抽取是信息抽取的一项重要内容,通过实体关系的抽取能够发现文本中的有价值信息。本文在分析和比较了有监督、无监督、弱监督以及开放式等关系抽取方法的原理和特点的基础上,建立了基于文献的地质实体关系抽取模型:采用统计语言模型作为关系抽取方式、采用Bootstrapping算法作为关系扩展方式。最后据此进行了关联关系发现和关系扩展发现实验。
吕鹏飞1,2,王春宁1,朱月琴3,4
1. 中国地质图书馆2. 中国科学院大学3. 中国地质调查局发展研究中心4. 国土资源部地质信息技术重点实验室
摘 要:实体关系抽取是信息抽取的一项重要内容,通过实体关系的抽取能够发现文本中的有价值信息。本文在分析和比较了有监督、无监督、弱监督以及开放式等关系抽取方法的原理和特点的基础上,建立了基于文献的地质实体关系抽取模型:采用统计语言模型作为关系抽取方式、采用Bootstrapping算法作为关系扩展方式。最后据此进行了关联关系发现和关系扩展发现实验。
关键词:文献;关系抽取;统计语言模型;Bootstrapping;