基于句法和语义关联的科技文献“问题—方法”联合抽取模型

[目的/意义]发现海量科技文献中的研究问题及其对应的研究方法,有助于挖掘科学研究中的热点,促进技术方法的创新,探索知识的演化传播规律。[方法/过程]提出一种融合句法结构和语义关联信息的科技文献“问题—方法”联合抽取模型,模型采用编码器—解码器结构。在编码层,以科技文献的摘要文本为对象,从中抽取SAO三元组句法结构用以表达研究问题和研究方法的关系(即:研究方法—作用于—研究问题),基于SAO三元组构造语义关联图并利用图注意力网络进行编码,再与摘要文本编码融合作为解码器的输入特征;在解码层,通过指针网络基于先抽取的研究方法再抽取研究问题,实现“问题—方法”的联合抽取。[结果/结论]实验结果表明,模...

Full description

Saved in:
Bibliographic Details
Published in知识管理论坛 Vol. 9; no. 4; pp. 353 - 366
Main Authors 刘勘, 李冶, 石锴文
Format Journal Article
LanguageChinese
Published 中国科学院文献情报中心 30.08.2024
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:[目的/意义]发现海量科技文献中的研究问题及其对应的研究方法,有助于挖掘科学研究中的热点,促进技术方法的创新,探索知识的演化传播规律。[方法/过程]提出一种融合句法结构和语义关联信息的科技文献“问题—方法”联合抽取模型,模型采用编码器—解码器结构。在编码层,以科技文献的摘要文本为对象,从中抽取SAO三元组句法结构用以表达研究问题和研究方法的关系(即:研究方法—作用于—研究问题),基于SAO三元组构造语义关联图并利用图注意力网络进行编码,再与摘要文本编码融合作为解码器的输入特征;在解码层,通过指针网络基于先抽取的研究方法再抽取研究问题,实现“问题—方法”的联合抽取。[结果/结论]实验结果表明,模型在测评指标及人工测评中均能取得较好的效果,能够提升从科技文献中抽取核心问题和核心方法的能力。
ISSN:2095-5472
2095-5472