一种基于概率图的实体联合标注关系抽取方法和系统

本发明公开了一种基于概率图的实体联合标注关系抽取方法和系统,属于自然语言处理技术领域。包括进行特征提取;进行实体抽取:将实体抽取任务转为序列标注任务,将所述序列输入第一模型中得到第一输出特征,对所述第一输出特征激活后得到预测序列,通过设定的阈值得到实体的开始和结束位置;根据就近原则对主体和客体进行匹配,标记相近的实体头部和尾部进行截取;进行关系分类:随机抽取实体对,并根据所述第一模型的中间特征,生成第二输出特征,将所述第二输出特征输入第二模型中得到对应分类关系。本发明考虑到两个子任务之间的相关性,使得抽取任务的结果不过分依赖于实体抽取的结果,避免误差累积的问题,以及关系重叠。 The inve...

Full description

Saved in:
Bibliographic Details
Format Patent
LanguageChinese
Published 20.06.2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:本发明公开了一种基于概率图的实体联合标注关系抽取方法和系统,属于自然语言处理技术领域。包括进行特征提取;进行实体抽取:将实体抽取任务转为序列标注任务,将所述序列输入第一模型中得到第一输出特征,对所述第一输出特征激活后得到预测序列,通过设定的阈值得到实体的开始和结束位置;根据就近原则对主体和客体进行匹配,标记相近的实体头部和尾部进行截取;进行关系分类:随机抽取实体对,并根据所述第一模型的中间特征,生成第二输出特征,将所述第二输出特征输入第二模型中得到对应分类关系。本发明考虑到两个子任务之间的相关性,使得抽取任务的结果不过分依赖于实体抽取的结果,避免误差累积的问题,以及关系重叠。 The invention discloses an entity joint labeling relation extraction method and system based on a probability graph, and belongs to the technical field of natural language processing. Comprising the steps of feature extraction; an entity extraction task is converted into a sequence labeling task, a sequence is input into a first model to obtain a first output feature, a prediction sequence is obtained after the first output feature is activated, and the starting position and the ending position of the entity are obtained through a set threshold value; the subject and the object are matched according to the principle of proximity, and similar entity heads and tails are marked and intercepted; and performing relationship cla
Bibliography:Application Number: CN202210004530