面向金融领域的文档级事件主体对抽取的方法、存储介质及设备
面向金融领域的文档级事件主体对抽取的方法、存储介质及设备,属于信息技术领域。为了解决现有的基于句子级的事件抽取的方法不能很好的应用于金融领域内文档的事件抽取,从而存在提取事件信息的性能较低的问题。本发明首先将文档按句进行分割,将第i个句子基于字通过词典映射成句子id,并将句子通过第一个字的Embedding矩阵,然后输入BERT,取其最后一层的编码得到句子中的每个token的编码并得到特征向量C;根据每个事件类型获取对应的t,获取文档级上下文表示eglobal;将每个token的hi,j拼接C、t和eglobal;最后基于前馈神经网络和CRF得到标注结果并最终得到主体对。主要用于金融领域的文档...
Saved in:
Format | Patent |
---|---|
Language | Chinese |
Published |
12.07.2024
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | 面向金融领域的文档级事件主体对抽取的方法、存储介质及设备,属于信息技术领域。为了解决现有的基于句子级的事件抽取的方法不能很好的应用于金融领域内文档的事件抽取,从而存在提取事件信息的性能较低的问题。本发明首先将文档按句进行分割,将第i个句子基于字通过词典映射成句子id,并将句子通过第一个字的Embedding矩阵,然后输入BERT,取其最后一层的编码得到句子中的每个token的编码并得到特征向量C;根据每个事件类型获取对应的t,获取文档级上下文表示eglobal;将每个token的hi,j拼接C、t和eglobal;最后基于前馈神经网络和CRF得到标注结果并最终得到主体对。主要用于金融领域的文档级事件主体对抽取。
The invention discloses a financial field-oriented document-level event subject pair extraction method, a storage medium and equipment, and belongs to the technical field of information. The problem that an existing event extraction method based on the sentence level cannot be well applied to event extraction of documents in the financial field, and therefore the performance of event information extraction is low is solved. According to the method, firstly, a document is segmented according to sentences, the ith sentence is mapped into a sentence id through a dictionary on the basis of words, the sentence passes through an Embedding matrix of the first word and then is input into BERT, codes of the last l |
---|---|
Bibliography: | Application Number: CN202111481843 |