从研报中进行关键信息提取方法及相关设备
本发明属于数据处理技术领域,具体涉及一种从研报中进行关键信息提取方法及相关设备。其中方法包括:获取研报文件,型对研报文件进行目标检测,得到目标检测结果,目标检测结果为多个目标在研报文件中的位置及类别信息;解析研报文件,获取研报文件内每一页中的字符信息,根据目标检测结果,将位于同一个目标内的字符进行合并,得到文本信息和对应的坐标位置;通过预设的文本分类模型对文本信息进行主题分类,对研报文件按主题分类进行分类存储和输出。本发明可以对不同主题的研报文件进行分类,通过对研报主题进行分类,可以快速的筛选出自己所关注的研报类别,忽略不相关的研报。 The invention belongs to the...
Saved in:
Format | Patent |
---|---|
Language | Chinese |
Published |
25.03.2022
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | 本发明属于数据处理技术领域,具体涉及一种从研报中进行关键信息提取方法及相关设备。其中方法包括:获取研报文件,型对研报文件进行目标检测,得到目标检测结果,目标检测结果为多个目标在研报文件中的位置及类别信息;解析研报文件,获取研报文件内每一页中的字符信息,根据目标检测结果,将位于同一个目标内的字符进行合并,得到文本信息和对应的坐标位置;通过预设的文本分类模型对文本信息进行主题分类,对研报文件按主题分类进行分类存储和输出。本发明可以对不同主题的研报文件进行分类,通过对研报主题进行分类,可以快速的筛选出自己所关注的研报类别,忽略不相关的研报。
The invention belongs to the technical field of data processing, and particularly relates to a method for extracting key information from research reports and related equipment. The method comprises the steps of obtaining a research report file, performing target detection on the research report file to obtain a target detection result, wherein the target detection result is position and category information of a plurality of targets in the research report file; analyzing the research report file, obtaining character information in each page in the research report file, and combining characters in the same target according to a target detection result to obtain text information and a corresponding coordinate position; performing subject classi |
---|---|
Bibliography: | Application Number: CN202110421724 |