利用技术分类号辅助的无监督专利实体抽取方法研究
[目的/意义]无监督的专利实体抽取方法可以有效解决之前方法高度依赖标注资源的痼疾,进而推动智能技术在专利数据上的广泛应用并提升专利信息服务的能力和水平。[方法/过程]将专利文献固有的技术分类号与主题模型相结合,利用技术分类号指导专利词汇上的主题分配过程,进而提出一种无需实体标注信息的专利实体抽取方法。[结果/结论]利用硬盘驱动器薄膜磁头领域专利数据集和IPC技术分类体系进行实证分析,实验结果显示,不同层级的技术分类号在实体抽取上效果差异巨大,而基于IPC第五层级技术分类号方法的实体抽取效果远优于常规的SAO方法。...
Saved in:
Published in | 知识管理论坛 Vol. 9; no. 4; pp. 422 - 436 |
---|---|
Main Authors | , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
中国科学院文献情报中心
30.08.2024
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | [目的/意义]无监督的专利实体抽取方法可以有效解决之前方法高度依赖标注资源的痼疾,进而推动智能技术在专利数据上的广泛应用并提升专利信息服务的能力和水平。[方法/过程]将专利文献固有的技术分类号与主题模型相结合,利用技术分类号指导专利词汇上的主题分配过程,进而提出一种无需实体标注信息的专利实体抽取方法。[结果/结论]利用硬盘驱动器薄膜磁头领域专利数据集和IPC技术分类体系进行实证分析,实验结果显示,不同层级的技术分类号在实体抽取上效果差异巨大,而基于IPC第五层级技术分类号方法的实体抽取效果远优于常规的SAO方法。 |
---|---|
ISSN: | 2095-5472 2095-5472 |