利用技术分类号辅助的无监督专利实体抽取方法研究

[目的/意义]无监督的专利实体抽取方法可以有效解决之前方法高度依赖标注资源的痼疾,进而推动智能技术在专利数据上的广泛应用并提升专利信息服务的能力和水平。[方法/过程]将专利文献固有的技术分类号与主题模型相结合,利用技术分类号指导专利词汇上的主题分配过程,进而提出一种无需实体标注信息的专利实体抽取方法。[结果/结论]利用硬盘驱动器薄膜磁头领域专利数据集和IPC技术分类体系进行实证分析,实验结果显示,不同层级的技术分类号在实体抽取上效果差异巨大,而基于IPC第五层级技术分类号方法的实体抽取效果远优于常规的SAO方法。...

Full description

Saved in:
Bibliographic Details
Published in知识管理论坛 Vol. 9; no. 4; pp. 422 - 436
Main Authors 陈亮, 尚玮姣, 余池, 牟琳, 夏春姊, 葛川
Format Journal Article
LanguageChinese
Published 中国科学院文献情报中心 30.08.2024
Subjects
Online AccessGet full text
ISSN2095-5472
2095-5472

Cover

Loading…
Abstract [目的/意义]无监督的专利实体抽取方法可以有效解决之前方法高度依赖标注资源的痼疾,进而推动智能技术在专利数据上的广泛应用并提升专利信息服务的能力和水平。[方法/过程]将专利文献固有的技术分类号与主题模型相结合,利用技术分类号指导专利词汇上的主题分配过程,进而提出一种无需实体标注信息的专利实体抽取方法。[结果/结论]利用硬盘驱动器薄膜磁头领域专利数据集和IPC技术分类体系进行实证分析,实验结果显示,不同层级的技术分类号在实体抽取上效果差异巨大,而基于IPC第五层级技术分类号方法的实体抽取效果远优于常规的SAO方法。
AbstractList [目的/意义]无监督的专利实体抽取方法可以有效解决之前方法高度依赖标注资源的痼疾,进而推动智能技术在专利数据上的广泛应用并提升专利信息服务的能力和水平。[方法/过程]将专利文献固有的技术分类号与主题模型相结合,利用技术分类号指导专利词汇上的主题分配过程,进而提出一种无需实体标注信息的专利实体抽取方法。[结果/结论]利用硬盘驱动器薄膜磁头领域专利数据集和IPC技术分类体系进行实证分析,实验结果显示,不同层级的技术分类号在实体抽取上效果差异巨大,而基于IPC第五层级技术分类号方法的实体抽取效果远优于常规的SAO方法。
Author 葛川
陈亮
尚玮姣
牟琳
余池
夏春姊
Author_xml – sequence: 1
  fullname: 陈亮
  organization: 中国科学技术信息研究所,北京100038
– sequence: 2
  fullname: 尚玮姣
  organization: 中国林业科学研究院林业科技信息研究所,北京100091
– sequence: 3
  fullname: 余池
  organization: 中国科学技术信息研究所,北京100038
– sequence: 4
  fullname: 牟琳
  organization: 中国科学技术信息研究所,北京100038
– sequence: 5
  fullname: 夏春姊
  organization: 中国科学技术信息研究所,北京100038
– sequence: 6
  fullname: 葛川
  organization: 山西省科技情报与战略研究中心,太原030032
BookMark eNrjYmDJy89LZWLgNDKwNNU1NTE3YkFiczDwFhdnJhmYGhqbm5gbmHIyuD7tWPl8yopnXQ3P5qx_2tH2fOPup_3bX-xrfdq18vmslmfTFzyfPfH53MVPdkwGqny6bt6TvZOfde192j_t2bSdzzZPfb5gyvOV23gYWNMSc4pTeaE0N4Oim2uIs4ducmJxcXxecXFKfFSwu49PiJGBkYmBARCZGxOjBgBbMlJz
ContentType Journal Article
DBID NSCOK
DatabaseName 国家哲学社会科学文献中心 (National Center for Philosophy and Social Sciences Documentation)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
Discipline Library & Information Science
EISSN 2095-5472
EndPage 436
ExternalDocumentID ZSGLLT2024004007
GroupedDBID -0Y
ALMA_UNASSIGNED_HOLDINGS
CCEZO
CUBFJ
GROUPED_DOAJ
M~E
NSCOK
U1G
U5S
ID FETCH-cass_nssd_ZSGLLT20240040073
ISSN 2095-5472
IngestDate Mon Feb 17 13:39:40 EST 2025
IsOpenAccess true
IsPeerReviewed true
IsScholarly true
Issue 4
Keywords 实体抽取
技术分类号
专利挖掘
主题模型
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-cass_nssd_ZSGLLT20240040073
OpenAccessLink https://www.ncpssd.cn/Literature/articleinfo?id=ZSGLLT2024004007&type=eJournalArticle&typename=中文期刊文章&nav=1&langType=1&pageUrl=https%253A%252F%252Fwww.ncpssd.org%252Fjournal%252Fdetails%253Fgch%253D211192%2526nav%253D1%2526langType%253D2
ParticipantIDs cass_nssd_ZSGLLT2024004007
PublicationCentury 2000
PublicationDate 2024-08-30
PublicationDateYYYYMMDD 2024-08-30
PublicationDate_xml – month: 08
  year: 2024
  text: 2024-08-30
  day: 30
PublicationDecade 2020
PublicationTitle 知识管理论坛
PublicationYear 2024
Publisher 中国科学院文献情报中心
Publisher_xml – name: 中国科学院文献情报中心
SSID ssib051374705
ssib017352901
ssj0002013348
ssib038575587
Score 4.730686
Snippet ...
SourceID cass
SourceType Aggregation Database
StartPage 422
Title 利用技术分类号辅助的无监督专利实体抽取方法研究
URI https://www.ncpssd.cn/Literature/articleinfo?id=ZSGLLT2024004007&type=eJournalArticle&typename=中文期刊文章&nav=1&langType=1&pageUrl=https%253A%252F%252Fwww.ncpssd.org%252Fjournal%252Fdetails%253Fgch%253D211192%2526nav%253D1%2526langType%253D2
Volume 9
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnV3NaxUxEA9tT17ET7RaeYLj7ZXdTbKbHJM2zyKtCFYoXgq7b4t4aMG-XnoQDyqllyKtFfyi4MVeFBH8QOpf0_fWP8OZ7L6-pVRRL8vsJJn5ZWaTTLKbDWNXsixLo2whaGYi0U3RDsNmmuikmUuuc54GUZbROuTMjXjqtrg-J-eGhm_Wvlpa6aTj2eqR-0r-x6vIQ7_SLtl_8OyBUGQgjf7FK3oYr3_lY3ASlAKjwSWgBRgFLgZl6PMFJPQEmFaVR8WUx4Zgree0wCbgFFgHSnqO6cvB4sIXT8AEnmNBh56YBMPBCbAKNK9pl2AcaOeTJn2Sh4F0qUvHXmAMVhNhOWhJAlE-wiZCg43rgbJX1wIjCSTWosSPWkyJJPAcRRxrSAti0wevj8Bp0JrQESKsmRukSLABVRKlKEflCT2K5oMsZS1KqCGCHKRgGU24SgiW1xdNIuFXgYODx7yylPFWQCOSORLSRdaUxDdxhdRElYFU4pVMeGB4y717vDXJFjWBFo3CB_14hFFsU4ryhKLx_AheNRDpWnsTtUFFRFEtPhH80K_DfTBy59a16elZqqrvlpNhNsxDOkti5oHr969hgtF2__wxvOd0OqschOcy5Di5rPr_e_4ldUgbtel8xj5ejFwynNXVYrDZE-x4NXlqmLIlnGRDq3dPsbFq603jaqPaW0cNrlENWqeZ667tFlvveusPe68-dNeeFB-_dze-_PzxuLu-W7x41Hu-U7x8Wrx-u_91E3N237_Z39vsre91N7Z72996n54VO1vF7ucz7HLLzU5MNQnX_OLycnv-sDH4WTayuLSYn2ONNBIyTReiYEGkoo1z7SDKcVKfB22lVBzk59no7-WM_inxAjs2eNIuspHO_ZV8DAPWTnrJe-EXBUlypg
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%88%A9%E7%94%A8%E6%8A%80%E6%9C%AF%E5%88%86%E7%B1%BB%E5%8F%B7%E8%BE%85%E5%8A%A9%E7%9A%84%E6%97%A0%E7%9B%91%E7%9D%A3%E4%B8%93%E5%88%A9%E5%AE%9E%E4%BD%93%E6%8A%BD%E5%8F%96%E6%96%B9%E6%B3%95%E7%A0%94%E7%A9%B6&rft.jtitle=%E7%9F%A5%E8%AF%86%E7%AE%A1%E7%90%86%E8%AE%BA%E5%9D%9B&rft.au=%E9%99%88%E4%BA%AE&rft.au=%E5%B0%9A%E7%8E%AE%E5%A7%A3&rft.au=%E4%BD%99%E6%B1%A0&rft.au=%E7%89%9F%E7%90%B3&rft.date=2024-08-30&rft.pub=%E4%B8%AD%E5%9B%BD%E7%A7%91%E5%AD%A6%E9%99%A2%E6%96%87%E7%8C%AE%E6%83%85%E6%8A%A5%E4%B8%AD%E5%BF%83&rft.issn=2095-5472&rft.eissn=2095-5472&rft.volume=9&rft.issue=4&rft.spage=422&rft.epage=436&rft.externalDocID=ZSGLLT2024004007
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2095-5472&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2095-5472&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2095-5472&client=summon