利用技术分类号辅助的无监督专利实体抽取方法研究
[目的/意义]无监督的专利实体抽取方法可以有效解决之前方法高度依赖标注资源的痼疾,进而推动智能技术在专利数据上的广泛应用并提升专利信息服务的能力和水平。[方法/过程]将专利文献固有的技术分类号与主题模型相结合,利用技术分类号指导专利词汇上的主题分配过程,进而提出一种无需实体标注信息的专利实体抽取方法。[结果/结论]利用硬盘驱动器薄膜磁头领域专利数据集和IPC技术分类体系进行实证分析,实验结果显示,不同层级的技术分类号在实体抽取上效果差异巨大,而基于IPC第五层级技术分类号方法的实体抽取效果远优于常规的SAO方法。...
Saved in:
Published in | 知识管理论坛 Vol. 9; no. 4; pp. 422 - 436 |
---|---|
Main Authors | , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
中国科学院文献情报中心
30.08.2024
|
Subjects | |
Online Access | Get full text |
ISSN | 2095-5472 2095-5472 |
Cover
Loading…
Abstract | [目的/意义]无监督的专利实体抽取方法可以有效解决之前方法高度依赖标注资源的痼疾,进而推动智能技术在专利数据上的广泛应用并提升专利信息服务的能力和水平。[方法/过程]将专利文献固有的技术分类号与主题模型相结合,利用技术分类号指导专利词汇上的主题分配过程,进而提出一种无需实体标注信息的专利实体抽取方法。[结果/结论]利用硬盘驱动器薄膜磁头领域专利数据集和IPC技术分类体系进行实证分析,实验结果显示,不同层级的技术分类号在实体抽取上效果差异巨大,而基于IPC第五层级技术分类号方法的实体抽取效果远优于常规的SAO方法。 |
---|---|
AbstractList | [目的/意义]无监督的专利实体抽取方法可以有效解决之前方法高度依赖标注资源的痼疾,进而推动智能技术在专利数据上的广泛应用并提升专利信息服务的能力和水平。[方法/过程]将专利文献固有的技术分类号与主题模型相结合,利用技术分类号指导专利词汇上的主题分配过程,进而提出一种无需实体标注信息的专利实体抽取方法。[结果/结论]利用硬盘驱动器薄膜磁头领域专利数据集和IPC技术分类体系进行实证分析,实验结果显示,不同层级的技术分类号在实体抽取上效果差异巨大,而基于IPC第五层级技术分类号方法的实体抽取效果远优于常规的SAO方法。 |
Author | 葛川 陈亮 尚玮姣 牟琳 余池 夏春姊 |
Author_xml | – sequence: 1 fullname: 陈亮 organization: 中国科学技术信息研究所,北京100038 – sequence: 2 fullname: 尚玮姣 organization: 中国林业科学研究院林业科技信息研究所,北京100091 – sequence: 3 fullname: 余池 organization: 中国科学技术信息研究所,北京100038 – sequence: 4 fullname: 牟琳 organization: 中国科学技术信息研究所,北京100038 – sequence: 5 fullname: 夏春姊 organization: 中国科学技术信息研究所,北京100038 – sequence: 6 fullname: 葛川 organization: 山西省科技情报与战略研究中心,太原030032 |
BookMark | eNrjYmDJy89LZWLgNDKwNNU1NTE3YkFiczDwFhdnJhmYGhqbm5gbmHIyuD7tWPl8yopnXQ3P5qx_2tH2fOPup_3bX-xrfdq18vmslmfTFzyfPfH53MVPdkwGqny6bt6TvZOfde192j_t2bSdzzZPfb5gyvOV23gYWNMSc4pTeaE0N4Oim2uIs4ducmJxcXxecXFKfFSwu49PiJGBkYmBARCZGxOjBgBbMlJz |
ContentType | Journal Article |
DBID | NSCOK |
DatabaseName | 国家哲学社会科学文献中心 (National Center for Philosophy and Social Sciences Documentation) |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
Discipline | Library & Information Science |
EISSN | 2095-5472 |
EndPage | 436 |
ExternalDocumentID | ZSGLLT2024004007 |
GroupedDBID | -0Y ALMA_UNASSIGNED_HOLDINGS CCEZO CUBFJ GROUPED_DOAJ M~E NSCOK U1G U5S |
ID | FETCH-cass_nssd_ZSGLLT20240040073 |
ISSN | 2095-5472 |
IngestDate | Mon Feb 17 13:39:40 EST 2025 |
IsOpenAccess | true |
IsPeerReviewed | true |
IsScholarly | true |
Issue | 4 |
Keywords | 实体抽取 技术分类号 专利挖掘 主题模型 |
Language | Chinese |
LinkModel | OpenURL |
MergedId | FETCHMERGED-cass_nssd_ZSGLLT20240040073 |
OpenAccessLink | https://www.ncpssd.cn/Literature/articleinfo?id=ZSGLLT2024004007&type=eJournalArticle&typename=中文期刊文章&nav=1&langType=1&pageUrl=https%253A%252F%252Fwww.ncpssd.org%252Fjournal%252Fdetails%253Fgch%253D211192%2526nav%253D1%2526langType%253D2 |
ParticipantIDs | cass_nssd_ZSGLLT2024004007 |
PublicationCentury | 2000 |
PublicationDate | 2024-08-30 |
PublicationDateYYYYMMDD | 2024-08-30 |
PublicationDate_xml | – month: 08 year: 2024 text: 2024-08-30 day: 30 |
PublicationDecade | 2020 |
PublicationTitle | 知识管理论坛 |
PublicationYear | 2024 |
Publisher | 中国科学院文献情报中心 |
Publisher_xml | – name: 中国科学院文献情报中心 |
SSID | ssib051374705 ssib017352901 ssj0002013348 ssib038575587 |
Score | 4.730686 |
Snippet | ... |
SourceID | cass |
SourceType | Aggregation Database |
StartPage | 422 |
Title | 利用技术分类号辅助的无监督专利实体抽取方法研究 |
URI | https://www.ncpssd.cn/Literature/articleinfo?id=ZSGLLT2024004007&type=eJournalArticle&typename=中文期刊文章&nav=1&langType=1&pageUrl=https%253A%252F%252Fwww.ncpssd.org%252Fjournal%252Fdetails%253Fgch%253D211192%2526nav%253D1%2526langType%253D2 |
Volume | 9 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnV3NaxUxEA9tT17ET7RaeYLj7ZXdTbKbHJM2zyKtCFYoXgq7b4t4aMG-XnoQDyqllyKtFfyi4MVeFBH8QOpf0_fWP8OZ7L6-pVRRL8vsJJn5ZWaTTLKbDWNXsixLo2whaGYi0U3RDsNmmuikmUuuc54GUZbROuTMjXjqtrg-J-eGhm_Wvlpa6aTj2eqR-0r-x6vIQ7_SLtl_8OyBUGQgjf7FK3oYr3_lY3ASlAKjwSWgBRgFLgZl6PMFJPQEmFaVR8WUx4Zgree0wCbgFFgHSnqO6cvB4sIXT8AEnmNBh56YBMPBCbAKNK9pl2AcaOeTJn2Sh4F0qUvHXmAMVhNhOWhJAlE-wiZCg43rgbJX1wIjCSTWosSPWkyJJPAcRRxrSAti0wevj8Bp0JrQESKsmRukSLABVRKlKEflCT2K5oMsZS1KqCGCHKRgGU24SgiW1xdNIuFXgYODx7yylPFWQCOSORLSRdaUxDdxhdRElYFU4pVMeGB4y717vDXJFjWBFo3CB_14hFFsU4ryhKLx_AheNRDpWnsTtUFFRFEtPhH80K_DfTBy59a16elZqqrvlpNhNsxDOkti5oHr969hgtF2__wxvOd0OqschOcy5Di5rPr_e_4ldUgbtel8xj5ejFwynNXVYrDZE-x4NXlqmLIlnGRDq3dPsbFq603jaqPaW0cNrlENWqeZ667tFlvveusPe68-dNeeFB-_dze-_PzxuLu-W7x41Hu-U7x8Wrx-u_91E3N237_Z39vsre91N7Z72996n54VO1vF7ucz7HLLzU5MNQnX_OLycnv-sDH4WTayuLSYn2ONNBIyTReiYEGkoo1z7SDKcVKfB22lVBzk59no7-WM_inxAjs2eNIuspHO_ZV8DAPWTnrJe-EXBUlypg |
linkProvider | ISSN International Centre |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%88%A9%E7%94%A8%E6%8A%80%E6%9C%AF%E5%88%86%E7%B1%BB%E5%8F%B7%E8%BE%85%E5%8A%A9%E7%9A%84%E6%97%A0%E7%9B%91%E7%9D%A3%E4%B8%93%E5%88%A9%E5%AE%9E%E4%BD%93%E6%8A%BD%E5%8F%96%E6%96%B9%E6%B3%95%E7%A0%94%E7%A9%B6&rft.jtitle=%E7%9F%A5%E8%AF%86%E7%AE%A1%E7%90%86%E8%AE%BA%E5%9D%9B&rft.au=%E9%99%88%E4%BA%AE&rft.au=%E5%B0%9A%E7%8E%AE%E5%A7%A3&rft.au=%E4%BD%99%E6%B1%A0&rft.au=%E7%89%9F%E7%90%B3&rft.date=2024-08-30&rft.pub=%E4%B8%AD%E5%9B%BD%E7%A7%91%E5%AD%A6%E9%99%A2%E6%96%87%E7%8C%AE%E6%83%85%E6%8A%A5%E4%B8%AD%E5%BF%83&rft.issn=2095-5472&rft.eissn=2095-5472&rft.volume=9&rft.issue=4&rft.spage=422&rft.epage=436&rft.externalDocID=ZSGLLT2024004007 |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2095-5472&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2095-5472&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2095-5472&client=summon |