高精度な正規化技術の実現に向けた身体部位表現の内部構造モデル

自然言語表現を統制用語集にマッピングすること(正規化)は,診療録等の利活用に必須の技術である.本稿では正規化技術の確立に向け,身体部位表現の内部構造モデルを提案する.提案モデルは言語学分野で蓄積されてきた知見に基づいた語形成過程を表すものであり,要素語,要素語の分類体系,要素語の合成規則,辞書から構成される.このモデルによって,これまで扱うことが難しかった「胸椎+腰椎=胸腰椎」のような縮退を表現することができ,また表層文字列のみならず要素語間の関係も表現されるため修飾語の付加による意味変化に対して頑健な処理の実現が可能である.評価のため提案モデルに基づいた内部構造解析プログラムを作成し解剖学用...

Full description

Saved in:
Bibliographic Details
Published inJapan Journal of Medical Informatics Vol. 34; no. 5; pp. 211 - 220
Main Author 篠原, 恵美子
Format Journal Article
LanguageJapanese
Published 一般社団法人 日本医療情報学会 2014
Japan Association for Medical Informatics
Subjects
Online AccessGet full text
ISSN0289-8055
2188-8469
DOI10.14948/jami.34.211

Cover

Abstract 自然言語表現を統制用語集にマッピングすること(正規化)は,診療録等の利活用に必須の技術である.本稿では正規化技術の確立に向け,身体部位表現の内部構造モデルを提案する.提案モデルは言語学分野で蓄積されてきた知見に基づいた語形成過程を表すものであり,要素語,要素語の分類体系,要素語の合成規則,辞書から構成される.このモデルによって,これまで扱うことが難しかった「胸椎+腰椎=胸腰椎」のような縮退を表現することができ,また表層文字列のみならず要素語間の関係も表現されるため修飾語の付加による意味変化に対して頑健な処理の実現が可能である.評価のため提案モデルに基づいた内部構造解析プログラムを作成し解剖学用語80語を対象に適用したところ,73語に対して正しい内部構造が得られ,本モデルの表現力およびこれに則った解析の実現可能性が示唆された.
AbstractList It is a fundamental technique for clinical applications to map natural language expression to controlled vocabraries (normalization). This paper proposes a new model for internal structure of body sites description towards the development of high-performance normalization technique. The proposed model represents word-formation process based on the knowledge in the field of linguistics and consists of a set of elemental words, a classification scheme of elemental words, a set of synthesis rules of elemental words, and an anatomic terminology. The model expresses contractions which were merely targeted in the previous studies and relationships or combinations of individual elemental words. This function enables a robust analysis of descriptions with semantic change caused by modifying words. As a result of the evaluation, I succeeded in analyzing the internal structures of 73 anatomical terms out of the 80 using an algorithm based on the model and it indicated the practical utility of the model. 自然言語表現を統制用語集にマッピングすること(正規化)は,診療録等の利活用に必須の技術である.本稿では正規化技術の確立に向け,身体部位表現の内部構造モデルを提案する.提案モデルは言語学分野で蓄積されてきた知見に基づいた語形成過程を表すものであり,要素語,要素語の分類体系,要素語の合成規則,辞書から構成される.このモデルによって,これまで扱うことが難しかった「胸椎+腰椎=胸腰椎」のような縮退を表現することができ,また表層文字列のみならず要素語間の関係も表現されるため修飾語の付加による意味変化に対して頑健な処理の実現が可能である.評価のため提案モデルに基づいた内部構造解析プログラムを作成し解剖学用語80語を対象に適用したところ,73語に対して正しい内部構造が得られ,本モデルの表現力およびこれに則った解析の実現可能性が示唆された.
自然言語表現を統制用語集にマッピングすること(正規化)は,診療録等の利活用に必須の技術である.本稿では正規化技術の確立に向け,身体部位表現の内部構造モデルを提案する.提案モデルは言語学分野で蓄積されてきた知見に基づいた語形成過程を表すものであり,要素語,要素語の分類体系,要素語の合成規則,辞書から構成される.このモデルによって,これまで扱うことが難しかった「胸椎+腰椎=胸腰椎」のような縮退を表現することができ,また表層文字列のみならず要素語間の関係も表現されるため修飾語の付加による意味変化に対して頑健な処理の実現が可能である.評価のため提案モデルに基づいた内部構造解析プログラムを作成し解剖学用語80語を対象に適用したところ,73語に対して正しい内部構造が得られ,本モデルの表現力およびこれに則った解析の実現可能性が示唆された.
Author 篠原, 恵美子
Author_FL Shinohara E
Author_FL_xml – sequence: 1
  fullname: Shinohara E
Author_xml – sequence: 1
  fullname: 篠原, 恵美子
  organization: 東京大学大学院 医学系研究科 疾患生命工学センター
BackLink https://cir.nii.ac.jp/crid/1390001205751446144$$DView record in CiNii
BookMark eNo9UE1Lw0AUXKSCtfbmT_CaupvdTXYvghS_oOBFL17CJtlqSlsl6cVbQ1HBD6oUxFutQi0Ge_BYaP9Mmjb9F6ZWhPfmwZthYGYVpKrnVQnAOoI5RDhhmyVRcXKY5FSElkBaRYwpjGg8BdJQZVxhkNIVkPU8x4QQ6hRBAtPgZBa8TL9H0aAb-p-Tr_e424zunye39bjTCv1-1G9Pm6PQD6LHp9BPph0PgvGwNWv0xsOHuNP7ZfvR9VXymXzczeqvYeMtbNyEjWANLBdF2ZPZv5sBx7s7R_l9pXC4d5DfLiglFSOi6ERSaGIbCVNHhNlEJbLIVI2b0BKMQ4tqnDFLapzbsgghsy3dtnUGMaeUQQ1nwMbCt-o4huXMEWGeZEQqpElOQrRkE9nWQlbyauJUGheuUxHupSHcmmOVpTGvz8DEoHNIOvwnrDPhJiz-AffEiOo
ContentType Journal Article
Copyright 2014 一般社団法人 日本医療情報学会
Copyright_xml – notice: 2014 一般社団法人 日本医療情報学会
DBID RYH
DOI 10.14948/jami.34.211
DatabaseName CiNii Complete
DatabaseTitleList

DeliveryMethod fulltext_linktorsrc
DocumentTitleAlternate Internal Structure Model for Body Sites Description towards a High-performance Normalization
DocumentTitle_FL Internal Structure Model for Body Sites Description towards a High-performance Normalization
EISSN 2188-8469
EndPage 220
ExternalDocumentID 130005148398
article_jami_34_5_34_211_article_char_ja
GroupedDBID ALMA_UNASSIGNED_HOLDINGS
JSF
KQ8
OK1
RJT
RYH
ID FETCH-LOGICAL-j2314-74e50b3d1ab7148d424ef8269b0ca890c56988ce699def008dc7dd78039558063
ISSN 0289-8055
IngestDate Thu Jun 26 22:46:00 EDT 2025
Wed Sep 03 06:31:08 EDT 2025
IsDoiOpenAccess true
IsOpenAccess true
IsPeerReviewed false
IsScholarly true
Issue 5
Language Japanese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-j2314-74e50b3d1ab7148d424ef8269b0ca890c56988ce699def008dc7dd78039558063
OpenAccessLink https://www.jstage.jst.go.jp/article/jami/34/5/34_211/_article/-char/ja
PageCount 10
ParticipantIDs nii_cinii_1390001205751446144
jstage_primary_article_jami_34_5_34_211_article_char_ja
PublicationCentury 2000
PublicationDate 2014
PublicationDateYYYYMMDD 2014-01-01
PublicationDate_xml – year: 2014
  text: 2014
PublicationDecade 2010
PublicationTitle Japan Journal of Medical Informatics
PublicationTitleAlternate 医療情報学
PublicationTitle_FL 医療情報学
Japan Journal of Medical Informatics
PublicationYear 2014
Publisher 一般社団法人 日本医療情報学会
Japan Association for Medical Informatics
Publisher_xml – name: 一般社団法人 日本医療情報学会
– name: Japan Association for Medical Informatics
References 12) 小山照夫,大江和彦.日本語医学専門用語の構造解析.情報知識学会研究報告会講演論文集.1994; 17-20.
6) Imai T, Kajino M, Sato M, Ohe K. Development of structured ICD-10 and its application to computer-assisted ICD coding. Stud Health Technol Inform 2010; 160(Pt 2): 1080-4.
16) Jackendoff R. Semantic structures. The MIT Press, 1990.
10) 小椋秀樹,冨士池優美.第4章 形態論情報.『現代日本語書き言葉均衡コーパス』利用の手引 第1.0版.国立国語研究所コーパス開発センター,2011. [http://www.ninjal.ac.jp/corpus_center/bccwj/doc/manual/BCCWJ_Manual_04.pdf (cited 2014-Mar-24)].
8) Yamada E, Aramaki E, Imai T, Ohe K. The internal structure of a disease name and its application for ICD coding. Stud Health Technol Inform 2010; 160(Pt 2): 1010-4.
14) Mizoguchi R. YAMATO: Yet another more advanced top-level ontology. Proceedings of the Sixth Australasian Ontology Workshop 2010: 1-16.
15) Pustejovsky J. The Generative Lexicon. MIT Press, 1998.
1) Nadkarni PM, Ohno-Machado L, Chapman WW. Natural language processing: an introduction. J Am Med Inform Assoc 2011; 18, 5: 544-51.
9) 景山太郎.語形成の基礎概念.文法と語形成,ひつじ書房,1993: 1-41.
5) 西本尚樹,寺江 聡,蒋 国謙,他.複合語を構成する医学用語間の意味関係の同定における課題:CT画像診断レポートに出現する複合語を対象として.医療情報学 2006; 25, 6: 413-20.
7) Aramaki E, Imai T, Kajino M, Miyo K, Ohe K. A statistical selector of the best among multiple ICD-coding methods. Stud Health Technol Inform 2007; 129(Pt 1): 645-9.
2) Aronson AR, Lang FM. An overview of MetaMap: historical perspective and recent advances. J Am Med Inform Assoc 2010; 17, 3: 229-36.
4) Markó K, Schulz S, Hahn U. MorphoSaurus―design and evaluation of an interlingua-based, cross-language document retrieval engine for the medical domain. Methods Inf Med 2005; 44, 4: 537-45.
11) 大石 強.その他の語形成.形態論,現代の英語学シリーズ,開拓社,2000: 218-47.
13) 日本解剖学会(監修).解剖学用語 改訂13版.医学書院,2007.
3) Zweigenbaum P, Baud R, Burgun A, et al. UMLF: a unified medical lexicon for French. Int J Med Inform 2005; 74, 2: 119-24.
References_xml – reference: 9) 景山太郎.語形成の基礎概念.文法と語形成,ひつじ書房,1993: 1-41.
– reference: 7) Aramaki E, Imai T, Kajino M, Miyo K, Ohe K. A statistical selector of the best among multiple ICD-coding methods. Stud Health Technol Inform 2007; 129(Pt 1): 645-9.
– reference: 10) 小椋秀樹,冨士池優美.第4章 形態論情報.『現代日本語書き言葉均衡コーパス』利用の手引 第1.0版.国立国語研究所コーパス開発センター,2011. [http://www.ninjal.ac.jp/corpus_center/bccwj/doc/manual/BCCWJ_Manual_04.pdf (cited 2014-Mar-24)].
– reference: 2) Aronson AR, Lang FM. An overview of MetaMap: historical perspective and recent advances. J Am Med Inform Assoc 2010; 17, 3: 229-36.
– reference: 11) 大石 強.その他の語形成.形態論,現代の英語学シリーズ,開拓社,2000: 218-47.
– reference: 5) 西本尚樹,寺江 聡,蒋 国謙,他.複合語を構成する医学用語間の意味関係の同定における課題:CT画像診断レポートに出現する複合語を対象として.医療情報学 2006; 25, 6: 413-20.
– reference: 8) Yamada E, Aramaki E, Imai T, Ohe K. The internal structure of a disease name and its application for ICD coding. Stud Health Technol Inform 2010; 160(Pt 2): 1010-4.
– reference: 3) Zweigenbaum P, Baud R, Burgun A, et al. UMLF: a unified medical lexicon for French. Int J Med Inform 2005; 74, 2: 119-24.
– reference: 12) 小山照夫,大江和彦.日本語医学専門用語の構造解析.情報知識学会研究報告会講演論文集.1994; 17-20.
– reference: 6) Imai T, Kajino M, Sato M, Ohe K. Development of structured ICD-10 and its application to computer-assisted ICD coding. Stud Health Technol Inform 2010; 160(Pt 2): 1080-4.
– reference: 4) Markó K, Schulz S, Hahn U. MorphoSaurus―design and evaluation of an interlingua-based, cross-language document retrieval engine for the medical domain. Methods Inf Med 2005; 44, 4: 537-45.
– reference: 13) 日本解剖学会(監修).解剖学用語 改訂13版.医学書院,2007.
– reference: 15) Pustejovsky J. The Generative Lexicon. MIT Press, 1998.
– reference: 16) Jackendoff R. Semantic structures. The MIT Press, 1990.
– reference: 14) Mizoguchi R. YAMATO: Yet another more advanced top-level ontology. Proceedings of the Sixth Australasian Ontology Workshop 2010: 1-16.
– reference: 1) Nadkarni PM, Ohno-Machado L, Chapman WW. Natural language processing: an introduction. J Am Med Inform Assoc 2011; 18, 5: 544-51.
SSID ssib000751040
ssib005879655
ssib007482534
ssj0002505442
ssib000994792
Score 1.9427968
Snippet ...
It is a fundamental technique for clinical applications to map natural language expression to controlled vocabraries (normalization). This paper proposes a new...
SourceID nii
jstage
SourceType Publisher
StartPage 211
SubjectTerms Information retrieval
Knowledge
Linguistics
Natural language processing
Terminology
情報抽出
用語
知識
自然言語処理
言語学
Title 高精度な正規化技術の実現に向けた身体部位表現の内部構造モデル
URI https://www.jstage.jst.go.jp/article/jami/34/5/34_211/_article/-char/ja
https://cir.nii.ac.jp/crid/1390001205751446144
Volume 34
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
ispartofPNX 医療情報学, 2014, Vol.34(5), pp.211-220
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR1Na9RANLT14kUUFatWenCOWZPMTGbmONlmKQqC0ELxsuSrsD1Uke3FU5dFBT-oUhBvtSq1uNiDx0L7Z9Jtt__C9ybZbaQe2sLuMPu-5uNlM--9ZN5Y1n1Msu8vupnNWExtlsaxHcGyZXvCjZ0YXC43Mdk-H_uz8-zhAl8YG_9ReWtppR3Xkpf_3VdyEa0CDPSKu2TPodmRUABAHfQLJWgYyjPpmISK6IAoSUJBAo8EIQk5CTTRPgkpGIlEaxL6RM8QTUkoES4bSCPrRPmIkhrfdUCUSxQdchk5UKoGSgYWlFygAkQphyi3hJxUGigHWwcaRoIZI1ARSYmWJUTOlG1peUqyaVRCl3iFCzoPZIGBOEQ7hhhQXlmRYggJqnZ2OcYgwFYU8HpmsNQI5ygncE0FZmYUm0Ra3TCNALcZPVyAhtElATeTHCKiYCwOIB2GTNyTYKkZqyznVcJw60YyK_WjAqMNnwSUKG6INXxMQwrouKnUDds5RmEEgVp15d4Ofi4YB0WG4lpmYGBsSRvMQVVdnMpIb6v6-L9cadyK0eKZHYWn10NM_lMcxNCqUVYbMf2TYby8fptI1aSsybEA0uYQgRsAATtuXfKEcPHF2UdPZNXoBJ--YnQqxUTlWT2XQlV3PwsmPV4mJUR7CY1wZk65Gs1KuUMFe_-g0newEpfAZ8JkGOPLrVbFEJy7al0pPbhpXfT6mjW2FF23nh73vhz92e_vbuWdX4e_vw-21vrvPx--XR1sruednf7OxtHaft7p9T9-yjvw2Rjs9g721o-72wd7Hwab2wa703_9CiCHP98dr37Nu9_y7pu827thzTfCufqsXR5bYi-Bs8RswTLuxDR1o1i4TKbMY9kiePEqdpJIKifhvpIyyXyl0mwRbPA0EWkqpEMV5xJchpvWxPKz5eyWNU0zNwIHC-6yUcREAj98J0siKlM3o34iJi1RTEjzeZGbpnlWXU5aUzCDzaSFJXiBJiKNvhvGh-B7-8KS71iX8T9XhCnvWhPtFyvZFBju7fieuW7-AkMsxgM
linkProvider Colorado Alliance of Research Libraries
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E9%AB%98%E7%B2%BE%E5%BA%A6%E3%81%AA%E6%AD%A3%E8%A6%8F%E5%8C%96%E6%8A%80%E8%A1%93%E3%81%AE%E5%AE%9F%E7%8F%BE%E3%81%AB%E5%90%91%E3%81%91%E3%81%9F%E8%BA%AB%E4%BD%93%E9%83%A8%E4%BD%8D%E8%A1%A8%E7%8F%BE%E3%81%AE%E5%86%85%E9%83%A8%E6%A7%8B%E9%80%A0%E3%83%A2%E3%83%87%E3%83%AB&rft.jtitle=%E5%8C%BB%E7%99%82%E6%83%85%E5%A0%B1%E5%AD%A6&rft.au=%E7%AF%A0%E5%8E%9F%2C+%E6%81%B5%E7%BE%8E%E5%AD%90&rft.date=2014&rft.pub=%E4%B8%80%E8%88%AC%E7%A4%BE%E5%9B%A3%E6%B3%95%E4%BA%BA+%E6%97%A5%E6%9C%AC%E5%8C%BB%E7%99%82%E6%83%85%E5%A0%B1%E5%AD%A6%E4%BC%9A&rft.issn=0289-8055&rft.eissn=2188-8469&rft.volume=34&rft.issue=5&rft.spage=211&rft.epage=220&rft_id=info:doi/10.14948%2Fjami.34.211&rft.externalDocID=article_jami_34_5_34_211_article_char_ja
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=0289-8055&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=0289-8055&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=0289-8055&client=summon