高精度な正規化技術の実現に向けた身体部位表現の内部構造モデル
自然言語表現を統制用語集にマッピングすること(正規化)は,診療録等の利活用に必須の技術である.本稿では正規化技術の確立に向け,身体部位表現の内部構造モデルを提案する.提案モデルは言語学分野で蓄積されてきた知見に基づいた語形成過程を表すものであり,要素語,要素語の分類体系,要素語の合成規則,辞書から構成される.このモデルによって,これまで扱うことが難しかった「胸椎+腰椎=胸腰椎」のような縮退を表現することができ,また表層文字列のみならず要素語間の関係も表現されるため修飾語の付加による意味変化に対して頑健な処理の実現が可能である.評価のため提案モデルに基づいた内部構造解析プログラムを作成し解剖学用...
Saved in:
Published in | Japan Journal of Medical Informatics Vol. 34; no. 5; pp. 211 - 220 |
---|---|
Main Author | |
Format | Journal Article |
Language | Japanese |
Published |
一般社団法人 日本医療情報学会
2014
Japan Association for Medical Informatics |
Subjects | |
Online Access | Get full text |
ISSN | 0289-8055 2188-8469 |
DOI | 10.14948/jami.34.211 |
Cover
Abstract | 自然言語表現を統制用語集にマッピングすること(正規化)は,診療録等の利活用に必須の技術である.本稿では正規化技術の確立に向け,身体部位表現の内部構造モデルを提案する.提案モデルは言語学分野で蓄積されてきた知見に基づいた語形成過程を表すものであり,要素語,要素語の分類体系,要素語の合成規則,辞書から構成される.このモデルによって,これまで扱うことが難しかった「胸椎+腰椎=胸腰椎」のような縮退を表現することができ,また表層文字列のみならず要素語間の関係も表現されるため修飾語の付加による意味変化に対して頑健な処理の実現が可能である.評価のため提案モデルに基づいた内部構造解析プログラムを作成し解剖学用語80語を対象に適用したところ,73語に対して正しい内部構造が得られ,本モデルの表現力およびこれに則った解析の実現可能性が示唆された. |
---|---|
AbstractList | It is a fundamental technique for clinical applications to map natural language expression to controlled vocabraries (normalization). This paper proposes a new model for internal structure of body sites description towards the development of high-performance normalization technique. The proposed model represents word-formation process based on the knowledge in the field of linguistics and consists of a set of elemental words, a classification scheme of elemental words, a set of synthesis rules of elemental words, and an anatomic terminology. The model expresses contractions which were merely targeted in the previous studies and relationships or combinations of individual elemental words. This function enables a robust analysis of descriptions with semantic change caused by modifying words. As a result of the evaluation, I succeeded in analyzing the internal structures of 73 anatomical terms out of the 80 using an algorithm based on the model and it indicated the practical utility of the model.
自然言語表現を統制用語集にマッピングすること(正規化)は,診療録等の利活用に必須の技術である.本稿では正規化技術の確立に向け,身体部位表現の内部構造モデルを提案する.提案モデルは言語学分野で蓄積されてきた知見に基づいた語形成過程を表すものであり,要素語,要素語の分類体系,要素語の合成規則,辞書から構成される.このモデルによって,これまで扱うことが難しかった「胸椎+腰椎=胸腰椎」のような縮退を表現することができ,また表層文字列のみならず要素語間の関係も表現されるため修飾語の付加による意味変化に対して頑健な処理の実現が可能である.評価のため提案モデルに基づいた内部構造解析プログラムを作成し解剖学用語80語を対象に適用したところ,73語に対して正しい内部構造が得られ,本モデルの表現力およびこれに則った解析の実現可能性が示唆された. 自然言語表現を統制用語集にマッピングすること(正規化)は,診療録等の利活用に必須の技術である.本稿では正規化技術の確立に向け,身体部位表現の内部構造モデルを提案する.提案モデルは言語学分野で蓄積されてきた知見に基づいた語形成過程を表すものであり,要素語,要素語の分類体系,要素語の合成規則,辞書から構成される.このモデルによって,これまで扱うことが難しかった「胸椎+腰椎=胸腰椎」のような縮退を表現することができ,また表層文字列のみならず要素語間の関係も表現されるため修飾語の付加による意味変化に対して頑健な処理の実現が可能である.評価のため提案モデルに基づいた内部構造解析プログラムを作成し解剖学用語80語を対象に適用したところ,73語に対して正しい内部構造が得られ,本モデルの表現力およびこれに則った解析の実現可能性が示唆された. |
Author | 篠原, 恵美子 |
Author_FL | Shinohara E |
Author_FL_xml | – sequence: 1 fullname: Shinohara E |
Author_xml | – sequence: 1 fullname: 篠原, 恵美子 organization: 東京大学大学院 医学系研究科 疾患生命工学センター |
BackLink | https://cir.nii.ac.jp/crid/1390001205751446144$$DView record in CiNii |
BookMark | eNo9UE1Lw0AUXKSCtfbmT_CaupvdTXYvghS_oOBFL17CJtlqSlsl6cVbQ1HBD6oUxFutQi0Ge_BYaP9Mmjb9F6ZWhPfmwZthYGYVpKrnVQnAOoI5RDhhmyVRcXKY5FSElkBaRYwpjGg8BdJQZVxhkNIVkPU8x4QQ6hRBAtPgZBa8TL9H0aAb-p-Tr_e424zunye39bjTCv1-1G9Pm6PQD6LHp9BPph0PgvGwNWv0xsOHuNP7ZfvR9VXymXzczeqvYeMtbNyEjWANLBdF2ZPZv5sBx7s7R_l9pXC4d5DfLiglFSOi6ERSaGIbCVNHhNlEJbLIVI2b0BKMQ4tqnDFLapzbsgghsy3dtnUGMaeUQQ1nwMbCt-o4huXMEWGeZEQqpElOQrRkE9nWQlbyauJUGheuUxHupSHcmmOVpTGvz8DEoHNIOvwnrDPhJiz-AffEiOo |
ContentType | Journal Article |
Copyright | 2014 一般社団法人 日本医療情報学会 |
Copyright_xml | – notice: 2014 一般社団法人 日本医療情報学会 |
DBID | RYH |
DOI | 10.14948/jami.34.211 |
DatabaseName | CiNii Complete |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
DocumentTitleAlternate | Internal Structure Model for Body Sites Description towards a High-performance Normalization |
DocumentTitle_FL | Internal Structure Model for Body Sites Description towards a High-performance Normalization |
EISSN | 2188-8469 |
EndPage | 220 |
ExternalDocumentID | 130005148398 article_jami_34_5_34_211_article_char_ja |
GroupedDBID | ALMA_UNASSIGNED_HOLDINGS JSF KQ8 OK1 RJT RYH |
ID | FETCH-LOGICAL-j2314-74e50b3d1ab7148d424ef8269b0ca890c56988ce699def008dc7dd78039558063 |
ISSN | 0289-8055 |
IngestDate | Thu Jun 26 22:46:00 EDT 2025 Wed Sep 03 06:31:08 EDT 2025 |
IsDoiOpenAccess | true |
IsOpenAccess | true |
IsPeerReviewed | false |
IsScholarly | true |
Issue | 5 |
Language | Japanese |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-j2314-74e50b3d1ab7148d424ef8269b0ca890c56988ce699def008dc7dd78039558063 |
OpenAccessLink | https://www.jstage.jst.go.jp/article/jami/34/5/34_211/_article/-char/ja |
PageCount | 10 |
ParticipantIDs | nii_cinii_1390001205751446144 jstage_primary_article_jami_34_5_34_211_article_char_ja |
PublicationCentury | 2000 |
PublicationDate | 2014 |
PublicationDateYYYYMMDD | 2014-01-01 |
PublicationDate_xml | – year: 2014 text: 2014 |
PublicationDecade | 2010 |
PublicationTitle | Japan Journal of Medical Informatics |
PublicationTitleAlternate | 医療情報学 |
PublicationTitle_FL | 医療情報学 Japan Journal of Medical Informatics |
PublicationYear | 2014 |
Publisher | 一般社団法人 日本医療情報学会 Japan Association for Medical Informatics |
Publisher_xml | – name: 一般社団法人 日本医療情報学会 – name: Japan Association for Medical Informatics |
References | 12) 小山照夫,大江和彦.日本語医学専門用語の構造解析.情報知識学会研究報告会講演論文集.1994; 17-20. 6) Imai T, Kajino M, Sato M, Ohe K. Development of structured ICD-10 and its application to computer-assisted ICD coding. Stud Health Technol Inform 2010; 160(Pt 2): 1080-4. 16) Jackendoff R. Semantic structures. The MIT Press, 1990. 10) 小椋秀樹,冨士池優美.第4章 形態論情報.『現代日本語書き言葉均衡コーパス』利用の手引 第1.0版.国立国語研究所コーパス開発センター,2011. [http://www.ninjal.ac.jp/corpus_center/bccwj/doc/manual/BCCWJ_Manual_04.pdf (cited 2014-Mar-24)]. 8) Yamada E, Aramaki E, Imai T, Ohe K. The internal structure of a disease name and its application for ICD coding. Stud Health Technol Inform 2010; 160(Pt 2): 1010-4. 14) Mizoguchi R. YAMATO: Yet another more advanced top-level ontology. Proceedings of the Sixth Australasian Ontology Workshop 2010: 1-16. 15) Pustejovsky J. The Generative Lexicon. MIT Press, 1998. 1) Nadkarni PM, Ohno-Machado L, Chapman WW. Natural language processing: an introduction. J Am Med Inform Assoc 2011; 18, 5: 544-51. 9) 景山太郎.語形成の基礎概念.文法と語形成,ひつじ書房,1993: 1-41. 5) 西本尚樹,寺江 聡,蒋 国謙,他.複合語を構成する医学用語間の意味関係の同定における課題:CT画像診断レポートに出現する複合語を対象として.医療情報学 2006; 25, 6: 413-20. 7) Aramaki E, Imai T, Kajino M, Miyo K, Ohe K. A statistical selector of the best among multiple ICD-coding methods. Stud Health Technol Inform 2007; 129(Pt 1): 645-9. 2) Aronson AR, Lang FM. An overview of MetaMap: historical perspective and recent advances. J Am Med Inform Assoc 2010; 17, 3: 229-36. 4) Markó K, Schulz S, Hahn U. MorphoSaurus―design and evaluation of an interlingua-based, cross-language document retrieval engine for the medical domain. Methods Inf Med 2005; 44, 4: 537-45. 11) 大石 強.その他の語形成.形態論,現代の英語学シリーズ,開拓社,2000: 218-47. 13) 日本解剖学会(監修).解剖学用語 改訂13版.医学書院,2007. 3) Zweigenbaum P, Baud R, Burgun A, et al. UMLF: a unified medical lexicon for French. Int J Med Inform 2005; 74, 2: 119-24. |
References_xml | – reference: 9) 景山太郎.語形成の基礎概念.文法と語形成,ひつじ書房,1993: 1-41. – reference: 7) Aramaki E, Imai T, Kajino M, Miyo K, Ohe K. A statistical selector of the best among multiple ICD-coding methods. Stud Health Technol Inform 2007; 129(Pt 1): 645-9. – reference: 10) 小椋秀樹,冨士池優美.第4章 形態論情報.『現代日本語書き言葉均衡コーパス』利用の手引 第1.0版.国立国語研究所コーパス開発センター,2011. [http://www.ninjal.ac.jp/corpus_center/bccwj/doc/manual/BCCWJ_Manual_04.pdf (cited 2014-Mar-24)]. – reference: 2) Aronson AR, Lang FM. An overview of MetaMap: historical perspective and recent advances. J Am Med Inform Assoc 2010; 17, 3: 229-36. – reference: 11) 大石 強.その他の語形成.形態論,現代の英語学シリーズ,開拓社,2000: 218-47. – reference: 5) 西本尚樹,寺江 聡,蒋 国謙,他.複合語を構成する医学用語間の意味関係の同定における課題:CT画像診断レポートに出現する複合語を対象として.医療情報学 2006; 25, 6: 413-20. – reference: 8) Yamada E, Aramaki E, Imai T, Ohe K. The internal structure of a disease name and its application for ICD coding. Stud Health Technol Inform 2010; 160(Pt 2): 1010-4. – reference: 3) Zweigenbaum P, Baud R, Burgun A, et al. UMLF: a unified medical lexicon for French. Int J Med Inform 2005; 74, 2: 119-24. – reference: 12) 小山照夫,大江和彦.日本語医学専門用語の構造解析.情報知識学会研究報告会講演論文集.1994; 17-20. – reference: 6) Imai T, Kajino M, Sato M, Ohe K. Development of structured ICD-10 and its application to computer-assisted ICD coding. Stud Health Technol Inform 2010; 160(Pt 2): 1080-4. – reference: 4) Markó K, Schulz S, Hahn U. MorphoSaurus―design and evaluation of an interlingua-based, cross-language document retrieval engine for the medical domain. Methods Inf Med 2005; 44, 4: 537-45. – reference: 13) 日本解剖学会(監修).解剖学用語 改訂13版.医学書院,2007. – reference: 15) Pustejovsky J. The Generative Lexicon. MIT Press, 1998. – reference: 16) Jackendoff R. Semantic structures. The MIT Press, 1990. – reference: 14) Mizoguchi R. YAMATO: Yet another more advanced top-level ontology. Proceedings of the Sixth Australasian Ontology Workshop 2010: 1-16. – reference: 1) Nadkarni PM, Ohno-Machado L, Chapman WW. Natural language processing: an introduction. J Am Med Inform Assoc 2011; 18, 5: 544-51. |
SSID | ssib000751040 ssib005879655 ssib007482534 ssj0002505442 ssib000994792 |
Score | 1.9427968 |
Snippet | ... It is a fundamental technique for clinical applications to map natural language expression to controlled vocabraries (normalization). This paper proposes a new... |
SourceID | nii jstage |
SourceType | Publisher |
StartPage | 211 |
SubjectTerms | Information retrieval Knowledge Linguistics Natural language processing Terminology 情報抽出 用語 知識 自然言語処理 言語学 |
Title | 高精度な正規化技術の実現に向けた身体部位表現の内部構造モデル |
URI | https://www.jstage.jst.go.jp/article/jami/34/5/34_211/_article/-char/ja https://cir.nii.ac.jp/crid/1390001205751446144 |
Volume | 34 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
ispartofPNX | 医療情報学, 2014, Vol.34(5), pp.211-220 |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR1Na9RANLT14kUUFatWenCOWZPMTGbmONlmKQqC0ELxsuSrsD1Uke3FU5dFBT-oUhBvtSq1uNiDx0L7Z9Jtt__C9ybZbaQe2sLuMPu-5uNlM--9ZN5Y1n1Msu8vupnNWExtlsaxHcGyZXvCjZ0YXC43Mdk-H_uz8-zhAl8YG_9ReWtppR3Xkpf_3VdyEa0CDPSKu2TPodmRUABAHfQLJWgYyjPpmISK6IAoSUJBAo8EIQk5CTTRPgkpGIlEaxL6RM8QTUkoES4bSCPrRPmIkhrfdUCUSxQdchk5UKoGSgYWlFygAkQphyi3hJxUGigHWwcaRoIZI1ARSYmWJUTOlG1peUqyaVRCl3iFCzoPZIGBOEQ7hhhQXlmRYggJqnZ2OcYgwFYU8HpmsNQI5ygncE0FZmYUm0Ra3TCNALcZPVyAhtElATeTHCKiYCwOIB2GTNyTYKkZqyznVcJw60YyK_WjAqMNnwSUKG6INXxMQwrouKnUDds5RmEEgVp15d4Ofi4YB0WG4lpmYGBsSRvMQVVdnMpIb6v6-L9cadyK0eKZHYWn10NM_lMcxNCqUVYbMf2TYby8fptI1aSsybEA0uYQgRsAATtuXfKEcPHF2UdPZNXoBJ--YnQqxUTlWT2XQlV3PwsmPV4mJUR7CY1wZk65Gs1KuUMFe_-g0newEpfAZ8JkGOPLrVbFEJy7al0pPbhpXfT6mjW2FF23nh73vhz92e_vbuWdX4e_vw-21vrvPx--XR1sruednf7OxtHaft7p9T9-yjvw2Rjs9g721o-72wd7Hwab2wa703_9CiCHP98dr37Nu9_y7pu827thzTfCufqsXR5bYi-Bs8RswTLuxDR1o1i4TKbMY9kiePEqdpJIKifhvpIyyXyl0mwRbPA0EWkqpEMV5xJchpvWxPKz5eyWNU0zNwIHC-6yUcREAj98J0siKlM3o34iJi1RTEjzeZGbpnlWXU5aUzCDzaSFJXiBJiKNvhvGh-B7-8KS71iX8T9XhCnvWhPtFyvZFBju7fieuW7-AkMsxgM |
linkProvider | Colorado Alliance of Research Libraries |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E9%AB%98%E7%B2%BE%E5%BA%A6%E3%81%AA%E6%AD%A3%E8%A6%8F%E5%8C%96%E6%8A%80%E8%A1%93%E3%81%AE%E5%AE%9F%E7%8F%BE%E3%81%AB%E5%90%91%E3%81%91%E3%81%9F%E8%BA%AB%E4%BD%93%E9%83%A8%E4%BD%8D%E8%A1%A8%E7%8F%BE%E3%81%AE%E5%86%85%E9%83%A8%E6%A7%8B%E9%80%A0%E3%83%A2%E3%83%87%E3%83%AB&rft.jtitle=%E5%8C%BB%E7%99%82%E6%83%85%E5%A0%B1%E5%AD%A6&rft.au=%E7%AF%A0%E5%8E%9F%2C+%E6%81%B5%E7%BE%8E%E5%AD%90&rft.date=2014&rft.pub=%E4%B8%80%E8%88%AC%E7%A4%BE%E5%9B%A3%E6%B3%95%E4%BA%BA+%E6%97%A5%E6%9C%AC%E5%8C%BB%E7%99%82%E6%83%85%E5%A0%B1%E5%AD%A6%E4%BC%9A&rft.issn=0289-8055&rft.eissn=2188-8469&rft.volume=34&rft.issue=5&rft.spage=211&rft.epage=220&rft_id=info:doi/10.14948%2Fjami.34.211&rft.externalDocID=article_jami_34_5_34_211_article_char_ja |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=0289-8055&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=0289-8055&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=0289-8055&client=summon |