基于CRF与RUTA规则相结合的卒中入院记录医学实体识别及应用
: 【目的】研究针对非结构化临床电子病历的自然语言处理模型的构建和优化,并利用该模型对江西 省医疗大数据平台中卒中病人的病历进行结构化数据提取。【方法】从江西省医疗大数据平台中随机筛选500份 2011-2016年的卒中病人入院记录,根据临床科研的实际需求构建了脑卒中专科病人的命名实体标注体系和命 名实体标注语料库,利用该语料库构建基于CRF以及RUTA规则的命名实体抽取模型,并通过调整RUTA规则以 及参数提升识别准确率。【结果】经五折交叉验证,该模型的医学命名实体的抽取准确率0.960,召回率0.916,F- score 0.939,利用该抽取模型对大数据平台中10 295份脑卒中患者入院...
Saved in:
Published in | Zhongshan da xue xue bao. Zhongshan daxue xuebao yixue kexue ban = Journal of Sun Yat-sen University. Yi xue ke xue ban Vol. 39 |
---|---|
Main Authors | , |
Format | Journal Article |
Language | Chinese |
Published |
Editorial Office of Journal of Sun Yat-sen University
01.01.2018
|
Subjects | |
Online Access | Get full text |
ISSN | 1672-3554 |
Cover
Abstract | : 【目的】研究针对非结构化临床电子病历的自然语言处理模型的构建和优化,并利用该模型对江西 省医疗大数据平台中卒中病人的病历进行结构化数据提取。【方法】从江西省医疗大数据平台中随机筛选500份 2011-2016年的卒中病人入院记录,根据临床科研的实际需求构建了脑卒中专科病人的命名实体标注体系和命 名实体标注语料库,利用该语料库构建基于CRF以及RUTA规则的命名实体抽取模型,并通过调整RUTA规则以 及参数提升识别准确率。【结果】经五折交叉验证,该模型的医学命名实体的抽取准确率0.960,召回率0.916,F- score 0.939,利用该抽取模型对大数据平台中10 295份脑卒中患者入院记录进行抽取,共抽取命名实体264 580 条,命名实体修饰1 161 077条。【结论】构建的自然语言抽取模型识别准确率较高,通过该模型能够准确地从大 量非结构化病历中获取病人的既往史、生活史、临床表现等有价值的科研数据,有效提升心脑血管疾病的临床科 研效率和科研水平 |
---|---|
AbstractList | : 【目的】研究针对非结构化临床电子病历的自然语言处理模型的构建和优化,并利用该模型对江西 省医疗大数据平台中卒中病人的病历进行结构化数据提取。【方法】从江西省医疗大数据平台中随机筛选500份 2011-2016年的卒中病人入院记录,根据临床科研的实际需求构建了脑卒中专科病人的命名实体标注体系和命 名实体标注语料库,利用该语料库构建基于CRF以及RUTA规则的命名实体抽取模型,并通过调整RUTA规则以 及参数提升识别准确率。【结果】经五折交叉验证,该模型的医学命名实体的抽取准确率0.960,召回率0.916,F- score 0.939,利用该抽取模型对大数据平台中10 295份脑卒中患者入院记录进行抽取,共抽取命名实体264 580 条,命名实体修饰1 161 077条。【结论】构建的自然语言抽取模型识别准确率较高,通过该模型能够准确地从大 量非结构化病历中获取病人的既往史、生活史、临床表现等有价值的科研数据,有效提升心脑血管疾病的临床科 研效率和科研水平 |
Author | 葛艳秋 易应萍 |
Author_xml | – sequence: 1 fullname: 葛艳秋 – sequence: 2 fullname: 易应萍 |
BookMark | eNotzE1LAkEAgOE5GGTmT1mY2fnaOYpkCYIgel5mnJnYMDfWLt0tJMoi7WBBQdAHhNZRFP_NDmv_oqhOLzyHdwvkunHX5EAeMe57mFKyCYq9XqQgZJRhn4g8qLvHRboYlhuVdD5stJql9WvfDSbZ_Txbjtz1ILvru8ubdD51p89fk6f17NOtbt3F0k1f3OwhXY3WH2du8O6uzt1inI3ftsGGlZ2eKf63AFqVnWZ5z6vVd6vlUs3TCELkacUF1Ir5HEuuraZQU4GIIjhAga8spUgYbKVCAbc-xkz4hlNF4Y8xgRAugOrfV8fyIDxKokOZnISxjMJfiJP9UCbHUbtjQsEJUwZBhjgibW5lYBnCUnKIiWQmwN8yKXBH |
ContentType | Journal Article |
DBID | DOA |
DatabaseName | DOAJ Directory of Open Access Journals |
DatabaseTitleList | |
Database_xml | – sequence: 1 dbid: DOA name: DOAJ Directory of Open Access Journals url: https://www.doaj.org/ sourceTypes: Open Website |
DeliveryMethod | fulltext_linktorsrc |
Discipline | Medicine |
ExternalDocumentID | oai_doaj_org_article_9746be1061714c7fa8f613aa7034a6e8 |
GroupedDBID | ALMA_UNASSIGNED_HOLDINGS GROUPED_DOAJ |
ID | FETCH-LOGICAL-d1001-db790db6273a7dfd50d5914b438182bf5519e3fab187f233692e75b503fa69113 |
IEDL.DBID | DOA |
ISSN | 1672-3554 |
IngestDate | Wed Aug 27 01:28:02 EDT 2025 |
IsOpenAccess | true |
IsPeerReviewed | true |
IsScholarly | true |
Language | Chinese |
LinkModel | DirectLink |
MergedId | FETCHMERGED-LOGICAL-d1001-db790db6273a7dfd50d5914b438182bf5519e3fab187f233692e75b503fa69113 |
OpenAccessLink | https://doaj.org/article/9746be1061714c7fa8f613aa7034a6e8 |
ParticipantIDs | doaj_primary_oai_doaj_org_article_9746be1061714c7fa8f613aa7034a6e8 |
PublicationCentury | 2000 |
PublicationDate | 2018-01-01 |
PublicationDateYYYYMMDD | 2018-01-01 |
PublicationDate_xml | – month: 01 year: 2018 text: 2018-01-01 day: 01 |
PublicationDecade | 2010 |
PublicationTitle | Zhongshan da xue xue bao. Zhongshan daxue xuebao yixue kexue ban = Journal of Sun Yat-sen University. Yi xue ke xue ban |
PublicationYear | 2018 |
Publisher | Editorial Office of Journal of Sun Yat-sen University |
Publisher_xml | – name: Editorial Office of Journal of Sun Yat-sen University |
SSID | ssib006563249 ssib001051178 ssib002039699 ssj0002511113 ssib006703418 ssib001103819 ssib002262833 ssib051369397 ssib001186722 ssib043242460 ssib000970529 |
Score | 2.1013505 |
Snippet | : 【目的】研究针对非结构化临床电子病历的自然语言处理模型的构建和优化,并利用该模型对江西 省医疗大数据平台中卒中病人的病历进行结构化数据提取。【方法】从江西省医疗大数据平台中随机筛选500份 2011-2016年的卒中病人入院记录,根据临床科研的实际需求构建了脑卒中专科病人的命名实体标注体系和命... |
SourceID | doaj |
SourceType | Open Website |
SubjectTerms | 中文电子病历 命名实体识别 条件随机场CRF 脑卒中 |
Title | 基于CRF与RUTA规则相结合的卒中入院记录医学实体识别及应用 |
URI | https://doaj.org/article/9746be1061714c7fa8f613aa7034a6e8 |
Volume | 39 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrZ1NSxtBGMeH4kF6EV8qvlU8eF2687Izu0cVQyhUQQx4CzPZWTypSLx4jiUU3zDpIQoWBGuhRHsMEb9NhqTfwmd2FxxPXrzOYV-efZjn_9-Z-T0ILWpdsRAQ5kmNiWcrtBdKpr2kImiANadCp7st1nixxL5uBVtOqy-7JyzDA2eB-wJ6lyttjYvArCISGSZQgaSETGWS6_SYrx_5jpnKhIOwS1iO8QFh4YCrsOWCuyAzy3VzQHbEpxF3hTrhJHSEEagg6hoXbh_nZZa3mDvCXoxHgCmPaL5eZ2uEFfY47d2M4b6eLfqvmgak1a0wikZyWbqwlIVjDH043B5Hw9_yhfcJtG5-dXvd05WNQq9zulHaXBrc1Uy91b_q9B8b5rzev6yZk4tep22Obv-3bgb3_8zTT3P8aNq_zf1176kxePhu6n_N2Q_Tbfabfz6hUmF1c6Xo5b0YvNhSmrxYiciPFQe1I0WcxIEfBxFmyhLCQqISEF6RpolUOBQJofC6RItABT6McZhQ6SQa2tnd0VNoAb4dE34iKuA2maZURUqCU1YkoERDkKfRsg1EeS_DbZQtADsdgLQo52lRfistZt7jIrPoI-ijMPvjMoeGqvsH-jNokKqaT9PtGThL34M |
linkProvider | Directory of Open Access Journals |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8ECRF%E4%B8%8ERUTA%E8%A7%84%E5%88%99%E7%9B%B8%E7%BB%93%E5%90%88%E7%9A%84%E5%8D%92%E4%B8%AD%E5%85%A5%E9%99%A2%E8%AE%B0%E5%BD%95%E5%8C%BB%E5%AD%A6%E5%AE%9E%E4%BD%93%E8%AF%86%E5%88%AB%E5%8F%8A%E5%BA%94%E7%94%A8&rft.jtitle=Zhongshan+da+xue+xue+bao.+Zhongshan+daxue+xuebao+yixue+kexue+ban+%3D+Journal+of+Sun+Yat-sen+University.+Yi+xue+ke+xue+ban&rft.au=%E8%91%9B%E8%89%B3%E7%A7%8B&rft.au=%E6%98%93%E5%BA%94%E8%90%8D&rft.date=2018-01-01&rft.pub=Editorial+Office+of+Journal+of+Sun+Yat-sen+University&rft.issn=1672-3554&rft.volume=39&rft.externalDBID=DOA&rft.externalDocID=oai_doaj_org_article_9746be1061714c7fa8f613aa7034a6e8 |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=1672-3554&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=1672-3554&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=1672-3554&client=summon |