基于CRF与RUTA规则相结合的卒中入院记录医学实体识别及应用

: 【目的】研究针对非结构化临床电子病历的自然语言处理模型的构建和优化,并利用该模型对江西 省医疗大数据平台中卒中病人的病历进行结构化数据提取。【方法】从江西省医疗大数据平台中随机筛选500份 2011-2016年的卒中病人入院记录,根据临床科研的实际需求构建了脑卒中专科病人的命名实体标注体系和命 名实体标注语料库,利用该语料库构建基于CRF以及RUTA规则的命名实体抽取模型,并通过调整RUTA规则以 及参数提升识别准确率。【结果】经五折交叉验证,该模型的医学命名实体的抽取准确率0.960,召回率0.916,F- score 0.939,利用该抽取模型对大数据平台中10 295份脑卒中患者入院...

Full description

Saved in:
Bibliographic Details
Published inZhongshan da xue xue bao. Zhongshan daxue xuebao yixue kexue ban = Journal of Sun Yat-sen University. Yi xue ke xue ban Vol. 39
Main Authors 葛艳秋, 易应萍
Format Journal Article
LanguageChinese
Published Editorial Office of Journal of Sun Yat-sen University 01.01.2018
Subjects
Online AccessGet full text
ISSN1672-3554

Cover

Abstract : 【目的】研究针对非结构化临床电子病历的自然语言处理模型的构建和优化,并利用该模型对江西 省医疗大数据平台中卒中病人的病历进行结构化数据提取。【方法】从江西省医疗大数据平台中随机筛选500份 2011-2016年的卒中病人入院记录,根据临床科研的实际需求构建了脑卒中专科病人的命名实体标注体系和命 名实体标注语料库,利用该语料库构建基于CRF以及RUTA规则的命名实体抽取模型,并通过调整RUTA规则以 及参数提升识别准确率。【结果】经五折交叉验证,该模型的医学命名实体的抽取准确率0.960,召回率0.916,F- score 0.939,利用该抽取模型对大数据平台中10 295份脑卒中患者入院记录进行抽取,共抽取命名实体264 580 条,命名实体修饰1 161 077条。【结论】构建的自然语言抽取模型识别准确率较高,通过该模型能够准确地从大 量非结构化病历中获取病人的既往史、生活史、临床表现等有价值的科研数据,有效提升心脑血管疾病的临床科 研效率和科研水平
AbstractList : 【目的】研究针对非结构化临床电子病历的自然语言处理模型的构建和优化,并利用该模型对江西 省医疗大数据平台中卒中病人的病历进行结构化数据提取。【方法】从江西省医疗大数据平台中随机筛选500份 2011-2016年的卒中病人入院记录,根据临床科研的实际需求构建了脑卒中专科病人的命名实体标注体系和命 名实体标注语料库,利用该语料库构建基于CRF以及RUTA规则的命名实体抽取模型,并通过调整RUTA规则以 及参数提升识别准确率。【结果】经五折交叉验证,该模型的医学命名实体的抽取准确率0.960,召回率0.916,F- score 0.939,利用该抽取模型对大数据平台中10 295份脑卒中患者入院记录进行抽取,共抽取命名实体264 580 条,命名实体修饰1 161 077条。【结论】构建的自然语言抽取模型识别准确率较高,通过该模型能够准确地从大 量非结构化病历中获取病人的既往史、生活史、临床表现等有价值的科研数据,有效提升心脑血管疾病的临床科 研效率和科研水平
Author 葛艳秋
易应萍
Author_xml – sequence: 1
  fullname: 葛艳秋
– sequence: 2
  fullname: 易应萍
BookMark eNotzE1LAkEAgOE5GGTmT1mY2fnaOYpkCYIgel5mnJnYMDfWLt0tJMoi7WBBQdAHhNZRFP_NDmv_oqhOLzyHdwvkunHX5EAeMe57mFKyCYq9XqQgZJRhn4g8qLvHRboYlhuVdD5stJql9WvfDSbZ_Txbjtz1ILvru8ubdD51p89fk6f17NOtbt3F0k1f3OwhXY3WH2du8O6uzt1inI3ftsGGlZ2eKf63AFqVnWZ5z6vVd6vlUs3TCELkacUF1Ir5HEuuraZQU4GIIjhAga8spUgYbKVCAbc-xkz4hlNF4Y8xgRAugOrfV8fyIDxKokOZnISxjMJfiJP9UCbHUbtjQsEJUwZBhjgibW5lYBnCUnKIiWQmwN8yKXBH
ContentType Journal Article
DBID DOA
DatabaseName DOAJ Directory of Open Access Journals
DatabaseTitleList
Database_xml – sequence: 1
  dbid: DOA
  name: DOAJ Directory of Open Access Journals
  url: https://www.doaj.org/
  sourceTypes: Open Website
DeliveryMethod fulltext_linktorsrc
Discipline Medicine
ExternalDocumentID oai_doaj_org_article_9746be1061714c7fa8f613aa7034a6e8
GroupedDBID ALMA_UNASSIGNED_HOLDINGS
GROUPED_DOAJ
ID FETCH-LOGICAL-d1001-db790db6273a7dfd50d5914b438182bf5519e3fab187f233692e75b503fa69113
IEDL.DBID DOA
ISSN 1672-3554
IngestDate Wed Aug 27 01:28:02 EDT 2025
IsOpenAccess true
IsPeerReviewed true
IsScholarly true
Language Chinese
LinkModel DirectLink
MergedId FETCHMERGED-LOGICAL-d1001-db790db6273a7dfd50d5914b438182bf5519e3fab187f233692e75b503fa69113
OpenAccessLink https://doaj.org/article/9746be1061714c7fa8f613aa7034a6e8
ParticipantIDs doaj_primary_oai_doaj_org_article_9746be1061714c7fa8f613aa7034a6e8
PublicationCentury 2000
PublicationDate 2018-01-01
PublicationDateYYYYMMDD 2018-01-01
PublicationDate_xml – month: 01
  year: 2018
  text: 2018-01-01
  day: 01
PublicationDecade 2010
PublicationTitle Zhongshan da xue xue bao. Zhongshan daxue xuebao yixue kexue ban = Journal of Sun Yat-sen University. Yi xue ke xue ban
PublicationYear 2018
Publisher Editorial Office of Journal of Sun Yat-sen University
Publisher_xml – name: Editorial Office of Journal of Sun Yat-sen University
SSID ssib006563249
ssib001051178
ssib002039699
ssj0002511113
ssib006703418
ssib001103819
ssib002262833
ssib051369397
ssib001186722
ssib043242460
ssib000970529
Score 2.1013505
Snippet : 【目的】研究针对非结构化临床电子病历的自然语言处理模型的构建和优化,并利用该模型对江西 省医疗大数据平台中卒中病人的病历进行结构化数据提取。【方法】从江西省医疗大数据平台中随机筛选500份 2011-2016年的卒中病人入院记录,根据临床科研的实际需求构建了脑卒中专科病人的命名实体标注体系和命...
SourceID doaj
SourceType Open Website
SubjectTerms 中文电子病历
命名实体识别
条件随机场CRF
脑卒中
Title 基于CRF与RUTA规则相结合的卒中入院记录医学实体识别及应用
URI https://doaj.org/article/9746be1061714c7fa8f613aa7034a6e8
Volume 39
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrZ1NSxtBGMeH4kF6EV8qvlU8eF2687Izu0cVQyhUQQx4CzPZWTypSLx4jiUU3zDpIQoWBGuhRHsMEb9NhqTfwmd2FxxPXrzOYV-efZjn_9-Z-T0ILWpdsRAQ5kmNiWcrtBdKpr2kImiANadCp7st1nixxL5uBVtOqy-7JyzDA2eB-wJ6lyttjYvArCISGSZQgaSETGWS6_SYrx_5jpnKhIOwS1iO8QFh4YCrsOWCuyAzy3VzQHbEpxF3hTrhJHSEEagg6hoXbh_nZZa3mDvCXoxHgCmPaL5eZ2uEFfY47d2M4b6eLfqvmgak1a0wikZyWbqwlIVjDH043B5Hw9_yhfcJtG5-dXvd05WNQq9zulHaXBrc1Uy91b_q9B8b5rzev6yZk4tep22Obv-3bgb3_8zTT3P8aNq_zf1176kxePhu6n_N2Q_Tbfabfz6hUmF1c6Xo5b0YvNhSmrxYiciPFQe1I0WcxIEfBxFmyhLCQqISEF6RpolUOBQJofC6RItABT6McZhQ6SQa2tnd0VNoAb4dE34iKuA2maZURUqCU1YkoERDkKfRsg1EeS_DbZQtADsdgLQo52lRfistZt7jIrPoI-ijMPvjMoeGqvsH-jNokKqaT9PtGThL34M
linkProvider Directory of Open Access Journals
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8ECRF%E4%B8%8ERUTA%E8%A7%84%E5%88%99%E7%9B%B8%E7%BB%93%E5%90%88%E7%9A%84%E5%8D%92%E4%B8%AD%E5%85%A5%E9%99%A2%E8%AE%B0%E5%BD%95%E5%8C%BB%E5%AD%A6%E5%AE%9E%E4%BD%93%E8%AF%86%E5%88%AB%E5%8F%8A%E5%BA%94%E7%94%A8&rft.jtitle=Zhongshan+da+xue+xue+bao.+Zhongshan+daxue+xuebao+yixue+kexue+ban+%3D+Journal+of+Sun+Yat-sen+University.+Yi+xue+ke+xue+ban&rft.au=%E8%91%9B%E8%89%B3%E7%A7%8B&rft.au=%E6%98%93%E5%BA%94%E8%90%8D&rft.date=2018-01-01&rft.pub=Editorial+Office+of+Journal+of+Sun+Yat-sen+University&rft.issn=1672-3554&rft.volume=39&rft.externalDBID=DOA&rft.externalDocID=oai_doaj_org_article_9746be1061714c7fa8f613aa7034a6e8
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=1672-3554&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=1672-3554&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=1672-3554&client=summon