基于异构数据的患者术后非计划内再入院预测

TP319.1; 非计划内再入院是医院风险管理的重要信号,也是医疗质量的重要指标.目前,再入院预测已经成为医疗系统的一项重要任务,大量学者结合机器学习技术提出非常多有效的预测方法,但大多仅以单一结构数据为研究对象或仅使用串联方法融合异构数据.前者未能充分利用电子病历中丰富的数据与信息,后者则未能更好地融合异构数据的信息.基于上述问题,本文提出了一种基于CTFN异构数据融合方法,结合患者出院小结文本与住院期间产生的横断面数据预测患者再入院风险.预测模型的构建分为3个步骤.首先,利用RoBerta模型提取患者出院小结中的特征信息并得到表征矩阵;其次,使用CNN模型学习患者横断面特征信息,得到表征矩...

Full description

Saved in:
Bibliographic Details
Published in工程科学与技术 Vol. 57; no. 1; pp. 89 - 97
Main Authors 俞凯, 董小锋, 袁贞明, 崔朝健, 罗伟斌
Format Journal Article
LanguageChinese
Published 杭州师范大学 信息科学与技术学院,浙江 杭州 310016 2025
Subjects
Online AccessGet full text
ISSN2096-3246
DOI10.12454/j.jsuese.202300572

Cover

Loading…
More Information
Summary:TP319.1; 非计划内再入院是医院风险管理的重要信号,也是医疗质量的重要指标.目前,再入院预测已经成为医疗系统的一项重要任务,大量学者结合机器学习技术提出非常多有效的预测方法,但大多仅以单一结构数据为研究对象或仅使用串联方法融合异构数据.前者未能充分利用电子病历中丰富的数据与信息,后者则未能更好地融合异构数据的信息.基于上述问题,本文提出了一种基于CTFN异构数据融合方法,结合患者出院小结文本与住院期间产生的横断面数据预测患者再入院风险.预测模型的构建分为3个步骤.首先,利用RoBerta模型提取患者出院小结中的特征信息并得到表征矩阵;其次,使用CNN模型学习患者横断面特征信息,得到表征矩阵;最后,通过CTFN方法融合两个表征矩阵,得到异构数据的表征矩阵并通过线性层分类器得到最后的预测结果.CT-FN融合方法利用张量外积融合多个单模态表征矩阵,并增加CNN模型及残差结构设计加强异构数据模态内与模态间的信息学习.根据某公立医院的临床数据对上述方法进行验证,实验结果表明其表现出色,其中,召回率达到了76.1%,ROC曲线下面积达到了71.5%,均高于所对比的基线模型.证实了异构数据能提升分类器预测效果,且CTFN融合方法能够更好地融合异构数据间的信息,进一步提升分类器预测效果.
ISSN:2096-3246
DOI:10.12454/j.jsuese.202300572