基于机器学习算法的子痫前期预测模型构建

R714.244; 目的 筛选子痫前期的危险因素并构建基于机器学习算法的子痫前期预测模型.方法 收集重庆医科大学医学数据研究院大数据平台中2016年1月-2018年12月1609例住院孕妇的临床数据进行回顾性分析.依据住院期间是否发生子痫前期分为子痫前期组(n=291)与非子痫前期组(n=1318).随机抽取70%患者的临床资料作为训练集(n=1126)构建预测模型,其余30%作为测试集(n=483)进行验证,并对测试集和训练集进行一致性检验.采用单因素分析及logistic回归分析筛选独立危险因素,利用5折交叉验证算法寻找LightGBM算法的最优参数,并基于LightGBM机器学习算法构建...

Full description

Saved in:
Bibliographic Details
Published in解放军医学杂志 Vol. 47; no. 8; pp. 802 - 808
Main Authors 郑江元, 祝锐, 颜永杰, 周洋, 罗亚玲
Format Journal Article
LanguageChinese
Published 重庆医科大学医学信息学院,重庆 400016%重庆医科大学医学数据研究院,重庆 400016 28.08.2022
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:R714.244; 目的 筛选子痫前期的危险因素并构建基于机器学习算法的子痫前期预测模型.方法 收集重庆医科大学医学数据研究院大数据平台中2016年1月-2018年12月1609例住院孕妇的临床数据进行回顾性分析.依据住院期间是否发生子痫前期分为子痫前期组(n=291)与非子痫前期组(n=1318).随机抽取70%患者的临床资料作为训练集(n=1126)构建预测模型,其余30%作为测试集(n=483)进行验证,并对测试集和训练集进行一致性检验.采用单因素分析及logistic回归分析筛选独立危险因素,利用5折交叉验证算法寻找LightGBM算法的最优参数,并基于LightGBM机器学习算法构建预测模型.结果 共收集了58项指标,排除缺失率≥30%的13项指标,最终共纳入45项指标.子痫前期组与非子痫前期组的谷氨酰转移酶、谷丙转氨酶、凝血酶时间、谷草转氨酶、尿比重等35项指标差异有统计学意义(P<0.05).Logistic回归分析结果显示,尿比重、尿酸、平均红细胞血红蛋白浓度、球蛋白、血小板分布宽度、钾离子、就诊年龄、高血压家族史、收缩压、舒张压、脉搏和孕周≥34周是子痫前期的独立危险因素.经5折交叉验证,当num_leaves=5、max_depth=3、min_data_in_leaf=91、feature_fraction=0.8、bagging_fraction=0.6,bagging_freq=5时,LightGBM模型的效果达到最优,模型的曲线下面积(AUC)为0.964,敏感度为84.9%,特异度为92.7%.结论 基于LightGBM机器学习算法构建的子痫前期预测模型具有较好的预测效能,能够有效预测重庆地区孕妇子痫前期的发生,为临床医师提供决策参考.
ISSN:0577-7402
DOI:10.11855/j.issn.0577-7402.2022.08.0802