真实世界研究中多个协变量缺失数据填补方法及系统

本发明提供一种真实世界研究中多个协变量缺失数据填补方法及系统。多个协变量缺失数据填补方法包括:步骤S1:输入原始数据集,得到数据集中的含缺失数据的变量的具体信息;步骤S2:根据原始数据集的数据缺失信息,以及Little检验和Liu's Score检验自动判断数据的缺失机制;步骤S3:若判断出缺失机制为完全随机缺失或随机缺失时,则使用MCMC进行填补,得到若干填补后的完整数据集;若判断出缺失机制为非随机缺失时,则使用GEM进行填补,得到若干二次填补后的完整数据集;步骤S4:输出填补后的完整数据集。本申请的缺失数据填补方法可方便快捷地生成填补后的完整的且可供统计分析的真实世界研究的数据集...

Full description

Saved in:
Bibliographic Details
Format Patent
LanguageChinese
Published 13.02.2024
Subjects
Online AccessGet full text

Cover

More Information
Summary:本发明提供一种真实世界研究中多个协变量缺失数据填补方法及系统。多个协变量缺失数据填补方法包括:步骤S1:输入原始数据集,得到数据集中的含缺失数据的变量的具体信息;步骤S2:根据原始数据集的数据缺失信息,以及Little检验和Liu's Score检验自动判断数据的缺失机制;步骤S3:若判断出缺失机制为完全随机缺失或随机缺失时,则使用MCMC进行填补,得到若干填补后的完整数据集;若判断出缺失机制为非随机缺失时,则使用GEM进行填补,得到若干二次填补后的完整数据集;步骤S4:输出填补后的完整数据集。本申请的缺失数据填补方法可方便快捷地生成填补后的完整的且可供统计分析的真实世界研究的数据集,从而提高含多个协变量缺失数据的填补效率和准确性。
Bibliography:Application Number: CN202310622966