基于生成对抗网络技术的医疗仿真数据生成方法
TP309.2; 对结构化电子健康档案中行的概率分布进行建模并生成仿真数据非常困难,因为表格数据通常包含定类列,传统编码方式可能产生特征维数灾难的问题,从而使建模异常困难.针对这一问题,提出利用庞加莱球模型建模医疗分类特征的层级结构,并采用高斯耦合的生成对抗网络技术合成结构化的电子健康档案.实验表明,该方法生成的训练数据能够在保证隐私性的前提下,实现与原始数据仅相差2%的可用性差异....
Saved in:
Published in | 通信学报 Vol. 43; no. 3; pp. 211 - 224 |
---|---|
Main Authors | , , , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
鹏城实验室网络部,广东 深圳 518066
2022
北京邮电大学网络空间安全学院,北京 100876%国家信息中心信息与网络安全部,北京 100045%哈尔滨工业大学(深圳)计算机科学与技术学院,广东 深圳 518055%哈尔滨工业大学(深圳)计算机科学与技术学院,广东 深圳 518055 |
Subjects | |
Online Access | Get full text |
ISSN | 1000-436X |
DOI | 10.11959/j.issn.1000?436x.2022057 |
Cover
Summary: | TP309.2; 对结构化电子健康档案中行的概率分布进行建模并生成仿真数据非常困难,因为表格数据通常包含定类列,传统编码方式可能产生特征维数灾难的问题,从而使建模异常困难.针对这一问题,提出利用庞加莱球模型建模医疗分类特征的层级结构,并采用高斯耦合的生成对抗网络技术合成结构化的电子健康档案.实验表明,该方法生成的训练数据能够在保证隐私性的前提下,实现与原始数据仅相差2%的可用性差异. |
---|---|
ISSN: | 1000-436X |
DOI: | 10.11959/j.issn.1000?436x.2022057 |