基于生成对抗网络技术的医疗仿真数据生成方法

TP309.2; 对结构化电子健康档案中行的概率分布进行建模并生成仿真数据非常困难,因为表格数据通常包含定类列,传统编码方式可能产生特征维数灾难的问题,从而使建模异常困难.针对这一问题,提出利用庞加莱球模型建模医疗分类特征的层级结构,并采用高斯耦合的生成对抗网络技术合成结构化的电子健康档案.实验表明,该方法生成的训练数据能够在保证隐私性的前提下,实现与原始数据仅相差2%的可用性差异....

Full description

Saved in:
Bibliographic Details
Published in通信学报 Vol. 43; no. 3; pp. 211 - 224
Main Authors 向夏雨, 王佳慧, 王子睿, 段少明, 潘鹤中, 庄荣飞, 韩培义, 刘川意
Format Journal Article
LanguageChinese
Published 鹏城实验室网络部,广东 深圳 518066 2022
北京邮电大学网络空间安全学院,北京 100876%国家信息中心信息与网络安全部,北京 100045%哈尔滨工业大学(深圳)计算机科学与技术学院,广东 深圳 518055%哈尔滨工业大学(深圳)计算机科学与技术学院,广东 深圳 518055
Subjects
Online AccessGet full text
ISSN1000-436X
DOI10.11959/j.issn.1000?436x.2022057

Cover

More Information
Summary:TP309.2; 对结构化电子健康档案中行的概率分布进行建模并生成仿真数据非常困难,因为表格数据通常包含定类列,传统编码方式可能产生特征维数灾难的问题,从而使建模异常困难.针对这一问题,提出利用庞加莱球模型建模医疗分类特征的层级结构,并采用高斯耦合的生成对抗网络技术合成结构化的电子健康档案.实验表明,该方法生成的训练数据能够在保证隐私性的前提下,实现与原始数据仅相差2%的可用性差异.
ISSN:1000-436X
DOI:10.11959/j.issn.1000?436x.2022057