基于百度贴吧的HIV高危人群特征分析

TP391.1; 对百度贴吧"恐艾吧"中在线高危人群的帖子内容、线上活动时间规律进行了分析,利用LDA话题模型,对比分析了有无HIV感染者参与的主贴讨论的话题之间的差异,使用基于关键词的机器学习方法区分了在"恐艾吧"中发布话题的用户的性取向,计算不同性取向人群中HIV的流行率.研究结果说明,使用在线数据挖掘的技术和方法比传统方法更加高效,可以作为高危人群研究的重要补充.此外,基于机器学习对人群性取向进行智能判别,对于公共卫生管理部门监测疫情在不同人群中的发展状况有重要意义....

Full description

Saved in:
Bibliographic Details
Published in大数据 no. 1; pp. 98 - 108
Main Authors 肖时耀, 吕慰, 陈洒然, 秦烁, 黄格, 蔡梦思, 谭跃进, 谭旭, 吕欣
Format Journal Article
LanguageChinese
Published 国防科技大学系统工程学院,湖南 长沙,410073%湖南益阳康雅医院肿瘤科,湖南 益阳,413002%深圳信息职业技术学院软件工程学院,广东 深圳,518172 2019
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:TP391.1; 对百度贴吧"恐艾吧"中在线高危人群的帖子内容、线上活动时间规律进行了分析,利用LDA话题模型,对比分析了有无HIV感染者参与的主贴讨论的话题之间的差异,使用基于关键词的机器学习方法区分了在"恐艾吧"中发布话题的用户的性取向,计算不同性取向人群中HIV的流行率.研究结果说明,使用在线数据挖掘的技术和方法比传统方法更加高效,可以作为高危人群研究的重要补充.此外,基于机器学习对人群性取向进行智能判别,对于公共卫生管理部门监测疫情在不同人群中的发展状况有重要意义.
ISSN:2096-0271
DOI:10.11959/j.issn.2096-271.2019008