基于XGBoost的微博流行度预测算法
TP391; 随着全媒体时代的到来和社交网络的发展,流行度预测在舆情监测和数据话语权的争夺上开始发挥重要的作用.现有的流行度预测研究多集中于外文媒体,对以微博为代表的国内主流媒体进行流行度预测是一个新兴且具有挑战的方向.本文针对微博这一国内社交媒体平台进行研究,通过对微博内容及微博用户的特征分析,设计了多种流行度预测方案,同时,提出了一种基于XGBoost的微博流行度预测算法,将流行度预测问题转换为互动值档位分类问题,在分类式框架下将提取融合后的特征用于模型训练,可以较为准确地对有用户信息的微博的流行度情况进行预测.本文的算法在微博流行度预测数据集中得到验证,并且取得了准确率高达85.69%的...
Saved in:
Published in | 数据采集与处理 Vol. 37; no. 2; pp. 383 - 395 |
---|---|
Main Authors | , , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
人民网传播内容认知国家重点实验室,北京 100733
01.03.2022
天津大学电气自动化与信息工程学院,天津 300072%人民网传播内容认知国家重点实验室,北京 100733%天津大学电气自动化与信息工程学院,天津 300072 |
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | TP391; 随着全媒体时代的到来和社交网络的发展,流行度预测在舆情监测和数据话语权的争夺上开始发挥重要的作用.现有的流行度预测研究多集中于外文媒体,对以微博为代表的国内主流媒体进行流行度预测是一个新兴且具有挑战的方向.本文针对微博这一国内社交媒体平台进行研究,通过对微博内容及微博用户的特征分析,设计了多种流行度预测方案,同时,提出了一种基于XGBoost的微博流行度预测算法,将流行度预测问题转换为互动值档位分类问题,在分类式框架下将提取融合后的特征用于模型训练,可以较为准确地对有用户信息的微博的流行度情况进行预测.本文的算法在微博流行度预测数据集中得到验证,并且取得了准确率高达85.69%的优越效果. |
---|---|
ISSN: | 1004-9037 |
DOI: | 10.16337/j.1004-9037.2022.02.011 |