基于XGBoost的微博流行度预测算法

TP391; 随着全媒体时代的到来和社交网络的发展,流行度预测在舆情监测和数据话语权的争夺上开始发挥重要的作用.现有的流行度预测研究多集中于外文媒体,对以微博为代表的国内主流媒体进行流行度预测是一个新兴且具有挑战的方向.本文针对微博这一国内社交媒体平台进行研究,通过对微博内容及微博用户的特征分析,设计了多种流行度预测方案,同时,提出了一种基于XGBoost的微博流行度预测算法,将流行度预测问题转换为互动值档位分类问题,在分类式框架下将提取融合后的特征用于模型训练,可以较为准确地对有用户信息的微博的流行度情况进行预测.本文的算法在微博流行度预测数据集中得到验证,并且取得了准确率高达85.69%的...

Full description

Saved in:
Bibliographic Details
Published in数据采集与处理 Vol. 37; no. 2; pp. 383 - 395
Main Authors 任敏捷, 靳国庆, 王晓雯, 陈睿东, 袁运新, 聂为之, 刘安安
Format Journal Article
LanguageChinese
Published 人民网传播内容认知国家重点实验室,北京 100733 01.03.2022
天津大学电气自动化与信息工程学院,天津 300072%人民网传播内容认知国家重点实验室,北京 100733%天津大学电气自动化与信息工程学院,天津 300072
Subjects
Online AccessGet full text
ISSN1004-9037
DOI10.16337/j.1004-9037.2022.02.011

Cover

Loading…
Abstract TP391; 随着全媒体时代的到来和社交网络的发展,流行度预测在舆情监测和数据话语权的争夺上开始发挥重要的作用.现有的流行度预测研究多集中于外文媒体,对以微博为代表的国内主流媒体进行流行度预测是一个新兴且具有挑战的方向.本文针对微博这一国内社交媒体平台进行研究,通过对微博内容及微博用户的特征分析,设计了多种流行度预测方案,同时,提出了一种基于XGBoost的微博流行度预测算法,将流行度预测问题转换为互动值档位分类问题,在分类式框架下将提取融合后的特征用于模型训练,可以较为准确地对有用户信息的微博的流行度情况进行预测.本文的算法在微博流行度预测数据集中得到验证,并且取得了准确率高达85.69%的优越效果.
AbstractList TP391; 随着全媒体时代的到来和社交网络的发展,流行度预测在舆情监测和数据话语权的争夺上开始发挥重要的作用.现有的流行度预测研究多集中于外文媒体,对以微博为代表的国内主流媒体进行流行度预测是一个新兴且具有挑战的方向.本文针对微博这一国内社交媒体平台进行研究,通过对微博内容及微博用户的特征分析,设计了多种流行度预测方案,同时,提出了一种基于XGBoost的微博流行度预测算法,将流行度预测问题转换为互动值档位分类问题,在分类式框架下将提取融合后的特征用于模型训练,可以较为准确地对有用户信息的微博的流行度情况进行预测.本文的算法在微博流行度预测数据集中得到验证,并且取得了准确率高达85.69%的优越效果.
Author 袁运新
任敏捷
陈睿东
刘安安
聂为之
王晓雯
靳国庆
AuthorAffiliation 人民网传播内容认知国家重点实验室,北京 100733;天津大学电气自动化与信息工程学院,天津 300072%人民网传播内容认知国家重点实验室,北京 100733%天津大学电气自动化与信息工程学院,天津 300072
AuthorAffiliation_xml – name: 人民网传播内容认知国家重点实验室,北京 100733;天津大学电气自动化与信息工程学院,天津 300072%人民网传播内容认知国家重点实验室,北京 100733%天津大学电气自动化与信息工程学院,天津 300072
Author_FL CHEN Ruidong
REN Minjie
NIE Weizhi
LIU An'an
WANG Xiaowen
YUAN Yunxin
JIN Guoqing
Author_FL_xml – sequence: 1
  fullname: REN Minjie
– sequence: 2
  fullname: JIN Guoqing
– sequence: 3
  fullname: WANG Xiaowen
– sequence: 4
  fullname: CHEN Ruidong
– sequence: 5
  fullname: YUAN Yunxin
– sequence: 6
  fullname: NIE Weizhi
– sequence: 7
  fullname: LIU An'an
Author_xml – sequence: 1
  fullname: 任敏捷
– sequence: 2
  fullname: 靳国庆
– sequence: 3
  fullname: 王晓雯
– sequence: 4
  fullname: 陈睿东
– sequence: 5
  fullname: 袁运新
– sequence: 6
  fullname: 聂为之
– sequence: 7
  fullname: 刘安安
BookMark eNrjYmDJy89LZWBQMDTQMzQzNjbXz9IzNDAw0bU0MDbXMzIwMtIzACJDQxYGTrg4BwNvcXFmkoGRsZmJmaGlGSeD9tP5u57s6otwd8rPLy55Pqvl6b51T3tnPdva-GJhz9Ndy14uanm2tfv5uunPNk_lYWBNS8wpTuWF0twMoW6uIc4euj7-7p7Ojj66xYYGxoa6ZubmqSlmJqkWlmkGiaZJxolGaSYWhimWKSmJFkbJJgZmqQbGxmZJ5kZpyYZGyUZmqWmmyUmWaSYpxmbJqUamBsbcDBoQc8sT89IS89Ljs_JLi_KANsYXZyVnVSbngHxnYAT0mzEAdRRT6Q
ClassificationCodes TP391
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2B.
4A8
92I
93N
PSX
TCJ
DOI 10.16337/j.1004-9037.2022.02.011
DatabaseName Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
DocumentTitle_FL Microblog Popularity Prediction Algorithm Based on XGBoost
EndPage 395
ExternalDocumentID sjcjycl202202011
GrantInformation_xml – fundername: 国家重点实验室开放基金
  funderid: (20K04)
GroupedDBID 2B.
4A8
92I
93N
ADMLS
ALMA_UNASSIGNED_HOLDINGS
PSX
TCJ
ID FETCH-LOGICAL-s1031-677ed64e89f0a5b3a2f481d9dda82c406e0336b72fc12c26ef5cb9f4d36ce2503
ISSN 1004-9037
IngestDate Thu May 29 04:00:12 EDT 2025
IsPeerReviewed false
IsScholarly true
Issue 2
Keywords 社交媒体预测;XGBoost;特征提取;特征融合;微博流行度
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-s1031-677ed64e89f0a5b3a2f481d9dda82c406e0336b72fc12c26ef5cb9f4d36ce2503
PageCount 13
ParticipantIDs wanfang_journals_sjcjycl202202011
PublicationCentury 2000
PublicationDate 2022-03-01
PublicationDateYYYYMMDD 2022-03-01
PublicationDate_xml – month: 03
  year: 2022
  text: 2022-03-01
  day: 01
PublicationDecade 2020
PublicationTitle 数据采集与处理
PublicationTitle_FL Journal of Data Acquisition & Processing
PublicationYear 2022
Publisher 人民网传播内容认知国家重点实验室,北京 100733
天津大学电气自动化与信息工程学院,天津 300072%人民网传播内容认知国家重点实验室,北京 100733%天津大学电气自动化与信息工程学院,天津 300072
Publisher_xml – name: 天津大学电气自动化与信息工程学院,天津 300072%人民网传播内容认知国家重点实验室,北京 100733%天津大学电气自动化与信息工程学院,天津 300072
– name: 人民网传播内容认知国家重点实验室,北京 100733
SSID ssib023646196
ssib001102757
ssib000459638
ssib001164671
ssib006568634
ssib002264227
ssib036439733
ssib057620134
ssib023167944
ssib051372606
Score 2.3006718
Snippet TP391;...
SourceID wanfang
SourceType Aggregation Database
StartPage 383
Title 基于XGBoost的微博流行度预测算法
URI https://d.wanfangdata.com.cn/periodical/sjcjycl202202011
Volume 37
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR1Nb9Mw1Nq6CxcEAsS3hoRPU0tiO_44Om3KhIALm9Tb1KQJUKFOouXAbpN24-OGkHZBcOC4C9qlB34N7eBf8J7jtikf0kCKIsd5fn4fsf1e5PdMyO0i6Kqu4RjrlBd1EYa8bjINrkooVMoKBkum2-X7UG5ui3udqLOyul-NLhmljWzvj3El_6NVqAO9YpTsP2h2jhQqoAz6hTtoGO6n0jFNImraNLY0EXjXSeduvIthHImiBp4FQsQJtQkWdAsrE0ljKIc00dSGVDcdjKVW0sRQy1yrEiZGPNDWKFfDaXlS5cyYxUoDbQMsAHLsxVCt8IKCiamWjjINlGEvVjjkQFtA9fyXoAOJ8Srx6bbHF6sFCKBrIQXIMcC2PNFVLAp70SUWAOeeBttewgIEakcCoGt76kyz-vMD_Ob57i_3uXrpxqXsAmpCRAA0YAFeNal1IjCMWkcYsK0jx3BCY-MEnSDz2G2b2miJC4SRM8G1HBvMtXKvjJOptV5PJR7mylCDinG02eZG6E7GrCwyuPnHBGWym9kq5J-eVn4GlEsKLw_68dYJLxX928Inucud0G_MkTdQXi4frV_NltOKD_tZ_2X2DIECNAJXyRoDT4vVyJptPbj_qGrzL03SYC_C-FWVZymqORIxMpuxavCy1HKRg5Bh6oVKMDYeYABO_Nwm5s5EXvggUcgV-Nzz9-AfA7nlbpEZq36HHsrgzl8k4GLyBkV38LhiPm6dI2e937duy0F8nqzsPblANiYfxt_Gb_2gPTk8mHw9mrw5nB7vf__4ejL-_OPTwfT41cnR--mXdxfJdjvZam7W_ekl9SEenVKXSuU9KXJtYD6MUt5lhQDn0PR6Xc0ysKPzgHOZKlZkIcuYzIsoS00hehwP6YsCfonUBruD_DJZz3hPyLyLkgpEoaVmQha5zFLGe2mh1RVyyzO342en4c6v-r16Cphr5MxikF0ntdHzF_kNsLlH6U3_VfwEUSmTvA
linkProvider EBSCOhost
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8EXGBoost%E7%9A%84%E5%BE%AE%E5%8D%9A%E6%B5%81%E8%A1%8C%E5%BA%A6%E9%A2%84%E6%B5%8B%E7%AE%97%E6%B3%95&rft.jtitle=%E6%95%B0%E6%8D%AE%E9%87%87%E9%9B%86%E4%B8%8E%E5%A4%84%E7%90%86&rft.au=%E4%BB%BB%E6%95%8F%E6%8D%B7&rft.au=%E9%9D%B3%E5%9B%BD%E5%BA%86&rft.au=%E7%8E%8B%E6%99%93%E9%9B%AF&rft.au=%E9%99%88%E7%9D%BF%E4%B8%9C&rft.date=2022-03-01&rft.pub=%E4%BA%BA%E6%B0%91%E7%BD%91%E4%BC%A0%E6%92%AD%E5%86%85%E5%AE%B9%E8%AE%A4%E7%9F%A5%E5%9B%BD%E5%AE%B6%E9%87%8D%E7%82%B9%E5%AE%9E%E9%AA%8C%E5%AE%A4%2C%E5%8C%97%E4%BA%AC+100733&rft.issn=1004-9037&rft.volume=37&rft.issue=2&rft.spage=383&rft.epage=395&rft_id=info:doi/10.16337%2Fj.1004-9037.2022.02.011&rft.externalDocID=sjcjycl202202011
thumbnail_s http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fsjcjycl%2Fsjcjycl.jpg