基于XGBoost的微博流行度预测算法
TP391; 随着全媒体时代的到来和社交网络的发展,流行度预测在舆情监测和数据话语权的争夺上开始发挥重要的作用.现有的流行度预测研究多集中于外文媒体,对以微博为代表的国内主流媒体进行流行度预测是一个新兴且具有挑战的方向.本文针对微博这一国内社交媒体平台进行研究,通过对微博内容及微博用户的特征分析,设计了多种流行度预测方案,同时,提出了一种基于XGBoost的微博流行度预测算法,将流行度预测问题转换为互动值档位分类问题,在分类式框架下将提取融合后的特征用于模型训练,可以较为准确地对有用户信息的微博的流行度情况进行预测.本文的算法在微博流行度预测数据集中得到验证,并且取得了准确率高达85.69%的...
Saved in:
Published in | 数据采集与处理 Vol. 37; no. 2; pp. 383 - 395 |
---|---|
Main Authors | , , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
人民网传播内容认知国家重点实验室,北京 100733
01.03.2022
天津大学电气自动化与信息工程学院,天津 300072%人民网传播内容认知国家重点实验室,北京 100733%天津大学电气自动化与信息工程学院,天津 300072 |
Subjects | |
Online Access | Get full text |
ISSN | 1004-9037 |
DOI | 10.16337/j.1004-9037.2022.02.011 |
Cover
Loading…
Abstract | TP391; 随着全媒体时代的到来和社交网络的发展,流行度预测在舆情监测和数据话语权的争夺上开始发挥重要的作用.现有的流行度预测研究多集中于外文媒体,对以微博为代表的国内主流媒体进行流行度预测是一个新兴且具有挑战的方向.本文针对微博这一国内社交媒体平台进行研究,通过对微博内容及微博用户的特征分析,设计了多种流行度预测方案,同时,提出了一种基于XGBoost的微博流行度预测算法,将流行度预测问题转换为互动值档位分类问题,在分类式框架下将提取融合后的特征用于模型训练,可以较为准确地对有用户信息的微博的流行度情况进行预测.本文的算法在微博流行度预测数据集中得到验证,并且取得了准确率高达85.69%的优越效果. |
---|---|
AbstractList | TP391; 随着全媒体时代的到来和社交网络的发展,流行度预测在舆情监测和数据话语权的争夺上开始发挥重要的作用.现有的流行度预测研究多集中于外文媒体,对以微博为代表的国内主流媒体进行流行度预测是一个新兴且具有挑战的方向.本文针对微博这一国内社交媒体平台进行研究,通过对微博内容及微博用户的特征分析,设计了多种流行度预测方案,同时,提出了一种基于XGBoost的微博流行度预测算法,将流行度预测问题转换为互动值档位分类问题,在分类式框架下将提取融合后的特征用于模型训练,可以较为准确地对有用户信息的微博的流行度情况进行预测.本文的算法在微博流行度预测数据集中得到验证,并且取得了准确率高达85.69%的优越效果. |
Author | 袁运新 任敏捷 陈睿东 刘安安 聂为之 王晓雯 靳国庆 |
AuthorAffiliation | 人民网传播内容认知国家重点实验室,北京 100733;天津大学电气自动化与信息工程学院,天津 300072%人民网传播内容认知国家重点实验室,北京 100733%天津大学电气自动化与信息工程学院,天津 300072 |
AuthorAffiliation_xml | – name: 人民网传播内容认知国家重点实验室,北京 100733;天津大学电气自动化与信息工程学院,天津 300072%人民网传播内容认知国家重点实验室,北京 100733%天津大学电气自动化与信息工程学院,天津 300072 |
Author_FL | CHEN Ruidong REN Minjie NIE Weizhi LIU An'an WANG Xiaowen YUAN Yunxin JIN Guoqing |
Author_FL_xml | – sequence: 1 fullname: REN Minjie – sequence: 2 fullname: JIN Guoqing – sequence: 3 fullname: WANG Xiaowen – sequence: 4 fullname: CHEN Ruidong – sequence: 5 fullname: YUAN Yunxin – sequence: 6 fullname: NIE Weizhi – sequence: 7 fullname: LIU An'an |
Author_xml | – sequence: 1 fullname: 任敏捷 – sequence: 2 fullname: 靳国庆 – sequence: 3 fullname: 王晓雯 – sequence: 4 fullname: 陈睿东 – sequence: 5 fullname: 袁运新 – sequence: 6 fullname: 聂为之 – sequence: 7 fullname: 刘安安 |
BookMark | eNrjYmDJy89LZWBQMDTQMzQzNjbXz9IzNDAw0bU0MDbXMzIwMtIzACJDQxYGTrg4BwNvcXFmkoGRsZmJmaGlGSeD9tP5u57s6otwd8rPLy55Pqvl6b51T3tnPdva-GJhz9Ndy14uanm2tfv5uunPNk_lYWBNS8wpTuWF0twMoW6uIc4euj7-7p7Ojj66xYYGxoa6ZubmqSlmJqkWlmkGiaZJxolGaSYWhimWKSmJFkbJJgZmqQbGxmZJ5kZpyYZGyUZmqWmmyUmWaSYpxmbJqUamBsbcDBoQc8sT89IS89Ljs_JLi_KANsYXZyVnVSbngHxnYAT0mzEAdRRT6Q |
ClassificationCodes | TP391 |
ContentType | Journal Article |
Copyright | Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
Copyright_xml | – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
DBID | 2B. 4A8 92I 93N PSX TCJ |
DOI | 10.16337/j.1004-9037.2022.02.011 |
DatabaseName | Wanfang Data Journals - Hong Kong WANFANG Data Centre Wanfang Data Journals 万方数据期刊 - 香港版 China Online Journals (COJ) China Online Journals (COJ) |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
DocumentTitle_FL | Microblog Popularity Prediction Algorithm Based on XGBoost |
EndPage | 395 |
ExternalDocumentID | sjcjycl202202011 |
GrantInformation_xml | – fundername: 国家重点实验室开放基金 funderid: (20K04) |
GroupedDBID | 2B. 4A8 92I 93N ADMLS ALMA_UNASSIGNED_HOLDINGS PSX TCJ |
ID | FETCH-LOGICAL-s1031-677ed64e89f0a5b3a2f481d9dda82c406e0336b72fc12c26ef5cb9f4d36ce2503 |
ISSN | 1004-9037 |
IngestDate | Thu May 29 04:00:12 EDT 2025 |
IsPeerReviewed | false |
IsScholarly | true |
Issue | 2 |
Keywords | 社交媒体预测;XGBoost;特征提取;特征融合;微博流行度 |
Language | Chinese |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-s1031-677ed64e89f0a5b3a2f481d9dda82c406e0336b72fc12c26ef5cb9f4d36ce2503 |
PageCount | 13 |
ParticipantIDs | wanfang_journals_sjcjycl202202011 |
PublicationCentury | 2000 |
PublicationDate | 2022-03-01 |
PublicationDateYYYYMMDD | 2022-03-01 |
PublicationDate_xml | – month: 03 year: 2022 text: 2022-03-01 day: 01 |
PublicationDecade | 2020 |
PublicationTitle | 数据采集与处理 |
PublicationTitle_FL | Journal of Data Acquisition & Processing |
PublicationYear | 2022 |
Publisher | 人民网传播内容认知国家重点实验室,北京 100733 天津大学电气自动化与信息工程学院,天津 300072%人民网传播内容认知国家重点实验室,北京 100733%天津大学电气自动化与信息工程学院,天津 300072 |
Publisher_xml | – name: 天津大学电气自动化与信息工程学院,天津 300072%人民网传播内容认知国家重点实验室,北京 100733%天津大学电气自动化与信息工程学院,天津 300072 – name: 人民网传播内容认知国家重点实验室,北京 100733 |
SSID | ssib023646196 ssib001102757 ssib000459638 ssib001164671 ssib006568634 ssib002264227 ssib036439733 ssib057620134 ssib023167944 ssib051372606 |
Score | 2.3006718 |
Snippet | TP391;... |
SourceID | wanfang |
SourceType | Aggregation Database |
StartPage | 383 |
Title | 基于XGBoost的微博流行度预测算法 |
URI | https://d.wanfangdata.com.cn/periodical/sjcjycl202202011 |
Volume | 37 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnR1Nb9Mw1Nq6CxcEAsS3hoRPU0tiO_44Om3KhIALm9Tb1KQJUKFOouXAbpN24-OGkHZBcOC4C9qlB34N7eBf8J7jtikf0kCKIsd5fn4fsf1e5PdMyO0i6Kqu4RjrlBd1EYa8bjINrkooVMoKBkum2-X7UG5ui3udqLOyul-NLhmljWzvj3El_6NVqAO9YpTsP2h2jhQqoAz6hTtoGO6n0jFNImraNLY0EXjXSeduvIthHImiBp4FQsQJtQkWdAsrE0ljKIc00dSGVDcdjKVW0sRQy1yrEiZGPNDWKFfDaXlS5cyYxUoDbQMsAHLsxVCt8IKCiamWjjINlGEvVjjkQFtA9fyXoAOJ8Srx6bbHF6sFCKBrIQXIMcC2PNFVLAp70SUWAOeeBttewgIEakcCoGt76kyz-vMD_Ob57i_3uXrpxqXsAmpCRAA0YAFeNal1IjCMWkcYsK0jx3BCY-MEnSDz2G2b2miJC4SRM8G1HBvMtXKvjJOptV5PJR7mylCDinG02eZG6E7GrCwyuPnHBGWym9kq5J-eVn4GlEsKLw_68dYJLxX928Inucud0G_MkTdQXi4frV_NltOKD_tZ_2X2DIECNAJXyRoDT4vVyJptPbj_qGrzL03SYC_C-FWVZymqORIxMpuxavCy1HKRg5Bh6oVKMDYeYABO_Nwm5s5EXvggUcgV-Nzz9-AfA7nlbpEZq36HHsrgzl8k4GLyBkV38LhiPm6dI2e937duy0F8nqzsPblANiYfxt_Gb_2gPTk8mHw9mrw5nB7vf__4ejL-_OPTwfT41cnR--mXdxfJdjvZam7W_ekl9SEenVKXSuU9KXJtYD6MUt5lhQDn0PR6Xc0ysKPzgHOZKlZkIcuYzIsoS00hehwP6YsCfonUBruD_DJZz3hPyLyLkgpEoaVmQha5zFLGe2mh1RVyyzO342en4c6v-r16Cphr5MxikF0ntdHzF_kNsLlH6U3_VfwEUSmTvA |
linkProvider | EBSCOhost |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8EXGBoost%E7%9A%84%E5%BE%AE%E5%8D%9A%E6%B5%81%E8%A1%8C%E5%BA%A6%E9%A2%84%E6%B5%8B%E7%AE%97%E6%B3%95&rft.jtitle=%E6%95%B0%E6%8D%AE%E9%87%87%E9%9B%86%E4%B8%8E%E5%A4%84%E7%90%86&rft.au=%E4%BB%BB%E6%95%8F%E6%8D%B7&rft.au=%E9%9D%B3%E5%9B%BD%E5%BA%86&rft.au=%E7%8E%8B%E6%99%93%E9%9B%AF&rft.au=%E9%99%88%E7%9D%BF%E4%B8%9C&rft.date=2022-03-01&rft.pub=%E4%BA%BA%E6%B0%91%E7%BD%91%E4%BC%A0%E6%92%AD%E5%86%85%E5%AE%B9%E8%AE%A4%E7%9F%A5%E5%9B%BD%E5%AE%B6%E9%87%8D%E7%82%B9%E5%AE%9E%E9%AA%8C%E5%AE%A4%2C%E5%8C%97%E4%BA%AC+100733&rft.issn=1004-9037&rft.volume=37&rft.issue=2&rft.spage=383&rft.epage=395&rft_id=info:doi/10.16337%2Fj.1004-9037.2022.02.011&rft.externalDocID=sjcjycl202202011 |
thumbnail_s | http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fsjcjycl%2Fsjcjycl.jpg |