基于社交媒体文本的灾情信息识别方法比较研究

X43; 挖掘社交媒体发布的信息,逐渐成为了一种获取所需数据的重要途径,数据挖掘采用的一种重要方法就是机器学习.基于此,本研究以4起自然灾害事件的相关微博文本数据集为实验语料开展实验,比较基于朴素贝叶斯、随机森林和多元逻辑回归算法建立的3种模型的主题识别效果.结果 表明,多元逻辑回归模型对相关微博灾情文本数据的主题识别效果相对较好,各精度评价指标值高达91%;从各主题的识别结果来看,主题类别为情感支持和提醒建议的文本被正确识别的3种评价指标值均达到了90%以上.还分析了导致模型错分主题的原因,包括内因(参数设置、数据集切分比例等)和外因(样本量、人工标注等).将该多元逻辑回归模型应用于社交媒体...

Full description

Saved in:
Bibliographic Details
Published in自然灾害学报 Vol. 31; no. 1; pp. 179 - 187
Main Authors 王月明, 胡卓玮, 陈锡
Format Journal Article
LanguageChinese
Published 资源环境与地理信息系统北京市重点实验室,北京100048 01.02.2022
首都师范大学资源环境与旅游学院,北京100048
Subjects
Online AccessGet full text
ISSN1004-4574
DOI10.13577/j.jnd.2022.0117

Cover

Abstract X43; 挖掘社交媒体发布的信息,逐渐成为了一种获取所需数据的重要途径,数据挖掘采用的一种重要方法就是机器学习.基于此,本研究以4起自然灾害事件的相关微博文本数据集为实验语料开展实验,比较基于朴素贝叶斯、随机森林和多元逻辑回归算法建立的3种模型的主题识别效果.结果 表明,多元逻辑回归模型对相关微博灾情文本数据的主题识别效果相对较好,各精度评价指标值高达91%;从各主题的识别结果来看,主题类别为情感支持和提醒建议的文本被正确识别的3种评价指标值均达到了90%以上.还分析了导致模型错分主题的原因,包括内因(参数设置、数据集切分比例等)和外因(样本量、人工标注等).将该多元逻辑回归模型应用于社交媒体灾情文本主题初步识别,可以为后续工作提供优化,进而为相关部门采取应急措施提供参考.
AbstractList X43; 挖掘社交媒体发布的信息,逐渐成为了一种获取所需数据的重要途径,数据挖掘采用的一种重要方法就是机器学习.基于此,本研究以4起自然灾害事件的相关微博文本数据集为实验语料开展实验,比较基于朴素贝叶斯、随机森林和多元逻辑回归算法建立的3种模型的主题识别效果.结果 表明,多元逻辑回归模型对相关微博灾情文本数据的主题识别效果相对较好,各精度评价指标值高达91%;从各主题的识别结果来看,主题类别为情感支持和提醒建议的文本被正确识别的3种评价指标值均达到了90%以上.还分析了导致模型错分主题的原因,包括内因(参数设置、数据集切分比例等)和外因(样本量、人工标注等).将该多元逻辑回归模型应用于社交媒体灾情文本主题初步识别,可以为后续工作提供优化,进而为相关部门采取应急措施提供参考.
Author 胡卓玮
陈锡
王月明
AuthorAffiliation 首都师范大学资源环境与旅游学院,北京100048;资源环境与地理信息系统北京市重点实验室,北京100048
AuthorAffiliation_xml – name: 首都师范大学资源环境与旅游学院,北京100048;资源环境与地理信息系统北京市重点实验室,北京100048
Author_FL WANG Yueming
HU Zhuowei
CHEN Xi
Author_FL_xml – sequence: 1
  fullname: WANG Yueming
– sequence: 2
  fullname: HU Zhuowei
– sequence: 3
  fullname: CHEN Xi
Author_xml – sequence: 1
  fullname: 王月明
– sequence: 2
  fullname: 胡卓玮
– sequence: 3
  fullname: 陈锡
BookMark eNotj7tKw1AAhs9QwVq7-wZOieeSc8kkUrxBwUXncpKTowQ5hQZRupV6mxy0dhBBhS5eIIMgGDC-THLSx7Ci__Jt38e_AGqmayIAlhB0EaGcr8RubJSLIcYuRIjXQB1B6Dke5d48aCZJDGejjBCC62C1fMiK7Kqa5EU2KV-ui68bO76w92_V3Wk1yO3wrPh-soN0mp6Xl692_Gnfb206mubD6nFUPX8sgjktD5Oo-c8G2NtY321tOe2dze3WWttJEMTc4QoHkoooDIVSXhhg36ciEIzhSESKUYmI1ISzUHMP-8hHmgoFQ8F8JTnVjDTA8p_3WBotzX4n7h71zKzY6ff6ByfB712IIOLkB_fLY08
ClassificationCodes X43
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2B.
4A8
92I
93N
PSX
TCJ
DOI 10.13577/j.jnd.2022.0117
DatabaseName Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
Discipline Geography
DocumentTitle_FL Comparative study on disaster information recognition methods based on social media text
EndPage 187
ExternalDocumentID zrzhxb202201017
GrantInformation_xml – fundername: (国家重点研发计划); (国家重点研发计划)
  funderid: (国家重点研发计划); (国家重点研发计划)
GroupedDBID -02
2B.
4A8
5XA
5XB
92H
92I
93N
ABDBF
ABJNI
ACGFS
ALMA_UNASSIGNED_HOLDINGS
CCEZO
CDRFL
CW9
PSX
TCJ
TGT
U1G
U5K
UY8
~02
ID FETCH-LOGICAL-s1027-7d2ba58ecc8dd4cb29958b8662e8ed65a13af376cf7429191f58d0c869da75f63
ISSN 1004-4574
IngestDate Thu May 29 04:06:10 EDT 2025
IsPeerReviewed false
IsScholarly true
Issue 1
Keywords 社交媒体;数据挖掘;灾情文本;主题识别;机器学习;精度评价
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-s1027-7d2ba58ecc8dd4cb29958b8662e8ed65a13af376cf7429191f58d0c869da75f63
PageCount 9
ParticipantIDs wanfang_journals_zrzhxb202201017
PublicationCentury 2000
PublicationDate 2022-02-01
PublicationDateYYYYMMDD 2022-02-01
PublicationDate_xml – month: 02
  year: 2022
  text: 2022-02-01
  day: 01
PublicationDecade 2020
PublicationTitle 自然灾害学报
PublicationTitle_FL Journal of Natural Disasters
PublicationYear 2022
Publisher 资源环境与地理信息系统北京市重点实验室,北京100048
首都师范大学资源环境与旅游学院,北京100048
Publisher_xml – name: 资源环境与地理信息系统北京市重点实验室,北京100048
– name: 首都师范大学资源环境与旅游学院,北京100048
SSID ssj0000563332
ssib002263337
ssib051375355
ssib001105440
Score 2.3193128
Snippet X43; 挖掘社交媒体发布的信息,逐渐成为了一种获取所需数据的重要途径,数据挖掘采用的一种重要方法就是机器学习.基于此,本研究以4起自然灾害事件的相关微博文本数据集为实验语料开展实验,比较基于朴素贝叶斯、随机森林和多元逻辑回归算法建立的3种模型的主题识别效果.结果...
SourceID wanfang
SourceType Aggregation Database
StartPage 179
Title 基于社交媒体文本的灾情信息识别方法比较研究
URI https://d.wanfangdata.com.cn/periodical/zrzhxb202201017
Volume 31
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnV1La9wwEBZ5HNpL6ZO-2UN13O3KlmTpVGzH21BoTwnkFvxYN-SwgWQDZW8hfZ16aNMcSqEtBEofkEOh0IWmf2bjzc_ojKzNukmhj4sYxqPxNzOWNbZHMiE30jakDUrn-IWxWedxruqJiJN6LmHo8URyZt7p3r0nZ-f5nQWxMDH5vlK1tN5NGmnvt-tK_ieqwIO44irZf4jsoVJgAA3xhRYiDO1fxZhGguoWDXwacWxVRCOP-kBHlgM0yPg-1Y7hzFDt0khSLanyDBFSP8ReGrpzJBQz3UHApUqYXi3qM8Nh1G_RSGGrJGpWQAdWYaCRCFyqBRIgozkKgzZQhcCahgOEpoGspsUoBngAJwKAM8oKEsAfoVokZqgvDRIwTYwuFiMLJwmsQQAKCVAZjUUUgkAzAHTpBdPJr4hoqrXprBGnz6pvROBhuvlLdYmxTBifSfS0bo40tgxSxxgNpigTFoHAAiMDkui843710MogMESAgUWsIdXeKJghclChgxjBYWAJntQxvjd-0hEeAkeq0HLgEnDC46qYWehfmZOwVoiL8mdGo0nLTp3VwVnOQKz8N49NZliZzRybJ11hPtUvN5Y7uF2u4zRwb8BxTnBYqdlb7S09SFACNyP0Jsm043lYDzHtBzNBa5x5Q57OeXVJtXTdceYrmAvPxXYJdLntPh4vaxGsebaIAKHdPALMrKjr5HHnfiX5mztNTtmntppfDsEzZKK3dJacuN22-72fI7f23_QH_WfDnb1Bf2f_4_PB9xfF9pPi9efhq4fDjb1i89Hgx7tiY_dg9_H-00_F9rfiy8tid-tgb3P4dmv44et5Mt-K5sLZuv03SX0NUnKv7mVOEgsFN0CVZTxNIKsTKlFSOm3VzqSImRvnMHmnuQcZH9MsFyprpkrqLPZELt0LZKqz0mlfJDXFQAjujEnCmzxO3Fin4K884yxOpdTyEqlZ4xftvWdt8UhYLv9Z5Ao5OR4rV8lUd3W9fQ3y6W5y3cbyJy3pl0g
linkProvider EBSCOhost
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E7%A4%BE%E4%BA%A4%E5%AA%92%E4%BD%93%E6%96%87%E6%9C%AC%E7%9A%84%E7%81%BE%E6%83%85%E4%BF%A1%E6%81%AF%E8%AF%86%E5%88%AB%E6%96%B9%E6%B3%95%E6%AF%94%E8%BE%83%E7%A0%94%E7%A9%B6&rft.jtitle=%E8%87%AA%E7%84%B6%E7%81%BE%E5%AE%B3%E5%AD%A6%E6%8A%A5&rft.au=%E7%8E%8B%E6%9C%88%E6%98%8E&rft.au=%E8%83%A1%E5%8D%93%E7%8E%AE&rft.au=%E9%99%88%E9%94%A1&rft.date=2022-02-01&rft.pub=%E8%B5%84%E6%BA%90%E7%8E%AF%E5%A2%83%E4%B8%8E%E5%9C%B0%E7%90%86%E4%BF%A1%E6%81%AF%E7%B3%BB%E7%BB%9F%E5%8C%97%E4%BA%AC%E5%B8%82%E9%87%8D%E7%82%B9%E5%AE%9E%E9%AA%8C%E5%AE%A4%2C%E5%8C%97%E4%BA%AC100048&rft.issn=1004-4574&rft.volume=31&rft.issue=1&rft.spage=179&rft.epage=187&rft_id=info:doi/10.13577%2Fj.jnd.2022.0117&rft.externalDocID=zrzhxb202201017
thumbnail_s http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fzrzhxb%2Fzrzhxb.jpg