基于社交媒体文本的灾情信息识别方法比较研究
X43; 挖掘社交媒体发布的信息,逐渐成为了一种获取所需数据的重要途径,数据挖掘采用的一种重要方法就是机器学习.基于此,本研究以4起自然灾害事件的相关微博文本数据集为实验语料开展实验,比较基于朴素贝叶斯、随机森林和多元逻辑回归算法建立的3种模型的主题识别效果.结果 表明,多元逻辑回归模型对相关微博灾情文本数据的主题识别效果相对较好,各精度评价指标值高达91%;从各主题的识别结果来看,主题类别为情感支持和提醒建议的文本被正确识别的3种评价指标值均达到了90%以上.还分析了导致模型错分主题的原因,包括内因(参数设置、数据集切分比例等)和外因(样本量、人工标注等).将该多元逻辑回归模型应用于社交媒体...
Saved in:
Published in | 自然灾害学报 Vol. 31; no. 1; pp. 179 - 187 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | Chinese |
Published |
资源环境与地理信息系统北京市重点实验室,北京100048
01.02.2022
首都师范大学资源环境与旅游学院,北京100048 |
Subjects | |
Online Access | Get full text |
ISSN | 1004-4574 |
DOI | 10.13577/j.jnd.2022.0117 |
Cover
Abstract | X43; 挖掘社交媒体发布的信息,逐渐成为了一种获取所需数据的重要途径,数据挖掘采用的一种重要方法就是机器学习.基于此,本研究以4起自然灾害事件的相关微博文本数据集为实验语料开展实验,比较基于朴素贝叶斯、随机森林和多元逻辑回归算法建立的3种模型的主题识别效果.结果 表明,多元逻辑回归模型对相关微博灾情文本数据的主题识别效果相对较好,各精度评价指标值高达91%;从各主题的识别结果来看,主题类别为情感支持和提醒建议的文本被正确识别的3种评价指标值均达到了90%以上.还分析了导致模型错分主题的原因,包括内因(参数设置、数据集切分比例等)和外因(样本量、人工标注等).将该多元逻辑回归模型应用于社交媒体灾情文本主题初步识别,可以为后续工作提供优化,进而为相关部门采取应急措施提供参考. |
---|---|
AbstractList | X43; 挖掘社交媒体发布的信息,逐渐成为了一种获取所需数据的重要途径,数据挖掘采用的一种重要方法就是机器学习.基于此,本研究以4起自然灾害事件的相关微博文本数据集为实验语料开展实验,比较基于朴素贝叶斯、随机森林和多元逻辑回归算法建立的3种模型的主题识别效果.结果 表明,多元逻辑回归模型对相关微博灾情文本数据的主题识别效果相对较好,各精度评价指标值高达91%;从各主题的识别结果来看,主题类别为情感支持和提醒建议的文本被正确识别的3种评价指标值均达到了90%以上.还分析了导致模型错分主题的原因,包括内因(参数设置、数据集切分比例等)和外因(样本量、人工标注等).将该多元逻辑回归模型应用于社交媒体灾情文本主题初步识别,可以为后续工作提供优化,进而为相关部门采取应急措施提供参考. |
Author | 胡卓玮 陈锡 王月明 |
AuthorAffiliation | 首都师范大学资源环境与旅游学院,北京100048;资源环境与地理信息系统北京市重点实验室,北京100048 |
AuthorAffiliation_xml | – name: 首都师范大学资源环境与旅游学院,北京100048;资源环境与地理信息系统北京市重点实验室,北京100048 |
Author_FL | WANG Yueming HU Zhuowei CHEN Xi |
Author_FL_xml | – sequence: 1 fullname: WANG Yueming – sequence: 2 fullname: HU Zhuowei – sequence: 3 fullname: CHEN Xi |
Author_xml | – sequence: 1 fullname: 王月明 – sequence: 2 fullname: 胡卓玮 – sequence: 3 fullname: 陈锡 |
BookMark | eNotj7tKw1AAhs9QwVq7-wZOieeSc8kkUrxBwUXncpKTowQ5hQZRupV6mxy0dhBBhS5eIIMgGDC-THLSx7Ci__Jt38e_AGqmayIAlhB0EaGcr8RubJSLIcYuRIjXQB1B6Dke5d48aCZJDGejjBCC62C1fMiK7Kqa5EU2KV-ui68bO76w92_V3Wk1yO3wrPh-soN0mp6Xl692_Gnfb206mubD6nFUPX8sgjktD5Oo-c8G2NtY321tOe2dze3WWttJEMTc4QoHkoooDIVSXhhg36ciEIzhSESKUYmI1ISzUHMP-8hHmgoFQ8F8JTnVjDTA8p_3WBotzX4n7h71zKzY6ff6ByfB712IIOLkB_fLY08 |
ClassificationCodes | X43 |
ContentType | Journal Article |
Copyright | Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
Copyright_xml | – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
DBID | 2B. 4A8 92I 93N PSX TCJ |
DOI | 10.13577/j.jnd.2022.0117 |
DatabaseName | Wanfang Data Journals - Hong Kong WANFANG Data Centre Wanfang Data Journals 万方数据期刊 - 香港版 China Online Journals (COJ) China Online Journals (COJ) |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
Discipline | Geography |
DocumentTitle_FL | Comparative study on disaster information recognition methods based on social media text |
EndPage | 187 |
ExternalDocumentID | zrzhxb202201017 |
GrantInformation_xml | – fundername: (国家重点研发计划); (国家重点研发计划) funderid: (国家重点研发计划); (国家重点研发计划) |
GroupedDBID | -02 2B. 4A8 5XA 5XB 92H 92I 93N ABDBF ABJNI ACGFS ALMA_UNASSIGNED_HOLDINGS CCEZO CDRFL CW9 PSX TCJ TGT U1G U5K UY8 ~02 |
ID | FETCH-LOGICAL-s1027-7d2ba58ecc8dd4cb29958b8662e8ed65a13af376cf7429191f58d0c869da75f63 |
ISSN | 1004-4574 |
IngestDate | Thu May 29 04:06:10 EDT 2025 |
IsPeerReviewed | false |
IsScholarly | true |
Issue | 1 |
Keywords | 社交媒体;数据挖掘;灾情文本;主题识别;机器学习;精度评价 |
Language | Chinese |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-s1027-7d2ba58ecc8dd4cb29958b8662e8ed65a13af376cf7429191f58d0c869da75f63 |
PageCount | 9 |
ParticipantIDs | wanfang_journals_zrzhxb202201017 |
PublicationCentury | 2000 |
PublicationDate | 2022-02-01 |
PublicationDateYYYYMMDD | 2022-02-01 |
PublicationDate_xml | – month: 02 year: 2022 text: 2022-02-01 day: 01 |
PublicationDecade | 2020 |
PublicationTitle | 自然灾害学报 |
PublicationTitle_FL | Journal of Natural Disasters |
PublicationYear | 2022 |
Publisher | 资源环境与地理信息系统北京市重点实验室,北京100048 首都师范大学资源环境与旅游学院,北京100048 |
Publisher_xml | – name: 资源环境与地理信息系统北京市重点实验室,北京100048 – name: 首都师范大学资源环境与旅游学院,北京100048 |
SSID | ssj0000563332 ssib002263337 ssib051375355 ssib001105440 |
Score | 2.3193128 |
Snippet | X43; 挖掘社交媒体发布的信息,逐渐成为了一种获取所需数据的重要途径,数据挖掘采用的一种重要方法就是机器学习.基于此,本研究以4起自然灾害事件的相关微博文本数据集为实验语料开展实验,比较基于朴素贝叶斯、随机森林和多元逻辑回归算法建立的3种模型的主题识别效果.结果... |
SourceID | wanfang |
SourceType | Aggregation Database |
StartPage | 179 |
Title | 基于社交媒体文本的灾情信息识别方法比较研究 |
URI | https://d.wanfangdata.com.cn/periodical/zrzhxb202201017 |
Volume | 31 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnV1La9wwEBZ5HNpL6ZO-2UN13O3KlmTpVGzH21BoTwnkFvxYN-SwgWQDZW8hfZ16aNMcSqEtBEofkEOh0IWmf2bjzc_ojKzNukmhj4sYxqPxNzOWNbZHMiE30jakDUrn-IWxWedxruqJiJN6LmHo8URyZt7p3r0nZ-f5nQWxMDH5vlK1tN5NGmnvt-tK_ieqwIO44irZf4jsoVJgAA3xhRYiDO1fxZhGguoWDXwacWxVRCOP-kBHlgM0yPg-1Y7hzFDt0khSLanyDBFSP8ReGrpzJBQz3UHApUqYXi3qM8Nh1G_RSGGrJGpWQAdWYaCRCFyqBRIgozkKgzZQhcCahgOEpoGspsUoBngAJwKAM8oKEsAfoVokZqgvDRIwTYwuFiMLJwmsQQAKCVAZjUUUgkAzAHTpBdPJr4hoqrXprBGnz6pvROBhuvlLdYmxTBifSfS0bo40tgxSxxgNpigTFoHAAiMDkui843710MogMESAgUWsIdXeKJghclChgxjBYWAJntQxvjd-0hEeAkeq0HLgEnDC46qYWehfmZOwVoiL8mdGo0nLTp3VwVnOQKz8N49NZliZzRybJ11hPtUvN5Y7uF2u4zRwb8BxTnBYqdlb7S09SFACNyP0Jsm043lYDzHtBzNBa5x5Q57OeXVJtXTdceYrmAvPxXYJdLntPh4vaxGsebaIAKHdPALMrKjr5HHnfiX5mztNTtmntppfDsEzZKK3dJacuN22-72fI7f23_QH_WfDnb1Bf2f_4_PB9xfF9pPi9efhq4fDjb1i89Hgx7tiY_dg9_H-00_F9rfiy8tid-tgb3P4dmv44et5Mt-K5sLZuv03SX0NUnKv7mVOEgsFN0CVZTxNIKsTKlFSOm3VzqSImRvnMHmnuQcZH9MsFyprpkrqLPZELt0LZKqz0mlfJDXFQAjujEnCmzxO3Fin4K884yxOpdTyEqlZ4xftvWdt8UhYLv9Z5Ao5OR4rV8lUd3W9fQ3y6W5y3cbyJy3pl0g |
linkProvider | EBSCOhost |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E7%A4%BE%E4%BA%A4%E5%AA%92%E4%BD%93%E6%96%87%E6%9C%AC%E7%9A%84%E7%81%BE%E6%83%85%E4%BF%A1%E6%81%AF%E8%AF%86%E5%88%AB%E6%96%B9%E6%B3%95%E6%AF%94%E8%BE%83%E7%A0%94%E7%A9%B6&rft.jtitle=%E8%87%AA%E7%84%B6%E7%81%BE%E5%AE%B3%E5%AD%A6%E6%8A%A5&rft.au=%E7%8E%8B%E6%9C%88%E6%98%8E&rft.au=%E8%83%A1%E5%8D%93%E7%8E%AE&rft.au=%E9%99%88%E9%94%A1&rft.date=2022-02-01&rft.pub=%E8%B5%84%E6%BA%90%E7%8E%AF%E5%A2%83%E4%B8%8E%E5%9C%B0%E7%90%86%E4%BF%A1%E6%81%AF%E7%B3%BB%E7%BB%9F%E5%8C%97%E4%BA%AC%E5%B8%82%E9%87%8D%E7%82%B9%E5%AE%9E%E9%AA%8C%E5%AE%A4%2C%E5%8C%97%E4%BA%AC100048&rft.issn=1004-4574&rft.volume=31&rft.issue=1&rft.spage=179&rft.epage=187&rft_id=info:doi/10.13577%2Fj.jnd.2022.0117&rft.externalDocID=zrzhxb202201017 |
thumbnail_s | http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fzrzhxb%2Fzrzhxb.jpg |