中文社交媒体用户性别预测研究——以新浪微博短文本内容为例

[目的/意义]与互联网的高速发展不同,个人信息安全保护的发展相对滞后,通过预测社交媒体用户的性别,能够更好地针对不同性别用户提供隐私保护.[方法/过程]以新浪微博这一社交媒体中用户发布的短文本为研究对象,从中抽取语言特征和主题特征,为每一个用户构建基于语言特征、主题特征以及两个特征叠加的特征表达向量,利用SVM机器学习算法构建性别预测的分类器.[结果/结论]实验表明,从微博短文本中抽取的语言特征和主题特征能够准确预测用户性别,其效果在主要评价指标中均有大幅提升....

Full description

Saved in:
Bibliographic Details
Published in知识管理论坛 Vol. 6; no. 4; pp. 213 - 227
Main Authors 刘雅琦, 李得志, 王瑞雪
Format Journal Article
LanguageChinese
Published 中国科学院文献情报中心 30.08.2021
Subjects
Online AccessGet full text
ISSN2095-5472
2095-5472

Cover

Loading…
Abstract [目的/意义]与互联网的高速发展不同,个人信息安全保护的发展相对滞后,通过预测社交媒体用户的性别,能够更好地针对不同性别用户提供隐私保护.[方法/过程]以新浪微博这一社交媒体中用户发布的短文本为研究对象,从中抽取语言特征和主题特征,为每一个用户构建基于语言特征、主题特征以及两个特征叠加的特征表达向量,利用SVM机器学习算法构建性别预测的分类器.[结果/结论]实验表明,从微博短文本中抽取的语言特征和主题特征能够准确预测用户性别,其效果在主要评价指标中均有大幅提升.
AbstractList [目的/意义]与互联网的高速发展不同,个人信息安全保护的发展相对滞后,通过预测社交媒体用户的性别,能够更好地针对不同性别用户提供隐私保护.[方法/过程]以新浪微博这一社交媒体中用户发布的短文本为研究对象,从中抽取语言特征和主题特征,为每一个用户构建基于语言特征、主题特征以及两个特征叠加的特征表达向量,利用SVM机器学习算法构建性别预测的分类器.[结果/结论]实验表明,从微博短文本中抽取的语言特征和主题特征能够准确预测用户性别,其效果在主要评价指标中均有大幅提升.
Author 李得志
王瑞雪
刘雅琦
Author_xml – sequence: 1
  fullname: 刘雅琦
  organization: 中南财经政法大学信息与安全工程学院武汉430073
– sequence: 2
  fullname: 李得志
  organization: 百度网讯科技有限公司北京100085
– sequence: 3
  fullname: 王瑞雪
  organization: 武汉大学信息管理学院武汉430072
BookMark eNrjYmDJy89LZWLgNDKwNNU1NTE3YkFiczDwFhdnJhmYGhqbm5gbmHIyhDzZsfbZtPbnS_Y92bXk6apJT_ZOfj5lxbOO7c8alj_tWP1yUcuzrd3PF0x5vnLbo4YpQPRk99Jn0zY827rq6b51T3tnPZ8P0v5szpqnba1P1-18smPXk33dPAysaYk5xam8UJqbQdHNNcTZQzc5sbg4Pq-4OCU-KtjdxyfEyMDI0MDABIiMiVEDACoXXbc
ContentType Journal Article
DBID NSCOK
DatabaseName 国家哲学社会科学文献中心 (National Center for Philosophy and Social Sciences Documentation)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
Discipline Library & Information Science
EISSN 2095-5472
EndPage 227
ExternalDocumentID ZSGLLT2021004004
GroupedDBID -0Y
ALMA_UNASSIGNED_HOLDINGS
CCEZO
CUBFJ
GROUPED_DOAJ
M~E
NSCOK
U1G
U5S
ID FETCH-cass_nssd_ZSGLLT20210040043
ISSN 2095-5472
IngestDate Tue Jan 21 20:56:32 EST 2025
IsOpenAccess true
IsPeerReviewed true
IsScholarly true
Issue 4
Keywords 语言特征
性别预测
短文本
主题特征
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-cass_nssd_ZSGLLT20210040043
OpenAccessLink https://www.ncpssd.cn/Literature/articleinfo?id=ZSGLLT2021004004&type=journalArticle
ParticipantIDs cass_nssd_ZSGLLT2021004004
PublicationCentury 2000
PublicationDate 2021-08-30
PublicationDateYYYYMMDD 2021-08-30
PublicationDate_xml – month: 08
  year: 2021
  text: 2021-08-30
  day: 30
PublicationDecade 2020
PublicationTitle 知识管理论坛
PublicationYear 2021
Publisher 中国科学院文献情报中心
Publisher_xml – name: 中国科学院文献情报中心
SSID ssib051374705
ssib017352901
ssj0002013348
ssib038575587
Score 4.4999166
Snippet ...
SourceID cass
SourceType Aggregation Database
StartPage 213
Title 中文社交媒体用户性别预测研究——以新浪微博短文本内容为例
URI https://www.ncpssd.cn/Literature/articleinfo?id=ZSGLLT2021004004&type=journalArticle
Volume 6
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnV3Nb9MwFLfWnbggPgWDoSJhbp3yYSf20W5dJjS4UKSJy9SmmRCHIrHustMOfEyauEC1A0ICoSFgwMRlMIboH4OSVPwXPDtum00DAVITOc9-z7_nF9vPSV-M0CUacRgbQ7fCYriDidPkFUbYYsWLPA5Hy2exjka-dj2YvUmuztP5idJyMbqk25qJVg6NK_kfqwIN7KqjZP_BsiOhQIA02BfOYGE4_5WNsSJYMixqWAWYBxgW9irEAojKZAmdVhQLgblnKDXMfV2GEyyY5mIMy9AkHCxCXRgoQmLFsfAwIzpLAlEayY5m1AmOZTD8nwQpJKAKiQW1eKRj2QEASAZUQpkqAIYwMOr7wUOiikXVlAEKNeAVltxqChopox2TRa96KArKA_i65tUgoTrXZDmGwowog4QDgNG7Jqs0Z1ppLk21hkkE4yKB5mHKqsFNS8k65uG4SKjz84biLubKihOi-GTFyx8VO6O-ULAh1cXBRBq7kaG1rwEMI8kYpGhnVjXNCZe-wQwJYdqgIBAg5jv45IO9B65uhZJ8G6OZ-BCana2CQqck-2Yev-DEePkHFw58SvzWjStzcw2taj52l1DJd0nhOQQMwm4ILvlwkzK49vUWrnTsw1PXhxWonSTumDfZro7m1ps4DvGCexPB0q_gqDWOoaN2hVUWeXc5jiZWbp9A0zY-p3y5bAPwdK8s25ntJGokux-zjUeDzX6yt5luPUm-Px303mZrX7LVN-na-5-v7mc764OXvcG7zz9We_BLvr3ONj5lO1tpfzt9_GzwQrNnzz-kDx-k21-T3b2kv34KXayrRnW2omEudJaW2gsH28Y_jSY7dzvxGVT2203KSZM1o9gl1IubQSsKaZu3fRIvUtI-i6Z-L2fqT5nn0JHxjXceTXbvLcfT4OR2WxeMUX4BsZmEEQ
linkProvider Directory of Open Access Journals
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E4%B8%AD%E6%96%87%E7%A4%BE%E4%BA%A4%E5%AA%92%E4%BD%93%E7%94%A8%E6%88%B7%E6%80%A7%E5%88%AB%E9%A2%84%E6%B5%8B%E7%A0%94%E7%A9%B6%E2%80%94%E2%80%94%E4%BB%A5%E6%96%B0%E6%B5%AA%E5%BE%AE%E5%8D%9A%E7%9F%AD%E6%96%87%E6%9C%AC%E5%86%85%E5%AE%B9%E4%B8%BA%E4%BE%8B&rft.jtitle=%E7%9F%A5%E8%AF%86%E7%AE%A1%E7%90%86%E8%AE%BA%E5%9D%9B&rft.au=%E5%88%98%E9%9B%85%E7%90%A6&rft.au=%E6%9D%8E%E5%BE%97%E5%BF%97&rft.au=%E7%8E%8B%E7%91%9E%E9%9B%AA&rft.date=2021-08-30&rft.pub=%E4%B8%AD%E5%9B%BD%E7%A7%91%E5%AD%A6%E9%99%A2%E6%96%87%E7%8C%AE%E6%83%85%E6%8A%A5%E4%B8%AD%E5%BF%83&rft.issn=2095-5472&rft.eissn=2095-5472&rft.volume=6&rft.issue=4&rft.spage=213&rft.epage=227&rft.externalDocID=ZSGLLT2021004004
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2095-5472&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2095-5472&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2095-5472&client=summon