中文社交媒体用户性别预测研究——以新浪微博短文本内容为例
[目的/意义]与互联网的高速发展不同,个人信息安全保护的发展相对滞后,通过预测社交媒体用户的性别,能够更好地针对不同性别用户提供隐私保护.[方法/过程]以新浪微博这一社交媒体中用户发布的短文本为研究对象,从中抽取语言特征和主题特征,为每一个用户构建基于语言特征、主题特征以及两个特征叠加的特征表达向量,利用SVM机器学习算法构建性别预测的分类器.[结果/结论]实验表明,从微博短文本中抽取的语言特征和主题特征能够准确预测用户性别,其效果在主要评价指标中均有大幅提升....
Saved in:
Published in | 知识管理论坛 Vol. 6; no. 4; pp. 213 - 227 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | Chinese |
Published |
中国科学院文献情报中心
30.08.2021
|
Subjects | |
Online Access | Get full text |
ISSN | 2095-5472 2095-5472 |
Cover
Loading…
Abstract | [目的/意义]与互联网的高速发展不同,个人信息安全保护的发展相对滞后,通过预测社交媒体用户的性别,能够更好地针对不同性别用户提供隐私保护.[方法/过程]以新浪微博这一社交媒体中用户发布的短文本为研究对象,从中抽取语言特征和主题特征,为每一个用户构建基于语言特征、主题特征以及两个特征叠加的特征表达向量,利用SVM机器学习算法构建性别预测的分类器.[结果/结论]实验表明,从微博短文本中抽取的语言特征和主题特征能够准确预测用户性别,其效果在主要评价指标中均有大幅提升. |
---|---|
AbstractList | [目的/意义]与互联网的高速发展不同,个人信息安全保护的发展相对滞后,通过预测社交媒体用户的性别,能够更好地针对不同性别用户提供隐私保护.[方法/过程]以新浪微博这一社交媒体中用户发布的短文本为研究对象,从中抽取语言特征和主题特征,为每一个用户构建基于语言特征、主题特征以及两个特征叠加的特征表达向量,利用SVM机器学习算法构建性别预测的分类器.[结果/结论]实验表明,从微博短文本中抽取的语言特征和主题特征能够准确预测用户性别,其效果在主要评价指标中均有大幅提升. |
Author | 李得志 王瑞雪 刘雅琦 |
Author_xml | – sequence: 1 fullname: 刘雅琦 organization: 中南财经政法大学信息与安全工程学院武汉430073 – sequence: 2 fullname: 李得志 organization: 百度网讯科技有限公司北京100085 – sequence: 3 fullname: 王瑞雪 organization: 武汉大学信息管理学院武汉430072 |
BookMark | eNrjYmDJy89LZWLgNDKwNNU1NTE3YkFiczDwFhdnJhmYGhqbm5gbmHIyhDzZsfbZtPbnS_Y92bXk6apJT_ZOfj5lxbOO7c8alj_tWP1yUcuzrd3PF0x5vnLbo4YpQPRk99Jn0zY827rq6b51T3tnPZ8P0v5szpqnba1P1-18smPXk33dPAysaYk5xam8UJqbQdHNNcTZQzc5sbg4Pq-4OCU-KtjdxyfEyMDI0MDABIiMiVEDACoXXbc |
ContentType | Journal Article |
DBID | NSCOK |
DatabaseName | 国家哲学社会科学文献中心 (National Center for Philosophy and Social Sciences Documentation) |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
Discipline | Library & Information Science |
EISSN | 2095-5472 |
EndPage | 227 |
ExternalDocumentID | ZSGLLT2021004004 |
GroupedDBID | -0Y ALMA_UNASSIGNED_HOLDINGS CCEZO CUBFJ GROUPED_DOAJ M~E NSCOK U1G U5S |
ID | FETCH-cass_nssd_ZSGLLT20210040043 |
ISSN | 2095-5472 |
IngestDate | Tue Jan 21 20:56:32 EST 2025 |
IsOpenAccess | true |
IsPeerReviewed | true |
IsScholarly | true |
Issue | 4 |
Keywords | 语言特征 性别预测 短文本 主题特征 |
Language | Chinese |
LinkModel | OpenURL |
MergedId | FETCHMERGED-cass_nssd_ZSGLLT20210040043 |
OpenAccessLink | https://www.ncpssd.cn/Literature/articleinfo?id=ZSGLLT2021004004&type=journalArticle |
ParticipantIDs | cass_nssd_ZSGLLT2021004004 |
PublicationCentury | 2000 |
PublicationDate | 2021-08-30 |
PublicationDateYYYYMMDD | 2021-08-30 |
PublicationDate_xml | – month: 08 year: 2021 text: 2021-08-30 day: 30 |
PublicationDecade | 2020 |
PublicationTitle | 知识管理论坛 |
PublicationYear | 2021 |
Publisher | 中国科学院文献情报中心 |
Publisher_xml | – name: 中国科学院文献情报中心 |
SSID | ssib051374705 ssib017352901 ssj0002013348 ssib038575587 |
Score | 4.4999166 |
Snippet | ... |
SourceID | cass |
SourceType | Aggregation Database |
StartPage | 213 |
Title | 中文社交媒体用户性别预测研究——以新浪微博短文本内容为例 |
URI | https://www.ncpssd.cn/Literature/articleinfo?id=ZSGLLT2021004004&type=journalArticle |
Volume | 6 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnV3Nb9MwFLfWnbggPgWDoSJhbp3yYSf20W5dJjS4UKSJy9SmmRCHIrHustMOfEyauEC1A0ICoSFgwMRlMIboH4OSVPwXPDtum00DAVITOc9-z7_nF9vPSV-M0CUacRgbQ7fCYriDidPkFUbYYsWLPA5Hy2exjka-dj2YvUmuztP5idJyMbqk25qJVg6NK_kfqwIN7KqjZP_BsiOhQIA02BfOYGE4_5WNsSJYMixqWAWYBxgW9irEAojKZAmdVhQLgblnKDXMfV2GEyyY5mIMy9AkHCxCXRgoQmLFsfAwIzpLAlEayY5m1AmOZTD8nwQpJKAKiQW1eKRj2QEASAZUQpkqAIYwMOr7wUOiikXVlAEKNeAVltxqChopox2TRa96KArKA_i65tUgoTrXZDmGwowog4QDgNG7Jqs0Z1ppLk21hkkE4yKB5mHKqsFNS8k65uG4SKjz84biLubKihOi-GTFyx8VO6O-ULAh1cXBRBq7kaG1rwEMI8kYpGhnVjXNCZe-wQwJYdqgIBAg5jv45IO9B65uhZJ8G6OZ-BCana2CQqck-2Yev-DEePkHFw58SvzWjStzcw2taj52l1DJd0nhOQQMwm4ILvlwkzK49vUWrnTsw1PXhxWonSTumDfZro7m1ps4DvGCexPB0q_gqDWOoaN2hVUWeXc5jiZWbp9A0zY-p3y5bAPwdK8s25ntJGokux-zjUeDzX6yt5luPUm-Px303mZrX7LVN-na-5-v7mc764OXvcG7zz9We_BLvr3ONj5lO1tpfzt9_GzwQrNnzz-kDx-k21-T3b2kv34KXayrRnW2omEudJaW2gsH28Y_jSY7dzvxGVT2203KSZM1o9gl1IubQSsKaZu3fRIvUtI-i6Z-L2fqT5nn0JHxjXceTXbvLcfT4OR2WxeMUX4BsZmEEQ |
linkProvider | Directory of Open Access Journals |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E4%B8%AD%E6%96%87%E7%A4%BE%E4%BA%A4%E5%AA%92%E4%BD%93%E7%94%A8%E6%88%B7%E6%80%A7%E5%88%AB%E9%A2%84%E6%B5%8B%E7%A0%94%E7%A9%B6%E2%80%94%E2%80%94%E4%BB%A5%E6%96%B0%E6%B5%AA%E5%BE%AE%E5%8D%9A%E7%9F%AD%E6%96%87%E6%9C%AC%E5%86%85%E5%AE%B9%E4%B8%BA%E4%BE%8B&rft.jtitle=%E7%9F%A5%E8%AF%86%E7%AE%A1%E7%90%86%E8%AE%BA%E5%9D%9B&rft.au=%E5%88%98%E9%9B%85%E7%90%A6&rft.au=%E6%9D%8E%E5%BE%97%E5%BF%97&rft.au=%E7%8E%8B%E7%91%9E%E9%9B%AA&rft.date=2021-08-30&rft.pub=%E4%B8%AD%E5%9B%BD%E7%A7%91%E5%AD%A6%E9%99%A2%E6%96%87%E7%8C%AE%E6%83%85%E6%8A%A5%E4%B8%AD%E5%BF%83&rft.issn=2095-5472&rft.eissn=2095-5472&rft.volume=6&rft.issue=4&rft.spage=213&rft.epage=227&rft.externalDocID=ZSGLLT2021004004 |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2095-5472&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2095-5472&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2095-5472&client=summon |