EDM:高效的微博事件检测算法

TP391; 微博数据具有实时动态特性,人们通过分析微博数据可以检测现实生活中的事件.同时,微博数据的海量、短文本和丰富的社交关系等特性也为事件检测带来了新的挑战.综合考虑了微博数据的文本特征(转帖、评论、内嵌链接、用户标签hashtag、命名实体等)、语义特征、时序特性和社交关系特性,提出了一种有效的基于微博数据的事件检测算法(event detection in microblogs,EDM).还提出了一种通过提取事件关键要素,即关键词、命名实体、发帖时间和用户情感倾向性,构成事件的方法.与基于LDA(latent Dirichlet alloca-tion)模型的事件检测算法进行实验对比...

Full description

Saved in:
Bibliographic Details
Published in计算机科学与探索 no. 12; pp. 1076 - 1086
Main Authors 童薇, 陈威, 孟小峰
Format Journal Article
LanguageChinese
Published 中国人民大学 信息学院,北京 100872 2012
Subjects
Online AccessGet full text
ISSN1673-9418
DOI10.3778/j.issn.1673-9418.2012.12.002

Cover

More Information
Summary:TP391; 微博数据具有实时动态特性,人们通过分析微博数据可以检测现实生活中的事件.同时,微博数据的海量、短文本和丰富的社交关系等特性也为事件检测带来了新的挑战.综合考虑了微博数据的文本特征(转帖、评论、内嵌链接、用户标签hashtag、命名实体等)、语义特征、时序特性和社交关系特性,提出了一种有效的基于微博数据的事件检测算法(event detection in microblogs,EDM).还提出了一种通过提取事件关键要素,即关键词、命名实体、发帖时间和用户情感倾向性,构成事件的方法.与基于LDA(latent Dirichlet alloca-tion)模型的事件检测算法进行实验对比,结果表明,EDM算法能够取得更好的事件检测效果,并且能够提供更直观可读的事件.
ISSN:1673-9418
DOI:10.3778/j.issn.1673-9418.2012.12.002