EDM:高效的微博事件检测算法
TP391; 微博数据具有实时动态特性,人们通过分析微博数据可以检测现实生活中的事件.同时,微博数据的海量、短文本和丰富的社交关系等特性也为事件检测带来了新的挑战.综合考虑了微博数据的文本特征(转帖、评论、内嵌链接、用户标签hashtag、命名实体等)、语义特征、时序特性和社交关系特性,提出了一种有效的基于微博数据的事件检测算法(event detection in microblogs,EDM).还提出了一种通过提取事件关键要素,即关键词、命名实体、发帖时间和用户情感倾向性,构成事件的方法.与基于LDA(latent Dirichlet alloca-tion)模型的事件检测算法进行实验对比...
Saved in:
Published in | 计算机科学与探索 no. 12; pp. 1076 - 1086 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | Chinese |
Published |
中国人民大学 信息学院,北京 100872
2012
|
Subjects | |
Online Access | Get full text |
ISSN | 1673-9418 |
DOI | 10.3778/j.issn.1673-9418.2012.12.002 |
Cover
Summary: | TP391; 微博数据具有实时动态特性,人们通过分析微博数据可以检测现实生活中的事件.同时,微博数据的海量、短文本和丰富的社交关系等特性也为事件检测带来了新的挑战.综合考虑了微博数据的文本特征(转帖、评论、内嵌链接、用户标签hashtag、命名实体等)、语义特征、时序特性和社交关系特性,提出了一种有效的基于微博数据的事件检测算法(event detection in microblogs,EDM).还提出了一种通过提取事件关键要素,即关键词、命名实体、发帖时间和用户情感倾向性,构成事件的方法.与基于LDA(latent Dirichlet alloca-tion)模型的事件检测算法进行实验对比,结果表明,EDM算法能够取得更好的事件检测效果,并且能够提供更直观可读的事件. |
---|---|
ISSN: | 1673-9418 |
DOI: | 10.3778/j.issn.1673-9418.2012.12.002 |