MDLText aplicado na Filtragem Automática de SPIM e SMS Spam
A filtragem automática de spam em mensagens instantâneas e SMS é um problema desafiador, pois as mensagens são frequentemente curtas e repletas de ruídos, tais como gírias, expressões idiomáticas, símbolos, emoticons e abreviações, o que dificulta a extração de conhecimento e predição. Para enfrenta...
Saved in:
Published in | iSys - Brazilian Journal of Information Systems Vol. 11; no. 1; pp. 103 - 132 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | English |
Published |
21.05.2018
|
Online Access | Get full text |
Cover
Loading…
Summary: | A filtragem automática de spam em mensagens instantâneas e SMS é um problema desafiador, pois as mensagens são frequentemente curtas e repletas de ruídos, tais como gírias, expressões idiomáticas, símbolos, emoticons e abreviações, o que dificulta a extração de conhecimento e predição. Para enfrentar esse problema, neste artigo é avaliado um método de classificação de texto baseado no princípio da descrição mais simples, que é eficiente, rápido, escalável, multiclasse e possui aprendizado incremental. Experimentos realizados com uma base de dados real e pública, em cenários de aprendizado online e offline, indicam que o método proposto é promissor para a tarefa de detecção de spam em mensagens instantâneas e SMS. |
---|---|
ISSN: | 1984-2902 1984-2902 |
DOI: | 10.5753/isys.2018.359 |