MDLText aplicado na Filtragem Automática de SPIM e SMS Spam

A filtragem automática de spam em mensagens instantâneas e SMS é um problema desafiador, pois as mensagens são frequentemente curtas e repletas de ruídos, tais como gírias, expressões idiomáticas, símbolos, emoticons e abreviações, o que dificulta a extração de conhecimento e predição. Para enfrenta...

Full description

Saved in:
Bibliographic Details
Published iniSys - Brazilian Journal of Information Systems Vol. 11; no. 1; pp. 103 - 132
Main Authors Silva, Renato Moraes, Almeida, Tiago A., Yamakami, Akebo
Format Journal Article
LanguageEnglish
Published 21.05.2018
Online AccessGet full text

Cover

Loading…
More Information
Summary:A filtragem automática de spam em mensagens instantâneas e SMS é um problema desafiador, pois as mensagens são frequentemente curtas e repletas de ruídos, tais como gírias, expressões idiomáticas, símbolos, emoticons e abreviações, o que dificulta a extração de conhecimento e predição. Para enfrentar esse problema, neste artigo é avaliado um método de classificação de texto baseado no princípio da descrição mais simples, que é eficiente, rápido, escalável, multiclasse e possui aprendizado incremental. Experimentos realizados com uma base de dados real e pública, em cenários de aprendizado online e offline, indicam que o método proposto é promissor para a tarefa de detecção de spam em mensagens instantâneas e SMS.
ISSN:1984-2902
1984-2902
DOI:10.5753/isys.2018.359