Ampliação de dados em conjuntos desbalanceados usando GANs e modelos de difusão: um estudo com o fashionMNIST

O objetivo deste trabalho foi avaliar a aplicação de Redes Adversárias Generativas (GANs) e Modelos de Difusão na geração de dados sintéticos para lidar com o desbalanceamento em conjuntos de dados de imagens, com foco específico na classificação de itens de vestuário. Utilizando um subconjunto desb...

Full description

Saved in:
Bibliographic Details
Published inCuadernos de educación y desarrollo Vol. 16; no. 10; p. e6023
Main Authors Sequeira, Lucas Nunes, Filho, Pedro Luiz de Paula, Oliveira, Fabrício Correia de, Eyng, Eduardo, Andrade, Jakeline da Silva
Format Journal Article
LanguageEnglish
Published 17.10.2024
Online AccessGet full text

Cover

Loading…
More Information
Summary:O objetivo deste trabalho foi avaliar a aplicação de Redes Adversárias Generativas (GANs) e Modelos de Difusão na geração de dados sintéticos para lidar com o desbalanceamento em conjuntos de dados de imagens, com foco específico na classificação de itens de vestuário. Utilizando um subconjunto desbalanceado do FashionMNIST, foram testadas e comparadas abordagens baseadas em DCGANs e U-Net com difusão. As imagens geradas pela U-Net com difusão apresentaram menor ruído e maior qualidade geral, conforme demonstrado pelas métricas FID e IS, que superaram as obtidas pela DCGAN. O classificador YOLOv8n, treinado com os dados expandidos, mostrou uma melhora no F1-score da classe sub-representada, evidenciando a eficácia do aumento de dados sintéticos na melhoria do desempenho de classificadores em cenários desbalanceados. Neste contexto, conclui-se que os Modelos de Difusão, especialmente a U-Net com difusão, se mostrou superior na geração de amostras sintéticas de alta qualidade, sendo uma abordagem promissora para aplicações em que o desbalanceamento de classes é um desafio.  
ISSN:1989-4155
1989-4155
DOI:10.55905/cuadv16n10-133