Data Augmentation

Categoria
Fundamentos de IA
Data Augmentation e a tecnica de aumentar artificialmente o volume de dados de treinamento aplicando transformacoes como rotacao, espelhamento, corte e alteracao de brilho em imagens, ou sinonimos e parafrase em texto.
Categoria
Fundamentos de IA
Compartilhar
LinkedInWhatsApp

O que e Data Augmentation?

Data Augmentation (Aumento de Dados) e uma tecnica para expandir artificialmente o conjunto de treinamento aplicando transformacoes nos dados existentes. Cria versoes modificadas dos dados originais sem alterar seu significado, aumentando a diversidade e reduzindo overfitting.

Tecnicas para Imagens

  • Rotacao e espelhamento
  • Recorte e redimensionamento
  • Ajuste de cor, brilho e contraste
  • Adicao de ruido
  • CutOut, MixUp, CutMix

Tecnicas para Texto

  • Substituicao por sinonimos
  • Back-translation
  • Insercao e delecao aleatoria
  • Parafrase com LLMs

Impacto

Data Augmentation pode melhorar significativamente o desempenho de modelos, especialmente quando o volume de dados e limitado. E uma tecnica fundamental em visao computacional e cada vez mais usada em NLP.

Na Trilion, data augmentation e aplicada estrategicamente para maximizar o desempenho de modelos mesmo com conjuntos de dados pequenos.

Glossário...

Acreditamos que a alquimia de Retórica, Criatividade e variadas Habilidades humanas criam resultados incríveis.