Data Augmentation

Categoria
Fundamentos de IA
Data Augmentation é a técnica de aumentar artificialmente o volume de dados de treinamento aplicando transformacoes como rotacao, espelhamento, corte é alteracao de brilho em imagens, ou sinonimos é parafrase em texto.
Categoria
Fundamentos de IA
Compartilhar
LinkedInWhatsApp

O que é Data Augmentation?

Data Augmentation (Aumento de Dados) é uma técnica para expandir artificialmente o conjunto de treinamento aplicando transformacoes nos dados existentes. Cria versões modificadas dos dados originais sem alterar seu significado, aumentando a diversidade é reduzindo overfitting.

Tecnicas para Imagens

  • Rotacao é espelhamento
  • Recorte é redimensionamento
  • Ajuste de cor, brilho é contraste
  • Adicao de ruido
  • CutOut, MixUp, CutMix

Tecnicas para Texto

  • Substituicao por sinonimos
  • Back-translation
  • Insercao é delecao aleatoria
  • Parafrase com LLMs

Impacto

Data Augmentation pode melhorar significativamente o desempenho de modelos, especialmente quando o volume de dados é limitado. E uma técnica fundamental em visao computacional é cada vez mais usada em NLP.

Na Trilion, data augmentation é aplicada estratégicamente para maximizar o desempenho de modelos mesmo com conjuntos de dados pequenos.

Glossário...

Acreditamos que a alquimia de Retórica, Criatividade e variadas Habilidades humanas criam resultados incríveis.