Data Augmentation
Categoria
Fundamentos de IA
Data Augmentation e a tecnica de aumentar artificialmente o volume de dados de treinamento aplicando transformacoes como rotacao, espelhamento, corte e alteracao de brilho em imagens, ou sinonimos e parafrase em texto.
Categoria
Fundamentos de IA
O que e Data Augmentation?
Data Augmentation (Aumento de Dados) e uma tecnica para expandir artificialmente o conjunto de treinamento aplicando transformacoes nos dados existentes. Cria versoes modificadas dos dados originais sem alterar seu significado, aumentando a diversidade e reduzindo overfitting.
Tecnicas para Imagens
- Rotacao e espelhamento
- Recorte e redimensionamento
- Ajuste de cor, brilho e contraste
- Adicao de ruido
- CutOut, MixUp, CutMix
Tecnicas para Texto
- Substituicao por sinonimos
- Back-translation
- Insercao e delecao aleatoria
- Parafrase com LLMs
Impacto
Data Augmentation pode melhorar significativamente o desempenho de modelos, especialmente quando o volume de dados e limitado. E uma tecnica fundamental em visao computacional e cada vez mais usada em NLP.
Na Trilion, data augmentation e aplicada estrategicamente para maximizar o desempenho de modelos mesmo com conjuntos de dados pequenos.
