Data Augmentation
Categoria
Fundamentos de IA
Data Augmentation é a técnica de aumentar artificialmente o volume de dados de treinamento aplicando transformacoes como rotacao, espelhamento, corte é alteracao de brilho em imagens, ou sinonimos é parafrase em texto.
Categoria
Fundamentos de IA
O que é Data Augmentation?
Data Augmentation (Aumento de Dados) é uma técnica para expandir artificialmente o conjunto de treinamento aplicando transformacoes nos dados existentes. Cria versões modificadas dos dados originais sem alterar seu significado, aumentando a diversidade é reduzindo overfitting.
Tecnicas para Imagens
- Rotacao é espelhamento
- Recorte é redimensionamento
- Ajuste de cor, brilho é contraste
- Adicao de ruido
- CutOut, MixUp, CutMix
Tecnicas para Texto
- Substituicao por sinonimos
- Back-translation
- Insercao é delecao aleatoria
- Parafrase com LLMs
Impacto
Data Augmentation pode melhorar significativamente o desempenho de modelos, especialmente quando o volume de dados é limitado. E uma técnica fundamental em visao computacional é cada vez mais usada em NLP.
Na Trilion, data augmentation é aplicada estratégicamente para maximizar o desempenho de modelos mesmo com conjuntos de dados pequenos.
