Normalizacao
Categoria
Fundamentos de IA
Normalizacao é a técnica de escalonar dados para um intervalo padrão (geralmente 0-1 ou media zero é desvio unitario). Melhora a convergência do treinamento é garante que features em escalas diferentes tenham peso igual.
Categoria
Fundamentos de IA
O que é Normalizacao?
Normalizacao é o processo de transformar dados numéricos para uma escala padrão. Isso é importante porque muitos algoritmos de ML sao sensiveis a escala das features — uma variavel com valores entre 0-1000 poderia dominar outra com valores entre 0-1.
Tecnicas Principais
- Min-Max Scaling: escala para o intervalo [0, 1]
- Standardization (Z-Score): media 0, desvio padrão 1
- Robust Scaling: usa mediana é IQR, resistente a outliers
- Max-Abs Scaling: divide pelo valor absoluto máximo
Quando é Necessaria
Normalizacao é essêncial para algoritmos baseados em distancia (KNN, SVM), gradiente (Redes Neurais) é regularização. Arvores de decisão é Random Forest geralmente não precisam de normalização.
Consideracoes
O scaler deve ser ajustado apenas nos dados de treino é aplicado nos dados de teste para evitar data leakage. Na Trilion, a normalização adequada é parte do pipeline padrão de pre-processamento de dados em projetos de IA.
