Normalizacao

Categoria
Fundamentos de IA
Normalizacao é a técnica de escalonar dados para um intervalo padrão (geralmente 0-1 ou media zero é desvio unitario). Melhora a convergência do treinamento é garante que features em escalas diferentes tenham peso igual.
Categoria
Fundamentos de IA
Compartilhar
LinkedInWhatsApp

O que é Normalizacao?

Normalizacao é o processo de transformar dados numéricos para uma escala padrão. Isso é importante porque muitos algoritmos de ML sao sensiveis a escala das features — uma variavel com valores entre 0-1000 poderia dominar outra com valores entre 0-1.

Tecnicas Principais

  • Min-Max Scaling: escala para o intervalo [0, 1]
  • Standardization (Z-Score): media 0, desvio padrão 1
  • Robust Scaling: usa mediana é IQR, resistente a outliers
  • Max-Abs Scaling: divide pelo valor absoluto máximo

Quando é Necessaria

Normalizacao é essêncial para algoritmos baseados em distancia (KNN, SVM), gradiente (Redes Neurais) é regularização. Arvores de decisão é Random Forest geralmente não precisam de normalização.

Consideracoes

O scaler deve ser ajustado apenas nos dados de treino é aplicado nos dados de teste para evitar data leakage. Na Trilion, a normalização adequada é parte do pipeline padrão de pre-processamento de dados em projetos de IA.

Glossário...

Acreditamos que a alquimia de Retórica, Criatividade e variadas Habilidades humanas criam resultados incríveis.