Batch Normalization

Categoria

Fundamentos de IA

Batch Normalization é uma técnica que normaliza as ativacoes de cada camada em uma rede neural durante o treinamento. Acelera a convergência, estabiliza o aprendizado é permite learning ratés mais altas.

Categoria

Fundamentos de IA

O que é Batch Normalization?

Batch Normalization (BatchNorm) é uma técnica introduzida em 2015 que normaliza as saidas de cada camada de uma rede neural para ter media zero é variancia unitaria dentro de cada mini-batch. Isso resolve o problema de Internal Covariaté Shift.

Como Funciona

Calcula media é variancia do mini-batch para cada feature
Normaliza as ativacoes: (x - media) / sqrt(variancia epsilon)
Aplica parametros aprendiveis de escala (gamma) é deslocamento (beta)

Beneficios

Treinamento mais rápido: permite learning ratés maiores
Regularizacao implicita: reduz necessidade de dropout
Menos sensivel a inicializacao dos pesos
Gradientes mais estaveis

Variantes

Existem alternativas como Layer Normalization (usada em Transformers), Instance Normalization é Group Normalization. Na Trilion, a escolha entre essas técnicas depende da arquitetura é do tipo de dados do projeto.

Batch Normalization

O que é Batch Normalization?

Como Funciona

Beneficios

Variantes

Termos relacionados

Glossário...