Catastrophic Forgetting

Categoria
Termos Tecnicos Avancados
Catastrophic Forgetting e o fenomeno onde uma rede neural perde conhecimento previamente aprendido ao ser treinada em novos dados ou tarefas. Em LLMs, fine-tuning em um dominio especifico pode degradar capacidades gerais do modelo original.
Categoria
Termos Tecnicos Avancados
Compartilhar
LinkedInWhatsApp

O que e Catastrophic Forgetting

Catastrophic Forgetting, ou Esquecimento Catastrofico, e o fenomeno onde redes neurais perdem drasticamente conhecimento de tarefas anteriores ao serem treinadas em novas tarefas, um desafio central em aprendizado continuo.

Manifestacoes em LLMs:

  • Fine-tuning em dominio especifico degrada capacidade geral
  • Treinamento em novo idioma faz modelo esquecer idiomas anteriores
  • Especializacao em formato especifico perde flexibilidade
  • Atualizacao de conhecimento sobrescreve informacoes corretas

Tecnicas de mitigacao:

  • Regularizacao EWC (Elastic Weight Consolidation)
  • Experience replay: misturar dados antigos com novos
  • LoRA e adapters: preservar pesos originais intactos
  • Progressive training: treinar camadas incrementalmente

A Trilion utiliza tecnicas anti-forgetting em projetos de fine-tuning para garantir que modelos customizados mantenham suas capacidades gerais enquanto adquirem conhecimento especializado.

Glossário...

Acreditamos que a alquimia de Retórica, Criatividade e variadas Habilidades humanas criam resultados incríveis.