Catastrophic Forgetting
Categoria
Termos Tecnicos Avancados
Catastrophic Forgetting e o fenomeno onde uma rede neural perde conhecimento previamente aprendido ao ser treinada em novos dados ou tarefas. Em LLMs, fine-tuning em um dominio especifico pode degradar capacidades gerais do modelo original.
Categoria
Termos Tecnicos Avancados
O que e Catastrophic Forgetting
Catastrophic Forgetting, ou Esquecimento Catastrofico, e o fenomeno onde redes neurais perdem drasticamente conhecimento de tarefas anteriores ao serem treinadas em novas tarefas, um desafio central em aprendizado continuo.
Manifestacoes em LLMs:
- Fine-tuning em dominio especifico degrada capacidade geral
- Treinamento em novo idioma faz modelo esquecer idiomas anteriores
- Especializacao em formato especifico perde flexibilidade
- Atualizacao de conhecimento sobrescreve informacoes corretas
Tecnicas de mitigacao:
- Regularizacao EWC (Elastic Weight Consolidation)
- Experience replay: misturar dados antigos com novos
- LoRA e adapters: preservar pesos originais intactos
- Progressive training: treinar camadas incrementalmente
A Trilion utiliza tecnicas anti-forgetting em projetos de fine-tuning para garantir que modelos customizados mantenham suas capacidades gerais enquanto adquirem conhecimento especializado.
