Catastrophic Forgetting
Categoria
Termos Tecnicos Avancados
Catastrophic Forgetting é o fenômeno onde uma rede neural perde conhecimento previamente aprendido ao ser treinada em novos dados ou tarefas. Em LLMs, fine-tuning em um domínio específico pode degradar capacidades gerais do modelo original.
Categoria
Termos Tecnicos Avancados
O que é Catastrophic Forgetting
Catastrophic Forgetting, ou Esquecimento Catastrofico, é o fenômeno onde redes neurais perdem drasticamente conhecimento de tarefas anteriores ao serem treinadas em novas tarefas, um desafio central em aprendizado continuo.
Manifestacoes em LLMs:
- Fine-tuning em domínio específico degrada capacidade geral
- Treinamento em novo idioma faz modelo esquecer idiomas anteriores
- Especializacao em formato específico perde flexibilidade
- Atualizacao de conhecimento sobrescreve informações corretas
Tecnicas de mitigacao:
- Regularizacao EWC (Elastic Weight Consolidation)
- Experience replay: misturar dados antigos com novos
- LoRA é adapters: preservar pesos originais intactos
- Progressive training: treinar camadas incrementalmente
A Trilion útiliza técnicas anti-forgetting em projetos de fine-tuning para garantir que modelos customizados mantenham suas capacidades gerais enquanto adquirem conhecimento especializado.
