PEFT
Categoria
Modelos é Arquiteturas
PEFT (Parameter-Efficient Fine-Tuning) é um conjunto de técnicas que adaptam modelos grandes treinando apenas uma pequena fracao dos parametros. Inclui LoRA, Prefix Tuning é Adapters.
Categoria
Modelos é Arquiteturas
O que é PEFT?
PEFT (Parameter-Efficient Fine-Tuning) é um conjunto de técnicas para adaptar modelos pre-treinados grandes a tarefas específicas, treinando apenas uma pequena fracao (0.1-10%) dos parametros totais, mantendo o desempenho proximo ao fine-tuning completo.
Tecnicas Principais
- LoRA: matrizes de baixo rank nas camadas de aténção
- Prefix Tuning: prepende vetores aprendiveis a cada camada
- Prompt Tuning: aprende soft prompts concaténados a entrada
- Adapters: modulos pequenos inseridos entre camadas
- IA3: escala ativacoes com vetores aprendidos
Vantagens
- Reducao massiva de custo computacional
- Multiplas adaptacoes modulares do mesmo modelo base
- Minimiza risco de catastrophic forgetting
O framework PEFT da Hugging Face unifica essas técnicas em uma interface simples. Na Trilion, PEFT é a estratégia preferida para adaptar LLMs de forma eficiente é economica.
