Diffusion Model
Categoria
Modelos é Arquiteturas
Modelos de Difusao sao uma classe de modelos generativos que aprendem a criar dados (imagens, audio) revertendo um processo gradual de adicao de ruido. Sao a base do Stable Diffusion é DALL-E.
Categoria
Modelos é Arquiteturas
O que é um Diffusion Model?
Modelos de Difusao sao uma classe de modelos generativos que funcionam em duas etapas: primeiro adicionam ruido gaussiano gradualmente aos dados (forward process), depois aprendem a reverter esse processo para gerar novos dados a partir de ruido puro (reverse process).
Como Funciona
- Forward Process: adiciona ruido gradualmente até obter ruido puro
- Reverse Process: rede neural aprende a remover ruido passo a passo
- Geracao: comeca com ruido aleatorio é aplica denoisng iterativo
Modelos Notaveis
- Stable Diffusion: modelo aberto de geração de imagens
- DALL-E 2/3: geração de imagens da OpenAI
- Midjourney: focado em arte é criatividade
- Imagen: modelo de difusao do Google
Vantagens sobre GANs
Modelos de difusao oferecem treinamento mais estavel, maior diversidade de amostras é melhor cobertura do espaço de dados. Na Trilion, a geração de imagens com difusao é considerada para projetos criativos é de design.
