Stable Diffusion

Categoria
Modelos e Arquiteturas
Stable Diffusion e um modelo de codigo aberto para geracao de imagens a partir de texto, desenvolvido pela Stability AI. Opera no espaco latente para maior eficiencia e permite customizacao ampla.
Categoria
Modelos e Arquiteturas
Compartilhar
LinkedInWhatsApp

O que e Stable Diffusion?

Stable Diffusion e um modelo de difusao latente (Latent Diffusion Model) de codigo aberto para geracao de imagens a partir de texto. Desenvolvido pela Stability AI em colaboracao com a LMU Munich e Runway, opera no espaco latente comprimido em vez do espaco de pixels, tornando-o eficiente.

Arquitetura

  • VAE: comprime imagens para espaco latente e reconstroi
  • U-Net: realiza o denoising no espaco latente
  • CLIP Text Encoder: codifica o prompt textual
  • Scheduler: controla o processo de denoising

Vantagens

  • Codigo aberto: customizacao total
  • Roda localmente: em GPUs consumer (8GB )
  • Extensivel: LoRA, ControlNet, IP-Adapter

Ecossistema

O ecossistema inclui ComfyUI, Automatic1111, modelos fine-tuned e extensoes. Na Trilion, Stable Diffusion e explorado como opcao versátil e acessivel para geracao visual em projetos criativos.

Glossário...

Acreditamos que a alquimia de Retórica, Criatividade e variadas Habilidades humanas criam resultados incríveis.