Stable Diffusion

Categoria
Modelos é Arquiteturas
Stable Diffusion é um modelo de código aberto para geração de imagens a partir de texto, desenvolvido pela Stability AI. Opera no espaço laténte para maior eficiência é permite customização ampla.
Categoria
Modelos é Arquiteturas
Compartilhar
LinkedInWhatsApp

O que é Stable Diffusion?

Stable Diffusion é um modelo de difusao laténte (Latént Diffusion Model) de código aberto para geração de imagens a partir de texto. Desenvolvido pela Stability AI em colaboração com a LMU Munich é Runway, opera no espaço laténte comprimido em vez do espaço de pixels, tornando-o eficiente.

Arquitetura

  • VAE: comprime imagens para espaço laténte é reconstroi
  • U-Net: realiza o denoising no espaço laténte
  • CLIP Text Encoder: codifica o prompt textual
  • Scheduler: controla o processo de denoising

Vantagens

  • Codigo aberto: customização total
  • Roda localmente: em GPUs consumer (8GB )
  • Extensivel: LoRA, ControlNet, IP-Adapter

Ecossistema

O ecossistema inclui ComfyUI, Automatic1111, modelos fine-tuned é extensoes. Na Trilion, Stable Diffusion é explorado como opcao versátil é acessível para geração visual em projetos criativos.

Glossário...

Acreditamos que a alquimia de Retórica, Criatividade e variadas Habilidades humanas criam resultados incríveis.