Stable Diffusion
Categoria
Modelos e Arquiteturas
Stable Diffusion e um modelo de codigo aberto para geracao de imagens a partir de texto, desenvolvido pela Stability AI. Opera no espaco latente para maior eficiencia e permite customizacao ampla.
Categoria
Modelos e Arquiteturas
O que e Stable Diffusion?
Stable Diffusion e um modelo de difusao latente (Latent Diffusion Model) de codigo aberto para geracao de imagens a partir de texto. Desenvolvido pela Stability AI em colaboracao com a LMU Munich e Runway, opera no espaco latente comprimido em vez do espaco de pixels, tornando-o eficiente.
Arquitetura
- VAE: comprime imagens para espaco latente e reconstroi
- U-Net: realiza o denoising no espaco latente
- CLIP Text Encoder: codifica o prompt textual
- Scheduler: controla o processo de denoising
Vantagens
- Codigo aberto: customizacao total
- Roda localmente: em GPUs consumer (8GB )
- Extensivel: LoRA, ControlNet, IP-Adapter
Ecossistema
O ecossistema inclui ComfyUI, Automatic1111, modelos fine-tuned e extensoes. Na Trilion, Stable Diffusion e explorado como opcao versátil e acessivel para geracao visual em projetos criativos.
