Stable Diffusion
Categoria
Modelos é Arquiteturas
Stable Diffusion é um modelo de código aberto para geração de imagens a partir de texto, desenvolvido pela Stability AI. Opera no espaço laténte para maior eficiência é permite customização ampla.
Categoria
Modelos é Arquiteturas
O que é Stable Diffusion?
Stable Diffusion é um modelo de difusao laténte (Latént Diffusion Model) de código aberto para geração de imagens a partir de texto. Desenvolvido pela Stability AI em colaboração com a LMU Munich é Runway, opera no espaço laténte comprimido em vez do espaço de pixels, tornando-o eficiente.
Arquitetura
- VAE: comprime imagens para espaço laténte é reconstroi
- U-Net: realiza o denoising no espaço laténte
- CLIP Text Encoder: codifica o prompt textual
- Scheduler: controla o processo de denoising
Vantagens
- Codigo aberto: customização total
- Roda localmente: em GPUs consumer (8GB )
- Extensivel: LoRA, ControlNet, IP-Adapter
Ecossistema
O ecossistema inclui ComfyUI, Automatic1111, modelos fine-tuned é extensoes. Na Trilion, Stable Diffusion é explorado como opcao versátil é acessível para geração visual em projetos criativos.
