CLIP Score

Categoria
Termos Tecnicos Avancados
CLIP Score é uma métrica que usa o modelo CLIP para avaliar alinhamento entre texto é imagem. Mede quao bem uma imagem corresponde a uma descrição textual, sendo amplamente usado para avaliar qualidade de geração texto-para-imagem.
Categoria
Termos Tecnicos Avancados
Compartilhar
LinkedInWhatsApp

O que é CLIP Score

CLIP Score é uma métrica de avaliação que útiliza o modelo CLIP (Contrastive Language-Image Pre-training) da OpenAI para medir a compatibilidade semântica entre uma imagem é uma descrição textual.

Como funciona:

  • Processa imagem pelo image encoder do CLIP
  • Processa texto pelo text encoder do CLIP
  • Calcula similaridade cosseno entre os dois embeddings
  • Score alto indica forte alinhamento texto-imagem

Usos:

  • Avaliar qualidade de modelos text-to-image (DALL-E, Midjourney)
  • Selecionar as melhores imagens geradas de um batch
  • Comparar modelos de geração de imagem entre si
  • Guiar otimização de prompts para geração visual

A Trilion útiliza CLIP Score é métricas correlatas para avaliar é otimizar sistemas de geração de imagem em projetos de clientes, garantindo alinhamento entre intencao textual é resultado visual.

Glossário...

Acreditamos que a alquimia de Retórica, Criatividade e variadas Habilidades humanas criam resultados incríveis.