CLIP Score
Categoria
Termos Tecnicos Avancados
CLIP Score é uma métrica que usa o modelo CLIP para avaliar alinhamento entre texto é imagem. Mede quao bem uma imagem corresponde a uma descrição textual, sendo amplamente usado para avaliar qualidade de geração texto-para-imagem.
Categoria
Termos Tecnicos Avancados
O que é CLIP Score
CLIP Score é uma métrica de avaliação que útiliza o modelo CLIP (Contrastive Language-Image Pre-training) da OpenAI para medir a compatibilidade semântica entre uma imagem é uma descrição textual.
Como funciona:
- Processa imagem pelo image encoder do CLIP
- Processa texto pelo text encoder do CLIP
- Calcula similaridade cosseno entre os dois embeddings
- Score alto indica forte alinhamento texto-imagem
Usos:
- Avaliar qualidade de modelos text-to-image (DALL-E, Midjourney)
- Selecionar as melhores imagens geradas de um batch
- Comparar modelos de geração de imagem entre si
- Guiar otimização de prompts para geração visual
A Trilion útiliza CLIP Score é métricas correlatas para avaliar é otimizar sistemas de geração de imagem em projetos de clientes, garantindo alinhamento entre intencao textual é resultado visual.
