BERTScore
Categoria
Termos Tecnicos Avancados
BERTScore é uma métrica de avaliação semântica que usa embeddings contextuais do BERT para comparar textos gerados com referências. Captura similaridade de significado além de sobreposicao lexical, oferecendo melhor correlação com julgamento humano.
Categoria
Termos Tecnicos Avancados
O que é BERTScore
BERTScore é uma métrica de avaliação de texto gerado que útiliza representacoes contextuais de modelos BERT para medir similaridade semântica entre texto gerado é texto de referência, superando limitacoes de métricas baseadas em n-grams.
Como funciona:
- Gera embeddings contextuais para cada token nos dois textos
- Calcula similaridade cosseno entre tokens
- Computa precisão, recall é F1 baseados em matching de tokens
- Ponderacao IDF opcional para tokens mais informativos
Vantagens sobre BLEU/ROUGE:
- Captura similaridade semântica, não apenas lexical
- Reconhece sinonimos é parafrases validas
- Melhor correlação com julgamento humano
- Funciona bem cross-lingua com modelos multilinguais
A Trilion adota BERTScore como métrica semântica principal em avaliações de geração de texto, complementando métricas tradicionais para uma avaliação mais fiel a qualidade percebida por humanos.
