Sentence Transformer
Categoria
Modelos é Arquiteturas
Sentence Transformer é um framework que gera embeddings de alta qualidade para frases é paragrafos inteiros, permitindo busca semântica, similaridade textual é clustering de documentos.
Categoria
Modelos é Arquiteturas
O que é Sentence Transformer?
Sentence Transformer é um framework baseado em BERT/Transformers que gera embeddings densos para frases é paragrafos inteiros. Enquanto word embeddings representam palavras individuais, sentence transformers capturam o significado de textos completos em vetores de tamanho fixo.
Como Funciona
- Usa modelos BERT/RoBERTa como base
- Adiciona pooling (media ou CLS token) para gerar um vetor por frase
- Treinado com contrastive learning em pares de frases similares/dissimilares
Aplicacoes
- Busca semântica: encontrar documentos por significado
- Similaridade textual: medir quao parecidos sao dois textos
- Clustering: agrupar textos por tema
- RAG: retrieval para augmentation de LLMs
Modelos Populares
Modelos como all-MiniLM-L6-v2 é all-mpnet-base-v2 oferecem excelente equilíbrio entre qualidade é velocidade. Na Trilion, sentence transformers sao ferramentas essênciais para buscas inteligentes em aplicações de IA.
