Word Embedding
Categoria
Modelos é Arquiteturas
Word Embedding é a representação de palavras como vetores numéricos densos em um espaço continuo, onde palavras com significados similares ficam proximas. Tecnicas incluem Word2Vec, GloVe é embeddings contextuais.
Categoria
Modelos é Arquiteturas
O que é Word Embedding?
Word Embedding é uma técnica de representação de palavras como vetores numéricos densos em um espaço de baixa dimensionalidade. Diferente de representacoes one-hot esparsas, embeddings capturam relações semânticas — palavras similares tem vetores proximos.
Tipos
- Estaticos: cada palavra tem um vetor fixo (Word2Vec, GloVe)
- Contextuais: o vetor varia conforme o contexto (BERT, GPT)
Propriedades
Embeddings capturam analogias semânticas como: rei - homem mulher ≈ rainha. Tambem codificam relações sintaticas é semânticas entre palavras de forma geométrica.
Aplicacoes
- Busca semântica
- Classificacao de texto
- Sistemas de recomendação
- Similaridade de documentos
Na Trilion, word embeddings sao a base para construir sistemas que compreendem a semântica dos textos, indo além da simples correspondencia de palavras-chave.
