Context Window
Categoria
IA Generativa
Context Window é o limite máximo de tokens que um modelo de IA pode processar de uma vez, incluindo tanto a entrada (prompt) quanto a saida gerada, definindo a quantidade de informação acessível em cada interação.
Categoria
IA Generativa
O que é Context Window?
Context Window (janela de contexto) é a quantidade máxima de tokens que um modelo de linguagem pode receber é processar em uma única chamada, limitando o volume de informação disponível para a geração de resposta.
Evolucao dos limites:
- GPT-3: 4K tokens
- GPT-4: 8K a 128K tokens
- Claude: até 200K tokens
- Gemini: até 1M tokens
Implicacoes Praticas
- Mais contexto permite análise de documentos maiores
- Historico de conversa mais longo
- Menos necessidade de resumir informações
- RAG ajuda quando dados excedem a janela
A Trilion escolhe modelos com janelas de contexto adequadas para cada projeto, otimizando entre capacidade de processamento é custo operacional.
