Glossário de IA

50 termos sobre Inteligência Artificial, Machine Learning, IA Generativa, Automação e mais — explicados pela equipe da Trilion.

Todos Agentes e Orquestracao Automacao e RPA Dados e Analytics Etica e Governanca Fundamentos de IA IA Generativa Marketing com IA MLOps e Infraestrutura Modelos e Arquiteturas Negocios com IA Termos Tecnicos Avancados

Modelos e Arquiteturas

Attention Mechanism

Mecanismo de Atencao permite que modelos foquem nas partes mais relevantes da entrada ao processar cada elemento. Revolucionou o NLP ao permitir que modelos ponderem a importancia de diferentes tokens.

#attention#atencao#transformer#nlp

Modelos e Arquiteturas

Autoencoder e uma rede neural que aprende a comprimir dados em uma representacao compacta (encoding) e reconstrui-los. Usado para reducao de dimensionalidade, denoising e geracao de dados.

#autoencoder#compressao#espacolatente#geracao

Modelos e Arquiteturas

BERT (Bidirectional Encoder Representations from Transformers) e um modelo de linguagem bidirecional do Google que revolucionou o NLP ao compreender contexto em ambas as direcoes de uma frase.

#bert#bidirecional#encoder#nlp

Modelos e Arquiteturas

BLOOM (BigScience Large Open-science Open-access Multilingual Language Model) e um LLM de codigo aberto com 176B parametros, treinado colaborativamente por mais de 1.000 pesquisadores em 46 idiomas.

#bloom#bigscience#opensource#multilíngue

Modelos e Arquiteturas

Claude e uma familia de modelos de IA da Anthropic, projetada com foco em seguranca, utilidade e honestidade. Destaca-se em raciocinio longo, analise de documentos e seguimento preciso de instrucoes.

#claude#anthropic#ia#llm

Modelos e Arquiteturas

CLIP (Contrastive Language-Image Pre-training) e um modelo multimodal da OpenAI que aprende a relacionar imagens e textos no mesmo espaco de embeddings, permitindo classificacao zero-shot de imagens.

#clip#multimodal#imagemtexto#openai

Modelos e Arquiteturas

CNN (Convolutional Neural Network)

CNN (Rede Neural Convolucional) e uma arquitetura especializada em processar dados com estrutura de grade, como imagens. Usa filtros convolucionais para detectar padroes visuais hierarquicos.

#cnn#convolucional#imagem#visaocomputacional

Modelos e Arquiteturas

Codex e um modelo de IA da OpenAI especializado em geracao de codigo, descendente do GPT-3. E a base do GitHub Copilot e capaz de traduzir linguagem natural em codigo funcional em diversas linguagens.

#codex#openai#codigo#programacao

Modelos e Arquiteturas

DALL-E e um modelo de IA da OpenAI capaz de gerar imagens a partir de descricoes textuais. Combina tecnicas de modelos de linguagem e difusao para criar imagens originais e criativas.

#dalle#geracaodeimagem#openai#textotoimagem

Modelos e Arquiteturas

Diffusion Model

Modelos de Difusao sao uma classe de modelos generativos que aprendem a criar dados (imagens, audio) revertendo um processo gradual de adicao de ruido. Sao a base do Stable Diffusion e DALL-E.

#diffusionmodel#difusao#gerativo#imagem

Modelos e Arquiteturas

Falcon e uma familia de modelos de linguagem de codigo aberto desenvolvida pelo TII (Technology Innovation Institute) de Abu Dhabi. Destaca-se pela qualidade de dados de treinamento e eficiencia.

#falcon#tii#opensource#llm

Modelos e Arquiteturas

Fine-Tuning e o processo de ajustar um modelo pre-treinado com dados especificos de uma tarefa, adaptando-o para um dominio ou funcao particular. E mais rapido e economico que treinar do zero.

#finetuning#ajustefino#especializacao#llm

Modelos e Arquiteturas

Foundation Model

Foundation Model e um modelo de IA de grande escala pre-treinado em dados amplos que serve como base para diversas tarefas. Um unico modelo pode ser adaptado para classificacao, geracao, traducao e mais.

#foundationmodel#modelofundacional#pretreinado#ia

Modelos e Arquiteturas

GAN (Generative Adversarial Network)

GAN e uma arquitetura composta por duas redes neurais — gerador e discriminador — que competem entre si. O gerador cria dados falsos e o discriminador tenta distingui-los dos reais, melhorando ambos.

#gan#adversarial#gerador#discriminador

Modelos e Arquiteturas

Gemini e a familia de modelos multimodais do Google DeepMind, projetada nativamente para processar texto, imagem, audio, video e codigo. Disponivel em versoes Ultra, Pro e Nano.

#gemini#google#multimodal#deepmind

Modelos e Arquiteturas

GGUF (GPT-Generated Unified Format) e um formato de arquivo para modelos de linguagem quantizados, otimizado para inferencia em CPU e GPU. Substitui o antigo GGML e e usado pelo llama.cpp.

#gguf#quantizacao#llamacpp#formato

Modelos e Arquiteturas

GitHub Copilot e um assistente de programacao alimentado por IA que sugere codigo em tempo real dentro do editor. Desenvolvido por GitHub e OpenAI, e a ferramenta de IA para desenvolvedores mais adotada.

#githubcopilot#copilot#programacao#ia

Modelos e Arquiteturas

GloVe (Global Vectors) e um modelo de word embedding da Stanford que aprende representacoes vetoriais combinando estatisticas globais de co-ocorrencia de palavras com objetivos de aprendizado local.

#glove#embedding#coocorrencia#stanford

Modelos e Arquiteturas

GPT (Generative Pre-trained Transformer) e uma familia de modelos de linguagem autoregressivos da OpenAI que geram texto prevendo o proximo token. Revolucionou a geracao de texto e assistentes de IA.

#gpt#openai#llm#gerativo

Modelos e Arquiteturas

GPT-4 e o modelo multimodal mais avancado da OpenAI, capaz de processar texto e imagens. Apresenta raciocinio superior, maior confiabilidade e desempenho de nivel humano em exames profissionais.

#gpt4#openai#multimodal#llm

Modelos e Arquiteturas

Knowledge Distillation

Knowledge Distillation e a tecnica de transferir o conhecimento de um modelo grande (teacher) para um modelo menor (student). Permite criar modelos compactos que mantem boa parte do desempenho original.

#knowledgedistillation#destilacao#compressao#teacher

Modelos e Arquiteturas

Llama e uma familia de modelos de linguagem de codigo aberto da Meta, disponivel em diversos tamanhos. Democratizou o acesso a LLMs de alta qualidade para pesquisa e uso comercial.

#llama#meta#opensource#llm

Modelos e Arquiteturas

LLM (Large Language Model)

LLM (Large Language Model) e um modelo de linguagem com bilhoes de parametros, treinado em vastos corpus de texto. Capaz de compreender e gerar linguagem humana com alta qualidade, incluindo GPT, Claude e Llama.

#llm#modelodelinguagem#ia#gpt

Modelos e Arquiteturas

LoRA (Low-Rank Adaptation)

LoRA e uma tecnica eficiente de fine-tuning que treina apenas matrizes de baixo rank adicionadas as camadas do modelo, reduzindo drasticamente o custo computacional e a memoria necessaria.

#lora#lowrank#finetuning#eficiente

Modelos e Arquiteturas

LSTM (Long Short-Term Memory) e uma variante de RNN com portas especiais que controlam o fluxo de informacao, resolvendo o problema de dependencias de longo prazo. Usada em series temporais e traducao.

#lstm#memoria#recorrente#seriestempo

Modelos e Arquiteturas

Midjourney e um servico de geracao de imagens por IA conhecido pela qualidade artistica excepcional de suas criações. Acessado via Discord, e amplamente usado por designers, artistas e criativos.

#midjourney#geracaodeimagem#arte#design

Modelos e Arquiteturas

Mistral e uma familia de modelos de linguagem da startup francesa Mistral AI, conhecida por oferecer modelos compactos e eficientes que rivalizam com modelos muito maiores em qualidade.

#mistral#mistralai#eficiente#compacto

Modelos e Arquiteturas

Mixtral e um modelo de linguagem da Mistral AI que utiliza a arquitetura Mixture of Experts (MoE). Ativa apenas parte dos parametros por token, oferecendo alta qualidade com eficiencia computacional.

#mixtral#mistralai#moe#especialistas

Modelos e Arquiteturas

Mixture of Experts

Mixture of Experts (MoE) e uma arquitetura que usa multiplos sub-modelos especializados (experts) e um roteador que seleciona quais ativar para cada entrada. Permite escalar modelos com eficiencia.

#moe#mixtureofexperts#especialistas#roteamento

Modelos e Arquiteturas

Multi-Head Attention

Multi-Head Attention executa multiplos mecanismos de self-attention em paralelo com diferentes projecoes, permitindo ao modelo capturar diferentes tipos de relacoes entre tokens simultaneamente.

#multiheadattention#atencao#transformer#cabecas

Serviços de tecnologia ao Mercados de luxo

Cultura de resultados

Glossário...

Acreditamos que a alquimia de Retórica, Criatividade e variadas Habilidades humanas criam resultados incríveis.

Vamos Conversar

Vamos Conversar