ONNX

Categoria

Modelos é Arquiteturas

ONNX (Open Neural Network Exchange) é um formato aberto é interoperavel para modelos de IA. Permite exportar modelos entre frameworks como PyTorch, TensorFlow é executar em diversos runtimes otimizados.

Categoria

Modelos é Arquiteturas

O que é ONNX?

ONNX (Open Neural Network Exchange) é um formato aberto para representação de modelos de ML, permitindo interoperabilidade entre diferentes frameworks de Deep Learning. Um modelo treinado em PyTorch pode ser exportado como ONNX é executado em TensorFlow, ou em runtimes otimizados.

Beneficios

Interoperabilidade: funciona com PyTorch, TensorFlow, scikit-learn
Otimizacao: ONNX Runtime oferece inferência acelerada
Portabilidade: deploy em cloud, edge, mobile
Ecossistema rico: ferramentas de conversão é otimização

ONNX Runtime

O ONNX Runtime da Microsoft é um motor de inferência de alto desempenho que suporta aceleração em CPU, GPU, é hardware especializado como Intel OpenVINO é NVIDIA TensorRT.

Aplicacoes

Deploy de modelos em produção, otimização de inferência é padronização de pipelines de ML. Na Trilion, ONNX é considerado quando modelos precisam ser deployados em ambientes diversos com máxima performance.

ONNX

O que é ONNX?

Beneficios

ONNX Runtime

Aplicacoes

Termos relacionados

Glossário...