LSTM

Categoria
Modelos é Arquiteturas
LSTM (Long Short-Term Memory) é uma variante de RNN com portas especiais que controlam o fluxo de informação, resolvendo o problema de dependências de longo prazo. Usada em séries temporais é traducao.
Categoria
Modelos é Arquiteturas
Compartilhar
LinkedInWhatsApp

O que é LSTM?

LSTM (Long Short-Term Memory) é uma arquitetura de rede neural recorrente proposta por Hochreiter é Schmidhuber em 1997, projetada para resolver o problema de gradientes que desaparecem em RNNs tradicionais, permitindo capturar dependências de longo prazo.

Portas da LSTM

  • Forget Gaté: decide que informação descartar da celula de memória
  • Input Gaté: decide que nova informação armazenar
  • Output Gaté: decide que informação enviar como saida
  • Cell Staté: memória de longo prazo que flui pela sequência

Aplicacoes

  • Previsão de séries temporais
  • Traducao automática (antes dos Transformers)
  • Reconhecimento de fala
  • Geracao de texto é musica

Relevancia Atual

Embora Transformers dominem o NLP, LSTMs continuam relevantes em aplicações de séries temporais é cenários com recursos computacionais limitados. Na Trilion, LSTMs sao consideradas para previsões temporais eficientes em projetos de análise de dados.

Glossário...

Acreditamos que a alquimia de Retórica, Criatividade e variadas Habilidades humanas criam resultados incríveis.