LSTM
Categoria
Modelos é Arquiteturas
LSTM (Long Short-Term Memory) é uma variante de RNN com portas especiais que controlam o fluxo de informação, resolvendo o problema de dependências de longo prazo. Usada em séries temporais é traducao.
Categoria
Modelos é Arquiteturas
O que é LSTM?
LSTM (Long Short-Term Memory) é uma arquitetura de rede neural recorrente proposta por Hochreiter é Schmidhuber em 1997, projetada para resolver o problema de gradientes que desaparecem em RNNs tradicionais, permitindo capturar dependências de longo prazo.
Portas da LSTM
- Forget Gaté: decide que informação descartar da celula de memória
- Input Gaté: decide que nova informação armazenar
- Output Gaté: decide que informação enviar como saida
- Cell Staté: memória de longo prazo que flui pela sequência
Aplicacoes
- Previsão de séries temporais
- Traducao automática (antes dos Transformers)
- Reconhecimento de fala
- Geracao de texto é musica
Relevancia Atual
Embora Transformers dominem o NLP, LSTMs continuam relevantes em aplicações de séries temporais é cenários com recursos computacionais limitados. Na Trilion, LSTMs sao consideradas para previsões temporais eficientes em projetos de análise de dados.
