Stream Processing
Categoria
Dados e Analytics
Stream Processing e o processamento continuo de dados em fluxo, evento por evento, a medida que sao produzidos. Diferente do processamento batch que opera em lotes periodicos, o stream processing oferece resultados em tempo real ou quase real.
Categoria
Dados e Analytics
O que e Stream Processing
Stream Processing e o paradigma de processamento de dados que trata informacoes como um fluxo continuo de eventos, processando cada evento individualmente ou em micro-batches a medida que chegam. E fundamental para aplicacoes que exigem reacao imediata a eventos.
Conceitos-chave:
- Evento: uma unidade de dado com timestamp
- Stream: sequencia ilimitada de eventos
- Window: janela de tempo para agregacoes
- Watermark: mecanismo para lidar com eventos atrasados
Frameworks:
- Apache Kafka Streams
- Apache Flink
- Apache Spark Structured Streaming
- Amazon Kinesis
Batch vs Stream:
- Batch: processa dados acumulados periodicamente
- Stream: processa dados continuamente em tempo real
A Trilion adota stream processing em cenarios onde a latencia de dados e critica, como monitoramento de sistemas, deteccao de fraudes e personalizacao em tempo real.
