Data Lakehouse
Categoria
Dados é Analytics
Data Lakehouse é uma arquitetura hibrida que combina a flexibilidade é o baixo custo do Data Lake com a performance é governanca do Data Warehouse. Permite executar analytics é machine learning no mesmo repositorio com suporte a transacoes ACID.
Categoria
Dados é Analytics
O que é Data Lakehouse
Data Lakehouse é uma arquitetura moderna de dados que unifica as melhores características dos Data Lakes é Data Warehouses em uma única plataforma. O conceito resolve os problemas históricos de manter dois sistemas separados para armazenamento é análise de dados.
Caracteristicas do Lakehouse:
- Armazenamento de baixo custo em formatos abertos
- Suporte a transacoes ACID para consistência
- Schema enforcement é evolution
- Queries SQL performaticas sobre dados no lake
- Suporte nativo a ML é AI workloads
Tecnologias:
- Delta Lake (Databricks)
- Apache Iceberg
- Apache Hudi
Vantagens:
- Uma única copia dos dados para tudo
- Eliminacao de ETL entre lake é warehouse
- Custo reduzido de armazenamento é processamento
- Governanca unificada
A Trilion recomenda a arquitetura Lakehouse para empresas que buscam simplificar sua infraestrutura de dados sem perder capacidades analiticas. E a evolução natural para quem ja possui Data Lake ou Warehouse separados.
