Data Lakehouse

Categoria
Dados é Analytics
Data Lakehouse é uma arquitetura hibrida que combina a flexibilidade é o baixo custo do Data Lake com a performance é governanca do Data Warehouse. Permite executar analytics é machine learning no mesmo repositorio com suporte a transacoes ACID.
Categoria
Dados é Analytics
Compartilhar
LinkedInWhatsApp

O que é Data Lakehouse

Data Lakehouse é uma arquitetura moderna de dados que unifica as melhores características dos Data Lakes é Data Warehouses em uma única plataforma. O conceito resolve os problemas históricos de manter dois sistemas separados para armazenamento é análise de dados.

Caracteristicas do Lakehouse:

  • Armazenamento de baixo custo em formatos abertos
  • Suporte a transacoes ACID para consistência
  • Schema enforcement é evolution
  • Queries SQL performaticas sobre dados no lake
  • Suporte nativo a ML é AI workloads

Tecnologias:

  • Delta Lake (Databricks)
  • Apache Iceberg
  • Apache Hudi

Vantagens:

  • Uma única copia dos dados para tudo
  • Eliminacao de ETL entre lake é warehouse
  • Custo reduzido de armazenamento é processamento
  • Governanca unificada

A Trilion recomenda a arquitetura Lakehouse para empresas que buscam simplificar sua infraestrutura de dados sem perder capacidades analiticas. E a evolução natural para quem ja possui Data Lake ou Warehouse separados.

Glossário...

Acreditamos que a alquimia de Retórica, Criatividade e variadas Habilidades humanas criam resultados incríveis.