Data Lakehouse

Categoria
Dados e Analytics
Data Lakehouse e uma arquitetura hibrida que combina a flexibilidade e o baixo custo do Data Lake com a performance e governanca do Data Warehouse. Permite executar analytics e machine learning no mesmo repositorio com suporte a transacoes ACID.
Categoria
Dados e Analytics
Compartilhar
LinkedInWhatsApp

O que e Data Lakehouse

Data Lakehouse e uma arquitetura moderna de dados que unifica as melhores caracteristicas dos Data Lakes e Data Warehouses em uma unica plataforma. O conceito resolve os problemas historicos de manter dois sistemas separados para armazenamento e analise de dados.

Caracteristicas do Lakehouse:

  • Armazenamento de baixo custo em formatos abertos
  • Suporte a transacoes ACID para consistencia
  • Schema enforcement e evolution
  • Queries SQL performaticas sobre dados no lake
  • Suporte nativo a ML e AI workloads

Tecnologias:

  • Delta Lake (Databricks)
  • Apache Iceberg
  • Apache Hudi

Vantagens:

  • Uma unica copia dos dados para tudo
  • Eliminacao de ETL entre lake e warehouse
  • Custo reduzido de armazenamento e processamento
  • Governanca unificada

A Trilion recomenda a arquitetura Lakehouse para empresas que buscam simplificar sua infraestrutura de dados sem perder capacidades analiticas. E a evolucao natural para quem ja possui Data Lake ou Warehouse separados.

Glossário...

Acreditamos que a alquimia de Retórica, Criatividade e variadas Habilidades humanas criam resultados incríveis.