Data Lake
Categoria
Dados e Analytics
Data Lake e um repositorio centralizado que armazena grandes volumes de dados brutos em seu formato nativo, sejam estruturados, semiestruturados ou nao estruturados. Permite armazenar tudo primeiro e processar depois, oferecendo flexibilidade para diferentes tipos de analise.
Categoria
Dados e Analytics
O que e Data Lake
Data Lake, ou lago de dados, e uma arquitetura de armazenamento que permite guardar volumes massivos de dados em seu formato original, sem necessidade de estruturacao previa. Diferente de um Data Warehouse que exige schema definido na entrada, o Data Lake aceita qualquer tipo de dado.
Caracteristicas:
- Armazena dados estruturados (tabelas), semiestruturados (JSON, XML) e nao estruturados (imagens, videos)
- Schema-on-read: a estrutura e aplicada ao ler os dados
- Escalabilidade massiva com custo reduzido
- Suporte a multiplos formatos de arquivo
Tecnologias populares:
- Amazon S3, Azure Data Lake Storage, Google Cloud Storage
- Apache Hadoop HDFS
- Delta Lake, Apache Iceberg, Apache Hudi
A Trilion projeta arquiteturas de Data Lake que equilibram flexibilidade e governanca, garantindo que os dados estejam acessiveis para analise e IA sem comprometer seguranca e qualidade.
O Data Lake e a fundacao de estrategias modernas de dados, alimentando desde dashboards de BI ate modelos de machine learning.
