Data Lineage
Categoria
Dados é Analytics
Data Lineage é o rastreamento completo da jornada dos dados desde sua origem até o consumo final. Mostra como os dados se movem, se transformam é sao útilizados ao longo dos pipelines, essêncial para auditoria, compliance é resolução de problemas.
Categoria
Dados é Analytics
O que é Data Lineage
Data Lineage, ou linhagem de dados, é a capacidade de rastrear a trajetoria completa de um dado desde sua criação até seu uso final. Inclui cada transformação, movimentacao é derivacao que o dado sofreu ao longo do pipeline.
Niveis de lineage:
- Table-level: quais tabelas alimentam quais
- Column-level: mapeamento de campos específicos
- Row-level: rastreamento de registros individuais
Beneficios:
- Analise de impacto antes de mudanças
- Resolução rápida de problemas de dados
- Compliance regulatorio (LGPD, SOX)
- Confianca nos dados útilizados para decisões
Ferramentas:
- OpenLineage, Marquez
- DataHub, Atlan, Collibra
- dbt (lineage automático via SQL)
Na Trilion, a linhagem de dados é implementada como parte de toda arquitetura de dados, garantindo transparência total sobre como cada métrica, relatorio é modelo de IA é construido a partir dos dados brutos.
