Rastrear a origem e o fluxo de dados é uma tarefa árdua. Conforme sua organização acumula sistemas de informação, ela também acumula pontos de entrada de dados e regras de transformação para dados em constante movimento. Adicionalmente, as ferramentas de integração de dados, as ferramentas de extração/transformação/carregamento (ETL), os códigos de procedimento e até mesmo relatórios de Business Intelligence (BI) e APIs agregam e transformam dados de forma constante. Como resultado, é difícil compilar manualmente e entender essa complicada rede de dados formada entre os sistemas em sua organização e apresentá-la em um fluxo visual simples. A linhagem de dados automatizada pode oferecer visibilidade e contexto atuais dos dados organizacionais para equipes de TI e de governança de dados e usuários de negócio para que eles trabalhem de forma mais eficiente, tomem decisões mais informadas e aproveitem e protejam melhor os dados que possuem.
A linhagem de dados não só permite que você entenda a origem dos dados, como eles se transformaram e como eles se movimentam em sua organização, mas também pode reunir atributos técnicos e comerciais e governança, destacar dados confidenciais e outras classificações de dados, fornecer visibilidade de qualidade de dados além de ajudar os usuários a conduzirem rapidamente análises de causa raiz para problemas de qualidade de dados etc. Na ausência de recursos de análises de impacto automatizados, ou em conjunto com esses recursos, a linhagem de dados também pode ser muito útil para estabelecer o escopo e avaliar o impacto de possíveis esforços de migração de plataformas de dados, inteligência de dados e gerenciamento de dados.
A linhagem de dados inclui as linhagens técnica e de negócio.
A linhagem de negócio se concentra na visão geral da fonte de dados para ajudar as equipes de governança de dados e os usuários de negócio a entender o fluxo de dados entre diferentes fontes de dados em um cenário de dados da organização.
A linhagem técnica se concentra no fluxo de dados da organização nos níveis da tabela e coluna, nas regras e camadas de transformação subjacentes, em arquivos/tabelas temporários e outras informações para os usuários técnicos entenderem a jornada de dados de uma organização.
As visualizações de linhagens técnica e de negócio são essenciais para as organizações entenderem o valor de seus dados e avaliar facilmente o impacto das mudanças. A capacidade de detalhar da linhagem de negócio para a linhagem técnica (ou vice-versa) fornece maior flexibilidade para analistas de dados obterem rapidamente a perspectiva correta do fluxo de dados.Nem todas as linhagens de dados são entregues da mesma forma. A referida linhagem pode reunir a linhagem com base no elemento ou em nomes de atributo e composição. Uma linhagem de dados mais detalhada se baseia no código no nível do elemento e é mais confiável.
A linhagem de dados está evoluindo rapidamente para se tornar mais inteligente, usando IA para capturar padrões em código difícil de analisar.