Para tener la mejor experiencia web, use IE11+, Chrome, Firefox o Safari.

¿Qué es el linaje de datos?

El linaje de datos es el recorrido de los datos de su empresa. Desde su creación en el origen, a través de su movimiento y transformación dentro y fuera de las plataformas de datos y repositorios dentro y fuera de su empresa, hasta su lugar de descanso final en las aplicaciones e inteligencia empresarial en las que se confía para operaciones y toma de decisiones. El linaje de datos integral proporciona un recurso visual completo y detallado de cómo un determinando conjunto de datos fluye dentro y fuera de su empresa, y en esta. Puede ayudarlo a planificar tareas de modernización del área de TI, a resolver problemas de calidad de datos, a abordar el gobierno datos y el cumplimiento de la normativa, y ver y comprender rápidamente los datos disponibles y sus relaciones dentro de su empresa.
¿Qué es el linaje de datos?

¿Por qué es importante el linaje de datos?

Rastrear el origen y el flujo de datos es una ardua tarea. A medida que su empresa acumula sistemas de información, también acumula puntos de entrada de datos y reglas de transformación para los datos que están siempre en movimiento. Asimismo, las herramientas de integración de datos, las herramientas de extraer-transformar-cargar (ETL), el código procedimental e incluso las API y los informes de la inteligencia empresarial (BI) agregan y transforman datos de manera constante. Como consecuencia, es difícil compilar manualmente y comprender la complicada red de datos formada entre los sistemas dentro de su empresa y presentarlos en un flujo visual simple. El linaje de datos automatizado puede proporcionar al área de TI, a los equipos de gobierno de datos y a los usuarios empresariales visibilidad actual y contexto de datos organizativos para trabajar de manera más eficiente, tomar decisiones más sensatas y aprovechar mejor así como proteger los datos a su disposición.

No solo el linaje de datos puede permitirle comprender dónde se originan los datos, cómo se transforman y cómo se mueven a través de su empresa, sino que puede reunir atributos técnicos y empresariales y gobierno, destacar datos confidenciales y otras clasificaciones de datos, entregar visibilidad de calidad de datos, incluso ayudar a los usuarios a llevar adelante rápidamente un análisis de la causa raíz de los problemas de calidad de datos y mucho más. En ausencia de capacidades de análisis de impacto automatizadas o en conjunto con estas capacidades, el linaje de datos también puede ser sumamente útil para alcanzar y evaluar el impacto de la administración de datos potenciales, la inteligencia de datos y los esfuerzos de migración de plataforma de datos.

¿Por qué es importante el linaje de datos?

Beneficios del linaje de datos

Impacto empresarial y visibilidad del panorama de datos

El conocimiento y la comprensión de los datos disponibles y su transformación y flujo a través de múltiples sistemas pueden influir en las decisiones empresariales que tome y respaldarlas. Por ejemplo, comprender el recorrido y el contexto de datos puede ayudarlo a responder preguntas en informes de inteligencia empresarial, incluidas quién posee los datos, guía de gobierno que se debe conocer y qué tan adecuados son los datos para su uso. Con el linaje de datos, puede comprender mejor los datos que están alineados con iniciativas empresariales críticas, dónde y cómo se obtuvieron esos datos, y si se debería confiar en ellos dado su recorrido de linaje ascendente, puntajes de calidad de datos asociados y mucho más. Las empresas también pueden ver más fácilmente las áreas de riesgo donde hay posibilidad de que haya información de privacidad crítica saliendo de la empresa.

Apoyo fundamental del gobierno de datos

La propiedad de datos, la rendición de cuentas y la rastreabilidad están en el centro de un programa de gobierno de datos sensato. Combinado con la automatización, el linaje de datos puede ayudar a los propietarios de datos, a los administradores de datos y a los usuarios del área de TI y empresariales a comprender y validar el uso de datos. El linaje de datos automatizado puede proporcionar un linaje de datos horizontal, desde el origen de datos inicial hasta el destino y todas las transformaciones de los datos en el medio, así como el linaje de datos vertical que proporciona información sobre las asociaciones entre los recursos técnicos y empresariales. El linaje de datos integral, tanto ascendente como descendente, puede revelar cuándo y quién realizó cambios, y reúne al gobierno técnico y empresarial en un recurso visual central para todos los usuarios de datos. El linaje de datos es una herramienta de transparencia esencial para los equipos de gobierno de datos.

Cumplimiento de la normativa y auditabilidad

Se deben implementar términos empresariales y políticas de datos a través de reglas empresariales documentadas dentro de su inteligencia de datos y solución de gobierno. Puede entonces utilizar el linaje de datos para rastrear el cumplimiento de la normativa de aquellas reglas e incorporar controles de auditabilidad y validación cada vez que se transforman los datos. El linaje de datos también ofrece una prueba visual y de ahorro de tiempo a los clientes, empleados y auditores de que se toman con seriedad las reglamentaciones de cumplimiento y las inquietudes de privacidad y de que se implementan programas para apoyar sus esfuerzos.

Colaboración entre equipos

El linaje de datos proporciona una visión común de los datos dentro de su organización y su recorrido a través de las líneas empresariales y entornos analíticos modernos y heredados desiguales. La transparencia de los datos y su uso alimenta el intercambio de datos adicional e identifica claramente traspasos críticos durante los proyectos de integración de datos. Con un punto de referencia central, los equipos a lo largo de la empresa pueden trabajar en conjunto de manera más eficiente para garantizar que los datos dentro de la empresa se aprovechen completamente y se protejan como es debido.

Visibilidad de la calidad de los datos y destino

El análisis de causa raíz es el primer paso en abordar la baja calidad de los datos. Con información sobre la calidad de los datos mediante el linaje de datos, los administradores de datos pueden localizar el flujo de información hacia atrás para determinar si se realizaron correctamente las estandarizaciones y las transformaciones de los datos. El linaje de datos integral le permite corregir un problema de calidad de datos en su origen y permite que los equipos monitoreen de manera proactiva procesos de datos clave para garantizar la integridad de los datos. El linaje de los datos también puede proporcionar a los usuarios empresariales una visión directa de la adecuación de los datos que genere confianza.

Planificación del área de TI y administración de datos

El linaje de datos proporciona los conocimientos y la información necesarios para los arquitectos de datos y los ingenieros de datos para comprender el estado de su actual panorama de datos tal como está y administrar con inteligencia y planificar la modernización del área de TI, las migraciones de almacenes de datos y otras tareas críticas. Le proporciona un alcance de proyecto visual de cuántas aplicaciones, reglas de transformación y unidades empresariales se verán afectadas. La visibilidad de clasificaciones de datos confidenciales y otros datos, los indicadores de la calidad de datos y el contexto de gobierno fácilmente disponible ayudan a los equipos del área de TI a administrar mejor los datos dentro de la empresa.

Preparación de datos

En el caso de los analistas que preparan datos, el linaje de datos proporciona el plan necesario para asegurar que los datos que mejor se adecúen se seleccionen para el análisis previsto. El linaje de datos puede proporcionar a los analistas una visión de los sistemas, entornos, tablas y columnas disponibles. Sirve como un punto de referencia para tanto los nombres físicos como lógicos y puede incluir calidad de datos, indicadores de datos confidenciales y medidas de gobierno para guiar de manera eficiente el trabajo de los analistas y acelerar el tiempo de preparación de los datos.

¿El linaje de datos es parte del gobierno de datos?

SÍ. El gobierno de datos efectivo requiere que los glosarios empresariales, los diccionarios de datos y las políticas de privacidad de datos se alojen en un solo lugar central. Sin embargo, como el volumen de datos crece en una empresa, esos objetos terminan en diferentes formatos en distintos lugares, expresados de diferentes formas. El linaje de datos ayuda a la empresa a rastrearlos, monitorearlos y actualizarlos fácilmente con el paso del tiempo. El linaje de datos ofrece ventajas en prácticas de gobierno, como uniformidad de terminología, corrección de la calidad de datos, auditorías de procesos de datos y análisis de causa raíz durante incidentes de datos.
¿Cuáles son los diferentes tipos de linaje de datos?

¿Cuáles son los diferentes tipos de linaje de datos?

El linaje de datos incluye tanto el linaje empresarial como el técnico.

El linaje empresarial se centra en la descripción general de la fuente de datos para ayudar a los equipos de gobierno de datos y a los usuarios empresariales a comprender el flujo de datos entre diferentes fuentes de datos dentro del panorama de datos de una empresa.

El linaje técnico se focaliza en el flujo de datos de la empresa en los niveles de tablas y columnas, las capas de transformación subyacentes y las reglas, las tablas o filas temporarias y otros objetos de interés para que los usuarios técnicos comprendan el recorrido de datos de una empresa.

Tanto las vistas del linaje empresarial como del técnico son críticas para que las empresas comprendan el valor de sus datos y evalúen fácilmente el impacto de los cambios. La capacidad de explorar en detalle desde linajes empresariales hasta linajes técnicos, o viceversa, proporciona una flexibilidad adicional para que los analistas de datos obtengan rápidamente la perspectiva correcta del flujo de datos.

No todo el linaje de datos automatizado se entrega de la misma manera. El linaje referido puede reunir el linaje basado en nombres de elementos o atributos y composición. El linaje de datos más detallado se basa en el código en el nivel del elemento y es más confiable.

El linaje de datos evoluciona rápidamente para convertirse en más inteligente, usando la IA para capturar patrones en código difícil de analizar.

¿Qué es el catálogo y el linaje de datos?

Un catálogo de datos es una vista centralizada de los recursos de datos dentro de una empresa utilizada para administrar, aprovechar, proteger, comprender y socializar los datos de una empresa. Un catálogo de datos comprende los metadatos, o datos que describen a sus datos, que se recolectan de las fuentes de datos, plataformas de datos, aplicaciones y sistemas de inteligencia empresarial a lo largo de su empresa. Luego se enriquece aún más con contexto empresarial y guía de gobierno de datos. El catálogo de datos automatizado aprovecha la detección de datos automatizada y las capacidades de recolección de metadatos mediante conectores de datos específicos pata metadatos de datos en reposo. El linaje de datos automatizado aprovecha los metadatos de datos en reposo. También captura metadatos de datos en movimiento, aprovechando las capacidades de ingeniería inversa de conectores de datos. Analiza el código involucrado en el movimiento de datos, como un código de procedimiento y ETL, para asignar el flujo de datos a lo largo de una empresa. El linaje resultante ayuda al área de TI, a los equipos de gobierno de datos y a los usuarios empresariales a comprender visualmente los recursos de datos disponibles dentro de la empresa. Especifica el recorrido de los datos de una fuente de datos iniciales a aplicaciones de destino finales, con todas las transformaciones de datos entre medio.

¿Qué es una herramienta de linaje de datos?

Una herramienta de linaje de datos utiliza la automatización para descubrir y asignar el flujo de datos de fuentes de datos iniciales, a través de la transformación y el procesamiento, hasta destinos finales. Por ejemplo, en la asignación de los procesos de datos que completan su depósito de datos, una herramienta de linaje de datos podría generar una ingeniería inversa en las tareas de ETL que precedan de inmediato a la carga de los datos en el almacén de destino. Iterando a través de todas las fuentes de datos, la herramienta acumula una lista de tareas y documenta cada pieza de linaje descubierta. Al final de la secuencia, el proceso habrá creado una asignación inversa de los procesos para rellenar ese almacén. Las herramientas de linaje de datos automatizadas hacen que sea práctico recolectar y mantener el linaje de datos actualizado. Ahorran a los administradores de datos hasta un 95 por ciento del tiempo tradicionalmente atribuido a los métodos de linaje de datos manual.

¿Dónde puedo obtener ayuda con el linaje de datos?

¿Dónde puedo obtener ayuda con el linaje de datos?
erwin Data Intelligence de Quest® proporciona un linaje de datos automatizado de origen a destino, con todas las transformaciones de datos en el medio. Los equipos de TI, gobierno de datos y usuarios empresariales pueden navegar por el linaje de datos con contexto técnico y empresarial, visibilidad de la calidad de los datos e indicadores de datos confidenciales.