Die Nachverfolgung der Quelle und des Flusses von Daten ist eine mühsame Aufgabe. Wenn Unternehmen immer mehr Informationssysteme einsetzen, häufen sich auch Dateneingangspunkte und Transformationsregeln für die sich ständig in Bewegung befindlichen Daten. Darüber hinaus werden Daten von Datenintegrations-Tools, ETL-Tools (Extract, Transform, Load), prozeduralem Code und sogar APIs und Business-Intelligence-Berichten ständig aggregiert und transformiert. Daher ist es schwierig, das komplizierte Datengeflecht, das in den Systemen vieler Unternehmen entstanden ist, manuell zu erfassen, es nachzuvollziehen und in einfachen Flussdiagrammen visuell darzustellen. Mithilfe der automatisierten Datenherkunft erhalten die IT, Daten-Governance-Teams und geschäftliche Benutzer aktuelle Einblicke und Kontext zu Unternehmensdaten, um effizienter arbeiten, fundiertere Entscheidungen treffen und die vorliegenden Daten besser nutzen und schützen zu können.
Mithilfe von Datenherkunft können Sie nachvollziehen, woher Ihre Daten stammen, wie sie transformiert werden und sich durch Ihr Unternehmen bewegen. Darüber hinaus können Sie mit den richtigen Datenherkunftsfunktionen unter anderem technische und geschäftliche Attribute und Governance vereinen, sensible Daten und andere Datenklassifizierungen hervorheben, die Datenqualität sichtbar machen und die Ursachenanalysen bei Datenqualitätsproblemen beschleunigen. Wenn Sie über keinerlei oder nur wenige automatisierte Auswirkungsanalysefunktionen verfügen, kann sich die Datenherkunft für die Bereichsdefinition und Bewertung der Auswirkungen potenzieller Datenverwaltungs-, Data-Intelligence- und Datenplattform-Migrationsinitiativen als extrem nützlich erweisen.
Die Datenherkunft beinhaltet die geschäftliche und die technische Herkunft.
Die geschäftliche Herkunft konzentriert sich auf die Datenquellenübersicht und unterstützt Daten-Governance-Teams und geschäftliche Benutzer dabei, den Datenfluss zwischen verschiedenen Datenquellen innerhalb der Datenlandschaft eines Unternehmens nachzuvollziehen.
Die technische Herkunft konzentriert sich wiederum auf den Datenfluss eines Unternehmens auf der Ebene von Tabellen und Spalten, die zugrundeliegenden Transformationsebenen und -regeln, temporäre Tabellen/Dateien und andere Objekte, die für technische Benutzer interessant sind, um den Weg von Unternehmensdaten zu verfolgen.
Sowohl die geschäftliche als auch die technische Herkunftsansicht spielt für Unternehmen eine entscheidende Rolle, weil sie damit den Wert ihrer Daten verstehen und die Auswirkungen von Änderungen einfacher bewerten können. Wenn von der geschäftlichen bis zur technischen Herkunft – oder umgekehrt – Detailinformationen angezeigt werden können, erhalten Data Analysts mehr Flexibilität bei der Suche nach einem umfassenden Verständnis des Datenflusses.Nicht alle automatisierten Datenherkunftslösungen werden auf dieselbe Weise bereitgestellt. Eine referenzierte Datenherkunft zieht unter Umständen verschiedene Datenherkunftsformen basierend auf den Element- oder Attributnamen und der Zusammensetzung zusammen. Eine detailliertere Datenherkunft basiert hingegen auf dem Code auf Elementebene und ist vertrauenswürdiger.
Die Datenherkunft wird in schnellem Tempo immer intelligenter und nutzt künstliche Intelligenz, um Muster in Code zu erfassen, der sich nur mit Mühe analysieren lässt.