Webサイトを快適にご利用いただくためには、IE11以降、Chrome、Firefox、またはSafariをご使用ください。

データリネージュとは?

データリネージュとは、組織のデータの過程です。つまり、ソースでのデータ作成から、ビジネス内外のデータプラットフォームやリポジトリへの移動および変換を経て、業務や意思決定に使用するアプリケーションやビジネスインテリジェンス内に最後に格納されるまでの履歴です。エンド・ツー・エンドのデータリネージュは、組織への、組織内での、また組織からの特定のデータセットの流れを完全かつ詳細に視覚化したものです。ITのモダナイゼーションの計画策定、データ品質の問題のトラブルシューティング、データガバナンスおよび法令順守への対応、利用可能なデータと組織内でのその関係の素早い確認と把握に役立ちます。
データリネージュとは?

データリネージュが重要な理由

データのソースと流れの追跡は手間がかかる作業です。組織が情報システムを蓄積するにつれて、データのエントリポイントや移動し続けるデータの変換ルールも蓄積されていきます。加えて、データ統合ツール、抽出/変換/書き出し(ETL)ツール、手続き型コード、さらにはAPIおよびビジネスインテリジェンス(BI)レポートも、絶えずデータを集約し、変換しています。このため、組織内のシステム間に形成された複雑なデータ網を手作業でまとめ、把握し、その流れをシンプルに視覚化するのは困難です。自動化されたデータリネージュは、IT部門、データ・ガバナンス・チーム、およびビジネスユーザに組織データの最新の可視性とコンテキストを提供します。これにより、作業効率を上げ、意思決定をより健全にし、自由に利用できるデータの活用と保護を向上することができます。

データリネージュによってデータがどこで生成され、どのように変換され、組織内をどのように移動したかを把握できます。また、これだけではなく、技術的属性、ビジネス属性、ガバナンスをまとめ、機密データやその他のデータの分類に注目し、データ品質の問題の根本原因分析をユーザが迅速に実行できるようサポートするなど、データ品質を可視化することもできます。自動影響分析機能がない場合でも、この機能と組み合わせて使用する場合でも、データリネージュは、潜在的なデータ管理、データインテリジェンス、およびデータプラットフォームの移行による影響の範囲を確認し、評価するうえできわめて有効です。

データリネージュが重要な理由

データリネージュのメリット

ビジネスへの影響とデータランドスケープの可視性

利用可能なデータとその変換および複数のシステム間での流れを認識し把握することで、ビジネス上の意思決定に影響を与え、サポートすることができます。例えば、データの過程とコンテキストを把握することは、データの所有者、認識すべきガバナンスガイダンス、用途に対するデータの適合性など、ビジネス・インテリジェンス・レポートの疑問に答える際に役立ちます。データリネージュを使用すると、重要なビジネスイニシアチブに沿ったデータ、そのデータの取得場所と取得方法、また与えられたアップストリームのリネージュの経緯や関連するデータ品質スコアを信頼すべきかどうかなどが理解しやすくなります。組織は、重要なプライバシー情報が企業から流出する可能性のあるリスク領域をさらに簡単に見付けることもできます。

データガバナンスの基本的なサポート

データの所有権、説明責任、およびトレーサビリティは、健全なデータ・ガバナンス・プログラムの要です。自動化と組み合わせると、データリネージュはデータ所有者、データ管理者、ITおよびビジネスユーザがデータの使用状況を理解し、検証するために役立ちます。自動化されたデータリネージュは、最初のデータソースからターゲットまで、またその間のすべてのデータ変換を含む水平方向のデータリネージュに加えて、ビジネス資産と技術資産の関係についての洞察を提供する垂直方向のデータリネージュも提供します。アップストリームとダウンストリーム、その両方のエンド・ツー・エンドのデータリネージュは、誰がいつ変更を行ったかを明らかにし、技術上のガバナンスとビジネスガバナンスをまとめてすべてのデータユーザに一元的に表示します。データリネージュは、データ・ガバナンス・チームに不可欠の透明性の高いツールです。

法令順守と監査対応性

ビジネス用語とデータポリシーは、データインテリジェンスおよびガバナンスソリューション内部の文書化されたビジネスルールを通じて実装しなければなりません。ここでデータリネージュを使用して、これらのルールについての法令順守を追跡し、データが変換されるたびに監査対応性と検証の制御を組み込むことができます。データリネージュは、お客様がコンプライアンス規制とプライバシーに関する問題に真剣に取り組み、その取り組みをサポートするプログラムを導入していることを顧客、従業員、および監査官に示す、短時間で確認できる視覚的な証拠も提供します。

チーム間のコラボレーション

データリネージュは、組織内のデータと、複数の部門や個別のレガシー分析環境および最新の分析環境間のデータ過程に関する一般的な視覚情報を提供します。このようなデータとその使用状況の透明性によってさらなるデータの共有が促進され、データ統合プロジェクトでの重要なハンドオフが明確に識別されます。1つの中心となる参照ポイントを使用することで、組織内のすべてのチームがより効率的に連携できるため、確実に組織内のデータを十分に活用し、適切に保護することができます。

データ品質の可視性とターゲット設定

根本原因分析は、低いデータ品質に対応するための最初のステップです。データ品質に関するデータリネージュの洞察によって、データ管理者は情報の流れを遡って追跡し、データの標準化と変換が正しく行われたかどうかを確認できます。エンド・ツー・エンドのデータリネージュにより、データ品質の問題をデータソースで修正できます。また、チームは主要なデータパイプラインをプロアクティブに監視して、データの整合性を保証することができます。データリネージュは、信頼関係を構築するデータの適合性をビジネスユーザに直接表示することもできます。

ITの計画策定およびデータ管理

データリネージュは、データアーキテクトやデータエンジニアが最新のデータランドスケープの現状を理解し、ITのモダナイゼーション、データウェアハウスの移行、その他の重要な取り組みをスマートに管理するために必要な洞察と情報を提供します。影響を受けるアプリケーション、変換ルール、およびビジネスユニットの数といったプロジェクトの範囲に関する視覚情報を提供します。機密データやその他のデータの分類、データ品質インジケータ、またすぐに使用できるガバナンスのコンテキストの可視性が、ITチームが組織内のデータをより適切に管理するために役立ちます。

データの準備

データを準備するデータアナリスト向けに、データリネージュは、最適なデータが目的の分析用に選択されるように必要なロードマップを提供します。データリネージュは、利用可能なシステム、環境、テーブル、および列の視覚情報をアナリストに提供することができます。これは、物理名と論理名の両方の参照ポイントとして機能し、データ品質、機密データインジケータ、ガバナンスの事故予防策を含めることで、アナリストの作業を効率化し、データの準備時間を短縮することができます。

データリネージュはデータガバナンスの一部ですか?

はい。有効なデータガバナンスのためには、ビジネス用語集、データ辞書、データ・プライバシー・ポリシーを中心となる1つの場所に置く必要があります。ただし、組織内のデータ量の増加に伴い、これらのオブジェクトは、さまざまな形式でさまざまな場所に置かれ、さまざまな方法で表現されるようになります。データリネージュは、組織がこれらのオブジェクトを簡単に追跡し、監視し、徐々に更新するのに役立ちます。データリネージュは、用語の整合性、データ品質の修復、データパイプラインの監査、データ障害発生時の根本原因分析など、ガバナンスの実践にメリットをもたらします。
データリネージュのタイプの違いとは

データリネージュのタイプの違いとは

データリネージュには、ビジネスリネージュと技術リネージュの両方が含まれます。

ビジネスリネージュでは、データ・ガバナンス・チームおよびビジネスユーザが、組織のデータランドスケープ内の異なるデータソース間のデータの流れを把握するために役立つようデータソースの概要に注目します。

技術リネージュでは、技術ユーザが組織のデータ過程を把握できるよう、テーブルや列のレベルにおける組織のデータの流れ、基礎となる変換階層およびルール、一時テーブル/ファイル、対象となるその他のオブジェクトに注目します。

組織がデータの価値を理解し、変更の影響を簡単に評価するためには、ビジネスリネージュと技術リネージュの両方の視点が非常に重要です。ビジネスリネージュから技術リネージュへ、またその逆へドリルダウンする機能により、データアナリストにさらなる柔軟性を提供するため、データの流れの適切な見解を迅速に得ることができます。

自動化されたすべてのデータリネージュが同じ方法で提供されるわけではありません。参照されたリネージュは、要素または属性名と構成に基づいてリネージュをまとめることができます。さらに詳細なデータリネージュは要素レベルのコードに基づいており、より信頼性が高くなります。

データリネージュは、解析が困難なコードのパターンを取得するAIを使用することで、さらなるインテリジェントを実現できるように急速に進化しています。

データカタログおよびリネージュとは

データカタログは、組織のデータを管理、活用、保護、把握、ソーシャル化するために使用する組織内のデータ資産を一元的に表示するものです。データカタログはメタデータ、つまりデータを説明するデータで構成されています。これは、ビジネス全体のデータソース、データプラットフォーム、アプリケーション、およびビジネス・インテリジェンス・システムから収集したものです。これは、ビジネスコンテキストおよびデータ・ガバナンス・ガイダンスによりさらに強化されます。自動化されたデータカタログは、保存データのメタデータ用のプラットフォームに固有のデータコネクタを使用して、自動化されたデータ検出およびメタデータ収集機能を活用します。自動化されたデータリネージュでは、保存データのメタデータを活用します。また、データコネクタのリバースエンジニアリング機能を使用し、移動中データのメタデータも取得します。手続き型のコードやETLなど、データの移動に使用されるコードを解析し、組織全体のデータの流れをマッピングします。その結果得られたリネージュは、IT部門、データ・ガバナンス・チーム、ビジネスユーザが、組織内の使用可能なデータ資産を視覚的に把握するうえで役立ちます。これは、最初のデータソースから最後のターゲットアプリケーションまでのデータの過程を、その間のすべてのデータ変換と共に特定します。

データ・リネージュ・ツールとは?

データ・リネージュ・ツールは、最初のデータソースから変換および処理を経て最後の宛先までのデータの流れを自動的に検出し、マッピングします。例えば、データウェアハウスに取り込むデータパイプラインのマッピングでは、目標のウェアハウスへのデータのロード直前に行われるETLタスクをデータ・リネージュ・ツールがリバースエンジニアリングします。このツールは、すべてのデータソースで繰り返すことによりタスクリストを蓄積し、検出された個々のリネージュを文書化します。シーケンスの最後に、そのウェアハウスに取り込むパイプラインがこのプロセスによりリバースマッピングされます。自動化されたデータ・リネージュ・ツールにより、データリネージュの収集と最新の状態の維持が可能になります。データ・リネージュ・ツールは、データ管理者が従来、手作業によるデータリネージュに費やしていた時間を最大95%削減します。

データリネージュのサポートを受けるには?

データリネージュのサポートを受けるには?
erwin Data Intelligence by Quest®は、ソースからターゲットまで、その間のすべてのデータ変換も含めて、自動化されたデータリネージュを提供しています。IT部門、データ・ガバナンス・チーム、およびビジネスユーザは、技術的なコンテキストとビジネスコンテキスト、データ品質の可視性、機密データインジケータでデータリネージュを利用することができます。