Slide 1

Slide 1 text

Microsoft MVP for Data Platform 永田 亮磨 (ZEAL CORPORATION) X: @ryomaru0825 Linkedin: ryoma-nagata-0825 Qiita: ryoma-nagata Microsoft Purview Data Governanceについて

Slide 2

Slide 2 text

目次 05 費用について 01 製品としての位置づけ 02 重要概念について 03 機能について 04 Microsoft Fabric との活用例

Slide 3

Slide 3 text

目次 05 費用について 01 製品としての位置づけ 02 重要概念について 03 機能について 04 Microsoft Fabric との活用例

Slide 4

Slide 4 text

M365 コンプライアンスソリューション + Azure Purview = Microsoft Purview Microsoft Purview とは? | Microsoft Learn Azure Purview M365 コンプライアンスソリューション 統合、リブランディング データ損失防止 内部リスク管理 情報保護 メタデータの自動収集・管理 データカタログ データアクセスポリシー データライフサイクル管理 電子情報開示と監査 コミュニケーションコンプライアンス

Slide 5

Slide 5 text

従来のソリューションとのマッピング Microsoft Purview ポータル (https://purview.microsoft.com/home/applauncher) From Azure Purview From M365 コンプライアンスソリューション From M365 コンプライアンス ソリューション From Azure Purview From Azure Purview From Azure Purview From M365 コンプライアンス ソリューション From M365 コンプライアンスソリューション コンプライアンスとデータ ガバナンスの未来はここにあります: Microsoft Purview の概要 |Microsoft セキュリティ ブログ

Slide 6

Slide 6 text

Microsoft Purview データガバナンス 全体像 データマップ データ資産のスキャン・詳細なメタデータの付与を行い、組織全体のデー タ資産を管理する データカタログ データ資産をビジネスの文脈で整理・管理し、 利用価値を生み出す オンプレミス マルチクラウド SaaS アプリケーション Microsoft Purview データガバナンス ビジネスオーナー ガバナンスドメイン内でデータ製 品を管理し、利用者に提供 データ利用者 データシステムオーナー データアセットへの 接続・スキャンの管理 データガバナンス責任者 ソリューションの管理 データエステートの監視統制 *頻出ワードの補足 • データエステート:組織全体のデータ資産 • データアセット:個々のデータ資産 データ製品/データアセットを 発見・活用 メタデータのアクティベート メタデータの収集

Slide 7

Slide 7 text

データマップ データ資産のスキャン・詳細なメタデータの付与を行い、組織全体のデー タ資産を管理する データカタログ データ資産をビジネスの文脈で整理・管理し、 利用価値を生み出す Microsoft Purview データガバナンス メタデータのアクティベート Microsoft Purview データガバナンスポータルUI ガバナンスドメインや、データ品質管理に対応している 新しいPurview データガバナンスポータル は現在プレビュー中

Slide 8

Slide 8 text

データマップ データ資産のスキャン・詳細なメタデータの付与を行い、組織全体のデー タ資産を管理する データカタログ データ資産をビジネスの文脈で整理・管理し、 利用価値を生み出す Microsoft Purview データガバナンス メタデータのアクティベート クラシックポータルUI ガバナンスドメインや、データ品質管理に対応している 新しいPurview データガバナンスポータル は現在プレビュー中

Slide 9

Slide 9 text

補足)DMBOKよりデータガバナンスの記載について データガバナンスの目標 1. 組織が自身のデータを資産として管理できるようにする 2. データマネジメントに関する原則、ポリシー、手続き、評価指標、ツール、責任について定義し、承認し、 伝達し、実施する 3. ポリシーの順守、データの利用、管理活動を監視し、導く DAMA International.『データマネジメント知識体系ガイド 第二版』.日経BP社.2018年,96p リスク管理 データ セキュリティ プライバシー コンプライアンス対応 データ品質改善 メタデータ管理 PJ効率化 データ契約管理

Slide 10

Slide 10 text

目次 05 費用について 01 製品としての位置づけ 02 重要概念について 03 機能について 04 Microsoft Fabric との活用例

Slide 11

Slide 11 text

ドメインでのデータ管理の概念  データ管理において、 データを関連する業務機能で論理的にグ ルーピング化することをドメイン指向のデー タ管理と呼ぶ  それぞれのドメインでは所有している業務 アプリケーションとビジネス上の属性項目 が異なり、重要な属性を必ず一つのドメ インに紐づいて管理することで情報に対す る責任範囲が明確化される  データ ドメイン - Cloud Adoption Framework | Microsoft Learn  ドメイン内外でのデータ利用にガバナンス がない場合、インターフェースの濫立を生 む  異なるフォーマット、異なるサービス、異なるデータ定義  利用者不在の秘伝のエンドポイント  未確認なデータ利用規約

Slide 12

Slide 12 text

データ製品指向によるデータガバナンスの再考  データ製品指向(Data as Product):データに商業製品的な特性を適用する考え方を通して、データインター フェースを統制する  「データは水道のようにすぐに使えて、どこにでも同じような形で蛇口があり、安全であってほしい」 主な特性  検出、説明性:たとえばECサイトのように  データは発見が可能な状態(市場化)である  消費者に説明するためのカタログが付随する  データ契約:たとえばクラウドサービスのように  データには所有者が定められており、利用規約とともに提供され、SLAに準拠される  相互運用性:たとえばねじや工具のように  データはあらゆる目的、場所でも同じように使えるようにフォーマットや、インターフェースが標準化されている 業務アプリケーション セルフサービスデータ基盤 データ統合 サービス データ製品 貨物管理 運行管理 別ドメイン 業務アプリケーション セルフサービスデータ基盤

Slide 13

Slide 13 text

補足)データ製品=ドメインが保証するデータの提供ポイント  データ製品を共通のインターフェースとすることでドメイン内外のデータ利用が統制される  Understanding Data Modelling in Data Mesh | by Piethein Strengholt | Medium  これを進めるとデータを統合するためのグループとして業務に直接関係しないドメインも発生する  エンタープライズデータアーキテクチャなどの企業内の「同一エンティティ異ドメインデータ」を統合する活動がそれにあたる  このドメインは専用のバックオフィス(いわゆるCDO直轄チーム)として組織される場合がある

Slide 14

Slide 14 text

データメッシュによるセルフサービスデータ活用の統制と促進  データメッシュ:組織全体で一貫した統制に加えて、ドメイン個々で必要なポリ シーやルールの拡張を委任することで迅速性と統制を両立する  Data Mesh Principles and Logical Architecture (martinfowler.com) ドメインA ドメインB ドメインC ドメインD ドメインE ドメインG データ製品の生成 データガバナンス基盤 セルフサービスデータ基盤 データ製品の文書化 ドメイン全体で横断した統制 ドメイン個々でのデータ処理 Microsoft Fabric Microsoft Purview

Slide 15

Slide 15 text

データメッシュ参考  Data Mesh Principles and Logical Architecture (martinfowler.com)  How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh (martinfowler.com)  クラウド規模の分析 - Azure 向けの Microsoft Cloud 導入フレームワーク - Cloud Adoption Framework | Microsoft Docs  ★データ基盤の新たな潮流:データファブリック ~データとAIの活用を加速させる新たなアプローチ |前編 データファブリックの概要 - アイマガジン|i Magazine|IS magazine  Data Fabric vs Data Mesh: 3 Key Differences, How They Help and Proven Benefits  データメッシュとデータファブリックを実現させるデータガバナンス  拡張データ管理: データ ファブリックとデータ メッシュ (ibm.com)  データ・ファブリックとは|アイビーエム (ibm.com)  ガートナーの2021年のトップデータと分析トレンド (gartner.com)  Using Data Fabric Architecture to Modernize Data Integration (gartner.com)  データファブリック:ナレッジグラフのキラーユースケース (datanami.com)  ★データファブリックとデータメッシュ:どこが違うのか?|北原 祐司 / 「データとAIの民主化」を目指す Databricks|note  データファブリックとは最新のエンタープライズデータアーキテクチャ (k2view.com)  James Serra's Blog  データ メッシュ: トポロジとドメインの粒度|ピエテイン・ストレングホルト・|データサイエンスに向けて (towardsdatascience.com)  ★データメッシュの概念について理解する - connecting the dots (hatenablog.com)  Data Mesh: Centralized ownership vs decentralized ownership | James Serra's Blog  成功するデータメッシュの構築 – 単なるテクノロジーイニシアチブ以上のもの|リンクトイン (linkedin.com)  Data Trends: Comparing Data Fabrics, Data Meshes, And Knowledge Graphs – Diffblog (diffbot.com)  Data Mesh: The Balancing Act of Centralization and Decentralization | by Piethein Strengholt | Mar, 2022 | Towards Data Science  Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics (cidrdb.org)

Slide 16

Slide 16 text

目次 05 費用について 01 製品としての位置づけ 02 重要概念について 03 機能について 04 Microsoft Fabric との活用例

Slide 17

Slide 17 text

データガバナンス原則からビジネスデータカタログ機能を理解する Microsoft Purview データガバナンス データカタログ データ資産を 意味づけ、整理し、 公開することで、安全 に利用、保護できる ようにします。 データの適切な使用 とアクセスを促進し、 安全性とイノベーショ ンのバランスを取りま す。 日々のビジネスや イノベーションに必要 なデータを、ユーザーが 発見、承認できるよう にします。 ユーザーがデータの内 容と使用方法を理解 するための文書を提 供します。 データ品質や、データ マネジメントにおける 対応状況を維持し、 データの最新性と安 全性を保ちます。 データキュレーション データアクセス データの健全性 データ理解 データディスカバリ New Microsoft Purview Data Catalog (Preview) | Microsoft Learn

Slide 18

Slide 18 text

ビジネスの文脈でカタログ化を行う データキュレーション - データ資産を意味づけ、整理し、公開することで、安全に利用、保護できるようにします。 ガバナンス ドメイン  ビジネスの概念でデータ資産を整理し、 ドメイン個々でのデータ資産管理を 可能にします

Slide 19

Slide 19 text

ビジネスの文脈でカタログ化を行う データキュレーション - データ資産を意味づけ、整理し、公開することで、安全に利用、保護できるようにします。 データ製品  データ資産をグループ化し、 見つけやすくするとともに、 データの文脈とデータ活用に使える一 連のデータ資産のセットを提供します

Slide 20

Slide 20 text

データアクセスポリシーを一元的に適用する データアクセス - データの適切な使用とアクセスを促進し、安全性とイノベーションのバランスを取ります。 データアクセスポリシー  様々なスコープで継承、適用可能な ポリシーとアクセス要求を定義し、 組織のコンプライアンスに統制された データ活用を促進します

Slide 21

Slide 21 text

データアクセスポリシーを一元的に適用する データアクセス - データの適切な使用とアクセスを促進し、安全性とイノベーションのバランスを取ります。 重要なデータ要素  複数のデータ資産にまたがるデータ項目 をグループ化することで、 すべての重要なデータ要素に対して 一元的にポリシーやデータ品質基準を 適用できます

Slide 22

Slide 22 text

データカタログでデータを発見する データディスカバリ - 日々のビジネスやイノベーションに必要なデータを、ユーザーが発見、承認できるようにします。 データ資産・データ製品検索  データ資産を検索し、必要データを見つ けることができます。  データ製品に紐づけられた様々な側面 でフィルタをすることも可能です。

Slide 23

Slide 23 text

データカタログでデータを発見する データディスカバリ - 日々のビジネスやイノベーションに必要なデータを、ユーザーが発見、承認できるようにします。 セルフデータアクセス要求  データ製品画面にはアクセス要求のた めのボタンが含まれており、 要求を開始し、ポリシーに同意するため のフォームが提供されます

Slide 24

Slide 24 text

ビジネス価値中心にデータを理解する データ理解 - ユーザーがデータの内容と使用方法を理解するための文書を提供します。 用語集の用語  ガバナンスドメイン内で定義された用語 がデータカタログをビジネス語彙の側面 から強化します。 共通的な語彙が業務上のインター フェースの混乱を防ぎます OKR(Objective Key Result)  ガバナンスドメイン内のデータ活用をドラ イブするために、ビジネス的なバリューに よる目標を定義します  データ製品にひもづけられたOKRは その価値を明らかにします

Slide 25

Slide 25 text

データマネジメントの正常性を維持する データの健全性 -データ品質や、データマネジメントにおける対応状況を維持し、データの最新性と安全性を保ちます。 コントロールとアクション  コンプライアンスやデータマネジメントの 推奨事項、または事前に定義された データ品質ルールをベースラインとして、 データエステートの充実度(スコア)と対 処すべき問題を明らかにします  検出された問題の対処をアクションアイ テムとして管理します

Slide 26

Slide 26 text

データマネジメントの正常性を維持する データ品質  適時性や完全性など、標準的な要素 でデータ品質を測定・監視します  測定結果は時系列で追跡され、データ 品質改善を促進することで、安全な データが提供されます データの健全性 -データ品質や、データマネジメントにおける対応状況を維持し、データの最新性と安全性を保ちます。

Slide 27

Slide 27 text

データカタログとデータマップ データマップはPurviewソリューション全体のバックエンドとして メタデータ収集を効率化し、インフラストラクチャーとアクセス制御を提供する データマップ データ資産のスキャン・詳細なメタデータの付与を行い、組織全体のデー タ資産を管理する データカタログ データ資産をビジネスの文脈で整理・管理し、 利用価値を生み出す オンプレミス マルチクラウド SaaS アプリケーション Microsoft Purview データガバナンス メタデータのアクティベート メタデータの収集 データアセットにアクセス、 ビジネスメタデータの付与と表 示をするためのインターフェース データアセットを収集・蓄積し、 テクニカルメタデータの充実と アセット個々に対する細かい アクセス制御層を提供する 組織全体でのRBACや SaaSとしての設定を構成する

Slide 28

Slide 28 text

データマップによるメタデータの収集の効率化 IT管理の側面でデータの所有権をマップ アプリケーションドメインと データドメインを分離してデータ資産を管 理するための論理的なコンテナとして機能 ドメインとコレクションの階層で 役割を割り当てることで、責任を分散およ び分散

Slide 29

Slide 29 text

データマップによるメタデータの収集の効率化 様々なデータソースとファイル形式をユーザ 定義のスケジュールで定期スキャンし データ資産として収集 専用エージェントを介してオンプレ内の データソースや他社クラウドのスキャンにも 対応 組織全体のデータをスキャン

Slide 30

Slide 30 text

データマップによるメタデータの収集の効率化 組み込みのルールまたは、正規表現or辞 書による一致で自動的に分類を付与 付与された分類はカタログのフィルターとし て利用可能 分類規則により自動のアノテーション

Slide 31

Slide 31 text

詳細な機能の説明と関係性 – データカタログ データカタログ データ資産正常性 データマップ Microsoft Purview データガバナンス ガバナンスドメイン 正常性コントロール ドメインと サブコレクション ソース管理 注釈管理 データ品質 アクセスポリシー ビジネス用語集 OKR カスタム属性 重要データ データ製品 スキャン アセット 正常性アクション メタデータ品質 レポート 監視 スキャンルールセット パターンルール 統合ランタイム 資格情報 系列の接続 分類 分類名 データソース キュレーション (編纂)、表示 ビジネスメタデータ付与 ガバナンスドメイン データカタログ内で、「ビジネス文脈」中心にアセットを整理するため の論理グループ 主な管理対象 • データ製品:アセットをパッケージ化して利用者に提供する。 データカタログのメインとなる成果物 • 重要データ:アセット、データ製品に紐づけて利用する。N個のアセットの 列をグループ化し、データ品質とポリシーを一元的に適用 • ビジネス用語集:アセット、データ製品に紐づけて利用する。ガバナンスド メイン内でビジネスユーザーの共通語彙として提供・統制 ガバナンスドメイン内で定義され、成果物に紐づけされるもの • OKR:目標と主要な結果を定義し、データの活用を促進する • データ品質:プロファイリング結果と品質の測定結果を提供する • アクセスポリシー:データの利用規約を定義する。ポリシーは用語や重要 データ要素からデータ製品に継承可能 • カスタム属性:必須の説明情報など、ドメイン固有のメタデータ項目を 定義する データ資産正常性 組織のデータカタログ状況を測定・調査・改善するツール群 主な管理対象 • 正常性コントロール:ガバナンスドメインまたは組織のデータカタログ全体 に品質ルールを適用し、測定スコアを算出する • 正常性アクション:データ品質または正常性コントロールの結果から抽出 された問題と対処内容をバックログ化として表示する • メタデータ品質:独自または組み込み済みの品質測定ルールを定義す る • レポート:カタログの利用状況/充実度やインベントリレポートなど、様々 な観点でデータガバナンスの状況を監視する

Slide 32

Slide 32 text

詳細な機能の説明と関係性 – データマップ データカタログ データ資産正常性 データマップ Microsoft Purview データガバナンス ガバナンスドメイン 正常性コントロール ドメインと サブコレクション ソース管理 注釈管理 データ品質 アクセスポリシー ビジネス用語集 OKR カスタム属性 重要データ データ製品 スキャン アセット 正常性アクション メタデータ品質 レポート 監視 スキャンルールセット パターンルール 統合ランタイム 資格情報 系列の接続 分類 分類名 データソース ドメインとサブコレクション データマップ内に取り込み対象のデータソースや、 取り込まれたアセットのアクセス制御を管理するための親子構造 主な管理対象 • アセット:系列ソースや、スキャンにより取り込まれたデータ資産 • データソース:データソースをデータマップに紐付けて管理する • スキャン:紐づけられたデータソースに対するスキャンを構成する ソース管理 共通されるインフラストラクチャや再利用可能なスキャンルールを定義する 主な管理対象 • 系列の接続:Data Factoryなど、リネージ情報を送信するソースサービ スを管理する • パターンルール:共通の命名規則をもったファイル群など、アセットをグ ループ化(リソースセット)するためのルールを定義する • スキャンルールセット:分類規則など、スキャン時に使用する規則をグ ループ化して、データソース個々で再利用する • 統合ランタイム:スキャンに使用されるインフラストラクチャーを管理する • 資格情報:スキャンに使用される資格情報を管理する 監視 スキャン結果などアセット取り込み結果を監視する 注釈管理 スキャンルールセットに利用する分類と分類名を管理する 主な管理対象 • 分類:「電話番号」「住所」など、格納されたデータから特定可能なラ ベルを定義する • 分類規則:分類を割り当てるためのルールを定義する キュレーション (編纂)、表示 ビジネスメタデータ付与

Slide 33

Slide 33 text

目次 05 費用について 01 製品としての位置づけ 02 重要概念について 03 機能について 04 Microsoft Fabric との活用例

Slide 34

Slide 34 text

全体構成例:運行管理ドメインでのデータ製品開発 業務アプリケーション データ製品 貨物管理 運行管理 別ドメイン 業務アプリケーション Fabric ワークスペース データカタログ データマップ ガバナンスドメイン、データ製品 ドメインとコレクション 運行管理 貨物管理 アプリケーションドメイン データドメイン データドメイン アプリケーションドメイン 運行管理 貨物管理 Microsoft Purview データ統合 Fabric ワークスペース

Slide 35

Slide 35 text

ガバナンスドメインを作成し、データプロジェクトを開始する 【Purview データカタログ】”ガバナンス”ドメイン作成 ガバナンスドメインを定義して、 生成すべきデータ製品や、目標、 用語を定義する。 ビジネスの側面で整理、制御され る 用語を整備することで ガバナンスドメイン内で起き ている出来事の理解を助け る OKRを定義して、 ガバナンスドメイン内でのデー タ活用を促進する

Slide 36

Slide 36 text

ドメインとコレクションを構成し、データソースを登録する 【Purview データマップ】ドメイン・サブコレクション作成 共通データ基盤はす べてのドメインで利用 されるためルートに紐 づけ コレクションによりデータ資産を管理する階層構造を定 義IT管理の側面で整理、アクセス制御される

Slide 37

Slide 37 text

データドメイン用のワークスペースを作成してデータ処理環境を準備する 【Fabric】セルフサービスデータ活用のためのワークスペース作成 Fabric内にもドメイン機能があり、 ワークスペースの整理が可能

Slide 38

Slide 38 text

OKRを達成するためのデータを収集統合し、データ製品を開発する ワークスペースに格納されているア イテムの役割を描画、整理する 遅延を分析するためのレポートを データ製品として開発 【Fabric】データ製品となるレポートの開発

Slide 39

Slide 39 text

スキャンによるアセットの取り込み 【Purview データマップ】データソースに対してスキャンを構成・実行 ワークスペース単位でコレクションと紐づけてスキャンが 可能(プレビュー

Slide 40

Slide 40 text

データ製品を作成し、データ資産をアクティベートする 【Purview データカタログ】データ製品の作成

Slide 41

Slide 41 text

補足)Databricks × Fabric による大規模データ管理とデータ製品開発  Microsoft Purview は Microsoft Fabric のプラットフォームガバナンスと、Databricks Unity Catalogによるプラットフォームレベルのガバナンスと 深く統合することでより大規模なセルフサービスデータプラットフォームに拡張可能 Microsoft Fabric Microsoft Purview Databricks メタデータの統合 ビジネスデータカタログによるアクセスポリシーの適用 Fabric/Databricks内で最適化されたポリシーの定義 ビジネスユーザーフレンドリーな体験と総合力の高さ データプロフェッショナルに最高効率の機能を提供

Slide 42

Slide 42 text

目次 05 費用について 01 製品としての位置づけ 02 重要概念について 03 機能について 04 Microsoft Fabric との活用例

Slide 43

Slide 43 text

無料 vs エンタープライズバージョン  Microsoft Purview ポータル (プレビュー) について説明します | Microsoft Learn

Slide 44

Slide 44 text

Purview データガバナンスの提供方式について  SaaS オファリングとしてリブランディングされているが、 費用や処理リソースはAzure リソースから供給される  Fabric についても類似のモデルとなる ※Fabric にはPower BI のための ユーザーライセンスの概念が追加される  Purview アカウントの数は テナントに一つのみである点は注意(現時点)  新しい Microsoft Purview ポータルについてよく寄せら れる質問 | Microsoft Learn Microsoft Purview Microsoft Fabric Microsoft Azure サブスクリプション Microsoft Entra ID テナント サブスクリプション Fabric 容量 Purview アカウント ワークスペース ワークスペース Fabric アイテム(成果物) ワークスペース に紐づけ テナントに一つの アカウントとして使用

Slide 45

Slide 45 text

10/23 時点の価格改定アナウンスについて  Microsoft Purview の課金モデルについて 説明します | Microsoft Learn  スキャンコストが無料化(SHIR利用など一部のスキャン処理 は除く)  データ製品や、用語などの Governed Asset の数量が課金 のメイン要素となる  その他、Copilot の利用などにも課金(詳細は不明)  Microsoft Purview data governance pricing announcement | Microsoft Learn

Slide 46

Slide 46 text

リソース  Microsoft Fabric と Microsoft Purview によるスケーラブルなデータ管理 |作 成者 Piethein Strengholt |中程度 (medium.com)  Episode 5: Connecting the dots with Microsoft Purview (youtube.com)  Microsoft Purview | Microsoft Learn  Microsoft Purview 用語集 | Microsoft Learn

Slide 47

Slide 47 text

Thank you !