Slide 1

Slide 1 text

データモデリングからはじめる データマネジメント 2023/11/10 第1回ドメイン駆動データマネジメント「データマネジメントの始め方」 @primeNumber パーソルキャリア株式会社 田中麻衣子

Slide 2

Slide 2 text

2 本日のテーマ 1 2 3 なぜデータマネジメントをすることになったか 今、どんな体制で、何をやっているのか 今後の課題

Slide 3

Slide 3 text

3 自己紹介 田中麻衣子 パーソルキャリア株式会社 クライアントP&M本部 デジタルテクノロジー統括部 ずっと“データ分析”してきた人 今年4月からデータマネジメント始めた人 @20neneneneko20

Slide 4

Slide 4 text

4 本日、話さないこと データマネジメントの詳細(そもそも何ですか?) データマネジメントの必要性(それって意味あるんですか?)

Slide 5

Slide 5 text

5 会社・サービス 簡単に会社のご紹介

Slide 6

Slide 6 text

doda会員登録者数 821万人 求人数 24万件以上 登録者数・求人数業界最大級 転職を希望する個人顧客様 採用を希望する法人顧客様へ サービス展開 toC・toBの両手型サービス 展開しているサービスは 20以上 転職支援サービス 中途採用 新卒採用 求人メディアの運営などを通じた人材紹介サービスを展開する会社 →人材紹介サービス:専任のキャリアアドバイザーが転職希望者様と法人顧客様のマッチングを行うサービス ※2023年9月末時点

Slide 7

Slide 7 text

法人顧客 様への価 値発揮を 総合的に 推進する 人材紹介サービス 専門領域人材紹介 More… 個人顧客 様への価 値発揮を 総合的に 推進する マーケティング インサイド セールス プロダクト 開発 テクノロジー 推進 全ての企業様の採用課題に最もマッチするサービスをスピーディーに提供する クライアント P&M本部 クライアントP&M本部は、今年4月に(再)組成されました

Slide 8

Slide 8 text

個別事業最適化 More… 調査工数↑ 分散 スピード↓ 我々のミッションに合わせて、データ管理の方法も見直す必要 横断的データ活用 質の担保↓

Slide 9

Slide 9 text

本発表では、データマネジメントを始める前段階=「なぜデータマネジメントが必 要なのか」という重要なトピックスには触れられませんが、データマネジメント= 「データの価値を維持・向上させて、データでコアドメインの価値を最大限に引き 出す継続的なプログラム活動」としています。 入門 中級 上級

Slide 10

Slide 10 text

コアドメイン/サブドメイン • コアドメインとは、「中心的事業領域」であり、その部分がなくなると商売がなり立たなくなってしまうような 事業領域を指しています。 • 一方で、サブドメインとはコアドメインをなり立たせるために必要ではあるが、競争優位性や差別化を図るポイ ントにはならない領域を指しています。 • つまり、選択と集中をするために、コア/サブドメインを区別する必要があります。 コアドメイン (競争優位性を担保する企業のアイデンティティ) サブドメイン ドメイン • 事業課題を技術的なソリューションで解決できる場合、最もシステム 化する価値の高い領域(理想) そのために・・・ • コアドメインがなんであるのか • コアドメインの範囲はどこなのか • システム上ではコアのロジックとサブのロジックを密結合・散在させない ・・・・ようにしななければな、とまず最初に考えました。 【参考】 エリック・エヴァンス 『エリック・エヴァンスのドメイン駆動設計』 ヴォーン・ヴァーノン『実践ドメイン駆動設計』

Slide 11

Slide 11 text

データマネジメント はじめてみた 体制・方針

Slide 12

Slide 12 text

データマネジメントに必要な最小単位で、はじめてみました データマネジメント エンジニア ドメインエキスパート 人数: • 1名+サポート2~3名 役割: • 各種調整 • 組織づくり • データ調査 • データモデリング スキルセット: • 分析をしている人 • 基本的なRDBの知識がある人 人数: • 2名+サポート1名 役割: • 基盤構築系全般 • ソリューション選定 スキルセット: • 基盤構築できる人 • データモデリングに詳しい人 人数: • 応じて変動 役割: • 業務について伝授 • 業務上の暗黙知につい て伝授 • 経理・法務などの専門 知識について伝授 スキルセット: • 業務スペシャリスト 分析する人/整える人 仕組みを考える人 直接価値を出す人 現体制/ 役割

Slide 13

Slide 13 text

“DMBOK”を参考に以下の2つの知識領域(+2)から、はじめてみました ※本日は、時間がないので『DAMA-DMBOK』とその各知識領域の詳細そのものについては割愛しますが、DMBOKとは、データマネ ジメントに関する知識を体系立ててまとめた書籍です。( https://www.dama-japan.org/Introduction.html ) Data Storage & Operations (+2) (Business)Metadata Data Security Data Modeling & Design “超”概略定義 • データに関する要件の明確化や、実装範囲の決 定を目的に、データモデルを作成すること • データの価値を最大化するために、格納される データを設計し、実装し、サポートすること • メタデータ(データ定義)の管理 • データの信頼性担保と権限管理 データ構造を設計して 安全に 蓄積する

Slide 14

Slide 14 text

Q.なぜ、 2つの知識領域(+2)から手を出したのか Peter Aiken のフレームワーク https://blogs.sap.com/2020/07/09/why-hr-data- management-strategy-is-important-in-your-hr-transformation/ Data Storage & Operations (20%) Data Security (20%) Data Modeling & Design (30%) Business MetaData(10%) ビジネス戦略(=データ要件) A.DMBOKでデータマネジメントのphase1として紹介 されていたから

Slide 15

Slide 15 text

Q.その中でも、データモデリングに注力しているのはなぜか じゃ 全ての企業様の採用課題に最もマッチす るサービスをスピーディーに提供する 採用課題: 各事業営業担当の商談情報集約・可視化 企業属性データ集約 最もマッチする解決策: 企業属性データ、過去の実績データ、採用課 題などから、仮説立案・最適化アルゴリズム の構築、検証 スピーディー: 正確に、なるべく早く ソリューションで 解決可能な領域 A.「データモデリング」がミッションと現状のギャップを埋めるためにマストだとおもったから 顧客に提供する価値 業務プロセス 業務プロセスを データに写像する 写像したデータを システムに蓄積 データ分析 インテリジェンス 共通言語

Slide 16

Slide 16 text

データモデル データモデルがない世界 業務① 業務② 業務③ 売上 派生 業務 派生 業務 派生 業務 業務の世界(概念) システムの世界(物理) データ活用上生じる課題 業務④ 【調査工数がかかる】 ✓ 「業務②が売上に与える影響を調べて」と言われ たが、業務②のデータはどこにあるんだ? 【集計ミス】 ✓ 売上計算のテーブル間違えてたみたい・・・ 【エンジニアがいないと分析できない】 ✓ すぐ集計したいのに、SQLを解読しないとテーブル の関係性がわからない! 【非データ人材の業務知識が活用されない】 ✓ 業務課題解決に一番近い「ドメインエキスパー ト」がデータで仮説立案・仮説検証ができない 【データ人材が直ぐに本領発揮でない】 ✓ せっかくjoinしたデータサイエンティストが、業務理 解ではなく、SQLの読解に時間を費やす システムの言葉で記述 一意でない ビジネススピード

Slide 17

Slide 17 text

データモデル データモデルがある世界 業務① 業務② 業務③ 売上 派生 業務 派生 業務 派生 業務 業務の世界(概念) システムの世界(物理) 業務④ 業務① 業務② 集計値 業務の関係性でリレーションをはる ≒ 業務の世界を物理にマッピング ① 企業・組織にどのようなデータがあるか把握するため ② 全体を俯瞰したデータ配置とデータの流れを見える ようにするため ③ データ基盤内のデータ構造を見えるようにするため ④ データのあるべき姿を設計し、今後データに関して 取り組むべきことを決めるため(不足や冗長) ⑤ データ要件をシステム開発者に正しく伝えるため (ビジネスとエンジニアの共通言語) ⑥ システム保守を効率よく行うため データモデリングの目的 売上予測がしたい!

Slide 18

Slide 18 text

データモデル Q.その中でも、データモデリングに注力しているのはなぜか じゃ 別回答.チーム(データマネジメント、エンジニア、ビジネス)で目的・目線をそろえたかったから データマネジメント=データの価値を維持・向上させて、デー タでコアドメインの価値を最大限に引き出すプログラム活動 コアドメイン=「中心的事業領域」であり、その部分がな くなると商売がなり立たなくなってしまうような事業領域 我々データまわりの人間は、フロントから遠いので、 「課題感」に実感がない。重要なのはドメインを駆動して いくこと、でありそのためのデータマネジメントである、 という目線

Slide 19

Slide 19 text

本日のまとめと課題 最後に

Slide 20

Slide 20 text

20 1 2 3 4月からデータマネジメント組織を立ち上げてみました 右も左もわからず、DAMAピラミッドのフェーズ1から始めてみました データ活用推進のためには、業務プロセスをデータに写像する 必要があるなと思い、データモデリングに注力しました 4 理想には、まだまだ遠いです まとめ

Slide 21

Slide 21 text

21 1 2 3 組織づくり:業務・システム変化を報連相する横断的組織作り 維持体制:ドキュメント(モデル)が腐らないような維持体制 データ活用の文化醸成:結局使ってもらえなければ意味がない 4 仲間が足りない!!(絶賛仲間を募集中) 課題

Slide 22

Slide 22 text

22 課題+: • データモデリングは銀の弾丸ではない • ただし、データ活用を推進する上での課題解決にはつながりそう • 得られるメリットに比例して、労力がかかるので長期的かつ継続的な 活動と捉えるのがよさそう

Slide 23

Slide 23 text

23 Appendix How to Prepare Data Modeling

Slide 24

Slide 24 text

そもそも、データモデリングとは何か、すごく簡単に説明します • データモデリングとは、データに関する要件の明確化や、実装範囲の決定を目的に、 データモデルを作成すること • ここでいうデータモデルとは、あらかじめ定めた様式に従ってデータの名称や定義、デー タ同士の関係性などを記述したもの 定義 想定成果物 • 概念データモデル:企業の現実をそのまま写し取ったモデル • 論理データモデル:概念データモデルにデータ要件(主要属性や関係性)を追加 したモデル • 物理データモデル:論理データモデルをベースにシステム実装を想定した詳細モデル • データ定義書とその作成プロセス ※データ定義:ドメイン定義、エンティティ定義、データ項目定義、コード定義、 コード値定義の総称 (business) Metadata

Slide 25

Slide 25 text

そもそも、データモデリングとは何か、すごく簡単に説明します 参照:概念・論理・物理データモデルの違いは人によって異なる?データ総研の考え方をご紹介 https://jp.drinet.co.jp/blog/modeling_dri 概念 論理 物理 目安:経営者がみてわかる 目安:業務担当者がみてわかる 目安:システム担当者がみてわかる

Slide 26

Slide 26 text

まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 面接 契約 求人要件 ヒアリング 求職者様の ご紹介 問い合わせ 決定 請求 BPMNがない場合は、ビジネスサイドと「一緒に作りましょう」が第一歩? No 業務リスト 1 問い合わせ対応 2 契約 3 求人要件のヒアリング 4 求職者様のご紹介 5 進捗確認 6 請求 1 BPMN図から業務リスを作成

Slide 27

Slide 27 text

まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 企業様 営業 アドバイザー No 業務リスト 業務リストの詳細化 業務上利用しているシステム 1 問い合わせ対応 メール 2 契約 2-1顧客IDの発行 基幹システムAの●●画面 (例えば顧客管理画面など) 2-2顧客情報の登録 基幹システムA××画面 3 求人要件のヒアリング 営業ツール 4 求職者様のご紹介 基幹システムB 5 進捗確認 営業ツール 6 請求 決済システム 2 業務リストをもとにビジネスサイドにヒアリング。リストの詳細化とデータ生成元システムの確認

Slide 28

Slide 28 text

まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 営業 アドバイザー No 業務リスト 業務リストの詳 細化 業務上利用してい るシステム 2 契約 2-1顧客IDの発 行 基幹システムAの ●●画面 2-2顧客情報の 登録 基幹システムAの ××画面 3 業務上利用しているシステムの、I/Oをヒアリング 実際に画面を見せてもらいます ここでの入力項目=「業務データの生成元」 メイン業務で利用している画面の入力項目をリスト化していきます 基幹システムAの●●画面

Slide 29

Slide 29 text

まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー No 業務リス ト 業務リストの 詳細化 業務上利用して いるシステム 入力項目一覧 テーブル名 物理カラム名 2 契約 2-1顧客IDの 発行 基幹システムA の●●画面 法人●●ID Table_001 YYYY 契約年月 Table_100 XXXX 契約タイプ a_table_09 AAAA 契約者情報 b_table_08 ZZZZ 更新年月 c_table_010 DDDD 4 主要画面の入力項目をリスト化し、既存DB上のデータテーブルとカラムと照合していきます

Slide 30

Slide 30 text

まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー No 業務リス ト 業務リストの 詳細化 業務上利用して いるシステム 入力項目一覧 物理カラム名 データ項目定義 2 契約 2-1顧客IDの 発行 基幹システムA の●●画面 法人●●ID YYYY 新規契約した顧客に システムから発番さ れる7桁のコードです。 重複はありません。 契約年月 XXXX 契約タイプ AAAA 契約者情報 ZZZZ 更新年月 DDDD 5 以下のリストに、データ定義(ドメイン定義、エンティティ定義、データ項目定義、コード定義、 コード値定義)を追記していきます(ここまではまだ、できていません‥‥)

Slide 31

Slide 31 text

まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 6 業務リストに対応して、これら調査を実施していきます。 正直めちゃくちゃ大変ですが、メイン業務を押さえると山を越えた!という感じになっていきます No 業務リスト 業務詳細化 業務シ ステム 入力項目 テーブル名 カラム名 データ定義 1 問い合わせ対 応 2 契約 3 求人要件のヒ アリング 4 求職者様のご 紹介 5 進捗確認 6 請求 これらを抽出したら、いざデータモデリングへ! 概念データモデルから物理データモデリングまで一気通貫で進めます (データ定義はめちゃくちゃ大変なので、データモデリングが終わっ たら、対応していきます)

Slide 32

Slide 32 text

まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 7 メタデータの収集・管理&データ統合のために、troccoのPoCをはじめました!