Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データモデリングからはじめるデータマネジメント

たなまい
November 13, 2023

 データモデリングからはじめるデータマネジメント

パーソルキャリア株式会社
#DDDM
#データマネジメント

たなまい

November 13, 2023
Tweet

Transcript

  1. doda会員登録者数 821万人 求人数 24万件以上 登録者数・求人数業界最大級 転職を希望する個人顧客様 採用を希望する法人顧客様へ サービス展開 toC・toBの両手型サービス 展開しているサービスは

    20以上 転職支援サービス 中途採用 新卒採用 求人メディアの運営などを通じた人材紹介サービスを展開する会社 →人材紹介サービス:専任のキャリアアドバイザーが転職希望者様と法人顧客様のマッチングを行うサービス ※2023年9月末時点
  2. 法人顧客 様への価 値発揮を 総合的に 推進する 人材紹介サービス 専門領域人材紹介 More… 個人顧客 様への価

    値発揮を 総合的に 推進する マーケティング インサイド セールス プロダクト 開発 テクノロジー 推進 全ての企業様の採用課題に最もマッチするサービスをスピーディーに提供する クライアント P&M本部 クライアントP&M本部は、今年4月に(再)組成されました
  3. コアドメイン/サブドメイン • コアドメインとは、「中心的事業領域」であり、その部分がなくなると商売がなり立たなくなってしまうような 事業領域を指しています。 • 一方で、サブドメインとはコアドメインをなり立たせるために必要ではあるが、競争優位性や差別化を図るポイ ントにはならない領域を指しています。 • つまり、選択と集中をするために、コア/サブドメインを区別する必要があります。 コアドメイン

    (競争優位性を担保する企業のアイデンティティ) サブドメイン ドメイン • 事業課題を技術的なソリューションで解決できる場合、最もシステム 化する価値の高い領域(理想) そのために・・・ • コアドメインがなんであるのか • コアドメインの範囲はどこなのか • システム上ではコアのロジックとサブのロジックを密結合・散在させない ・・・・ようにしななければな、とまず最初に考えました。 【参考】 エリック・エヴァンス 『エリック・エヴァンスのドメイン駆動設計』 ヴォーン・ヴァーノン『実践ドメイン駆動設計』
  4. データマネジメントに必要な最小単位で、はじめてみました データマネジメント エンジニア ドメインエキスパート 人数: • 1名+サポート2~3名 役割: • 各種調整

    • 組織づくり • データ調査 • データモデリング スキルセット: • 分析をしている人 • 基本的なRDBの知識がある人 人数: • 2名+サポート1名 役割: • 基盤構築系全般 • ソリューション選定 スキルセット: • 基盤構築できる人 • データモデリングに詳しい人 人数: • 応じて変動 役割: • 業務について伝授 • 業務上の暗黙知につい て伝授 • 経理・法務などの専門 知識について伝授 スキルセット: • 業務スペシャリスト 分析する人/整える人 仕組みを考える人 直接価値を出す人 現体制/ 役割
  5. “DMBOK”を参考に以下の2つの知識領域(+2)から、はじめてみました ※本日は、時間がないので『DAMA-DMBOK』とその各知識領域の詳細そのものについては割愛しますが、DMBOKとは、データマネ ジメントに関する知識を体系立ててまとめた書籍です。( https://www.dama-japan.org/Introduction.html ) Data Storage & Operations (+2)

    (Business)Metadata Data Security Data Modeling & Design “超”概略定義 • データに関する要件の明確化や、実装範囲の決 定を目的に、データモデルを作成すること • データの価値を最大化するために、格納される データを設計し、実装し、サポートすること • メタデータ(データ定義)の管理 • データの信頼性担保と権限管理 データ構造を設計して 安全に 蓄積する
  6. Q.なぜ、 2つの知識領域(+2)から手を出したのか Peter Aiken のフレームワーク https://blogs.sap.com/2020/07/09/why-hr-data- management-strategy-is-important-in-your-hr-transformation/ Data Storage &

    Operations (20%) Data Security (20%) Data Modeling & Design (30%) Business MetaData(10%) ビジネス戦略(=データ要件) A.DMBOKでデータマネジメントのphase1として紹介 されていたから
  7. Q.その中でも、データモデリングに注力しているのはなぜか じゃ 全ての企業様の採用課題に最もマッチす るサービスをスピーディーに提供する 採用課題: 各事業営業担当の商談情報集約・可視化 企業属性データ集約 最もマッチする解決策: 企業属性データ、過去の実績データ、採用課 題などから、仮説立案・最適化アルゴリズム

    の構築、検証 スピーディー: 正確に、なるべく早く ソリューションで 解決可能な領域 A.「データモデリング」がミッションと現状のギャップを埋めるためにマストだとおもったから 顧客に提供する価値 業務プロセス 業務プロセスを データに写像する 写像したデータを システムに蓄積 データ分析 インテリジェンス 共通言語
  8. データモデル データモデルがない世界 業務① 業務② 業務③ 売上 派生 業務 派生 業務

    派生 業務 業務の世界(概念) システムの世界(物理) データ活用上生じる課題 業務④ 【調査工数がかかる】 ✓ 「業務②が売上に与える影響を調べて」と言われ たが、業務②のデータはどこにあるんだ? 【集計ミス】 ✓ 売上計算のテーブル間違えてたみたい・・・ 【エンジニアがいないと分析できない】 ✓ すぐ集計したいのに、SQLを解読しないとテーブル の関係性がわからない! 【非データ人材の業務知識が活用されない】 ✓ 業務課題解決に一番近い「ドメインエキスパー ト」がデータで仮説立案・仮説検証ができない 【データ人材が直ぐに本領発揮でない】 ✓ せっかくjoinしたデータサイエンティストが、業務理 解ではなく、SQLの読解に時間を費やす システムの言葉で記述 一意でない ビジネススピード
  9. データモデル データモデルがある世界 業務① 業務② 業務③ 売上 派生 業務 派生 業務

    派生 業務 業務の世界(概念) システムの世界(物理) 業務④ 業務① 業務② 集計値 業務の関係性でリレーションをはる ≒ 業務の世界を物理にマッピング ① 企業・組織にどのようなデータがあるか把握するため ② 全体を俯瞰したデータ配置とデータの流れを見える ようにするため ③ データ基盤内のデータ構造を見えるようにするため ④ データのあるべき姿を設計し、今後データに関して 取り組むべきことを決めるため(不足や冗長) ⑤ データ要件をシステム開発者に正しく伝えるため (ビジネスとエンジニアの共通言語) ⑥ システム保守を効率よく行うため データモデリングの目的 売上予測がしたい!
  10. そもそも、データモデリングとは何か、すごく簡単に説明します • データモデリングとは、データに関する要件の明確化や、実装範囲の決定を目的に、 データモデルを作成すること • ここでいうデータモデルとは、あらかじめ定めた様式に従ってデータの名称や定義、デー タ同士の関係性などを記述したもの 定義 想定成果物 •

    概念データモデル:企業の現実をそのまま写し取ったモデル • 論理データモデル:概念データモデルにデータ要件(主要属性や関係性)を追加 したモデル • 物理データモデル:論理データモデルをベースにシステム実装を想定した詳細モデル • データ定義書とその作成プロセス ※データ定義:ドメイン定義、エンティティ定義、データ項目定義、コード定義、 コード値定義の総称 (business) Metadata
  11. まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 面接 契約 求人要件 ヒアリング 求職者様の ご紹介

    問い合わせ 決定 請求 BPMNがない場合は、ビジネスサイドと「一緒に作りましょう」が第一歩? No 業務リスト 1 問い合わせ対応 2 契約 3 求人要件のヒアリング 4 求職者様のご紹介 5 進捗確認 6 請求 1 BPMN図から業務リスを作成
  12. まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 企業様 営業 アドバイザー No 業務リスト 業務リストの詳細化

    業務上利用しているシステム 1 問い合わせ対応 メール 2 契約 2-1顧客IDの発行 基幹システムAの••画面 (例えば顧客管理画面など) 2-2顧客情報の登録 基幹システムA××画面 3 求人要件のヒアリング 営業ツール 4 求職者様のご紹介 基幹システムB 5 進捗確認 営業ツール 6 請求 決済システム 2 業務リストをもとにビジネスサイドにヒアリング。リストの詳細化とデータ生成元システムの確認
  13. まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 営業 アドバイザー No 業務リスト 業務リストの詳 細化

    業務上利用してい るシステム 2 契約 2-1顧客IDの発 行 基幹システムAの ••画面 2-2顧客情報の 登録 基幹システムAの ××画面 3 業務上利用しているシステムの、I/Oをヒアリング 実際に画面を見せてもらいます ここでの入力項目=「業務データの生成元」 メイン業務で利用している画面の入力項目をリスト化していきます 基幹システムAの••画面
  14. まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー No 業務リス ト 業務リストの 詳細化 業務上利用して

    いるシステム 入力項目一覧 テーブル名 物理カラム名 2 契約 2-1顧客IDの 発行 基幹システムA の••画面 法人••ID Table_001 YYYY 契約年月 Table_100 XXXX 契約タイプ a_table_09 AAAA 契約者情報 b_table_08 ZZZZ 更新年月 c_table_010 DDDD 4 主要画面の入力項目をリスト化し、既存DB上のデータテーブルとカラムと照合していきます
  15. まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー No 業務リス ト 業務リストの 詳細化 業務上利用して

    いるシステム 入力項目一覧 物理カラム名 データ項目定義 2 契約 2-1顧客IDの 発行 基幹システムA の••画面 法人••ID YYYY 新規契約した顧客に システムから発番さ れる7桁のコードです。 重複はありません。 契約年月 XXXX 契約タイプ AAAA 契約者情報 ZZZZ 更新年月 DDDD 5 以下のリストに、データ定義(ドメイン定義、エンティティ定義、データ項目定義、コード定義、 コード値定義)を追記していきます(ここまではまだ、できていません‥‥)
  16. まず、お手元にご用意いただくものは、各事業(部)のBPMN図 企業様 営業 アドバイザー 6 業務リストに対応して、これら調査を実施していきます。 正直めちゃくちゃ大変ですが、メイン業務を押さえると山を越えた!という感じになっていきます No 業務リスト 業務詳細化

    業務シ ステム 入力項目 テーブル名 カラム名 データ定義 1 問い合わせ対 応 2 契約 3 求人要件のヒ アリング 4 求職者様のご 紹介 5 進捗確認 6 請求 これらを抽出したら、いざデータモデリングへ! 概念データモデルから物理データモデリングまで一気通貫で進めます (データ定義はめちゃくちゃ大変なので、データモデリングが終わっ たら、対応していきます)