Slide 1

Slide 1 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 1 データマネジメント2025 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 〜エンタメ・テック企業GENDAが事例と共に明かす〜 2025.03.07 株式会社GENDA IT戦略部 データサイエンティスト 戸松真太朗 データエンジニア 山口 歩夢

Slide 2

Slide 2 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 2 戸松真太朗(Shintaro Tomatsu) 所属 自己紹介 株式会社GENDA IT戦略部 データチーム データサイエンティスト 需要予測、レコメンドシステム、A/Bテスト、画像解析、人流解析、 ベイズモデリング、etc… 業務

Slide 3

Slide 3 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 3 本日のテーマ:どちらが先か? 組織でのデータ整備と活用のジレンマ データマネジメント永遠のテーマ「どのようにデータの整備と活用を開始し進めていくか」 データ整備側: データエンジニア、データアーキテクト… データ活用側: データアナリスト、データサイエンティスト、… 未整備で活用できない 活用シーンがないから整備できない

Slide 4

Slide 4 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 4 データ整備とデータ活用は、どちらだけから始めると失敗する データ整備が先か? データ活用が先か? データ整備側から: ● 活用できないデータの整備や追加 ○ 活用シーン不明なマスターデータ項目が大量に…… ● 活用に耐えないデータ基盤やパイプライン ○ 活用でリアルタイムなデータ同期が必要だが、作った基盤が耐えない…… → データ活用ができず失敗(ちゃんと活用してくれ!) データ活用側から: ● データがないため活用できず ○ データがないからどうにもならない ● 無理な仮定での無意味な結論 ○ データの欠損があったので、その項目は考慮してません…… → データ活用自体が失敗(ちゃんとデータ整備してくれ!)

Slide 5

Slide 5 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 5 本日の登壇内容 目次 ——— 登壇者 戸松 ——— 1. 弊社GENDAとデータチームの紹介 2. データ整備・活用を同時に進めるモックアップ・ボトムアップ戦略 3. 事例1:アミューズメント施設「GiGO」での景品発注自動化プロジェクトPAO (Prize Alllocation Optimizer) ——— 登壇者 山口 ——— 4. 事例2:メタデータ整備に活用するデータカタログとRAG×LLM Chatbot

Slide 6

Slide 6 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 6 世界中の人々の人生をより楽しく 人が人らしく生きるために「楽しさ」は不可欠と考え、 「世界中の人々の人生をより楽しくしたい」という Aspiration (アスピレー ション=大志) を掲げています。 当社が掲げる大志と野望 Aspiration / 大志 2040年世界一のエンタメ企業に Speed is King、GRIT and GRIT、Enjoy our Journey、 3つのバリューを行動指針に、日々新しい挑戦を続け、 世界一のエンターテイメント企業を目指しています。 Vision / 野望

Slide 7

Slide 7 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 7 エンタメ経済圏の完成 国内事業の着実な業績拡大と積極的な海外事業展開がもたらす連続的な成長を基盤にし、 エンタメ・プラットフォームとエンタメ・コンテンツの両領域におけるM&Aを積み重ね、 グローバルに展開する「GENDAエンタメ経済圏」の構築を目指します。 このようにして、事業ポートフォリオを盤石にすることで、 「千変万化」なエンタメ事業のボラティリティを超えていけると考えています 。 当社の成長戦略 =「エンタメ業界でのM&A」

Slide 8

Slide 8 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 8 GENDAグループ概観

Slide 9

Slide 9 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 9 純粋持株会社のGENDAにテックメンバーが所属 各社に所属しないことで横断的に開発を実施している テクノロジー組織概要 etc. GENDAテックメンバー 正社員+業務委託 各社の開発支援 正社員+業務委託 正社員+業務委託 正社員+業務委託 正社員+業務委託

Slide 10

Slide 10 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 10 データチーム:GENDAのデータ活用を技術とデータについての専門的な知識で支援 データチーム概要 データマネジメント データエンジニアリング データサイエンス マネージャー データエンジニアリング:50% データサイエンス   :50% データマネジメント  : 0% データチーム内での仮想所属比率 チーム内での仮想的な部門所属により、柔軟でワンストップなデータ活用支援を実現

Slide 11

Slide 11 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 11 データ整備・活用を同時に進めるモックアップ・ボトムアップ戦略 データ整備・活用を同時に進める GENDAでのデータ整備・活用は、トップダウンでのボトムアップ戦略である「モックアップ・ボトムアップ戦略」を採用 → アジャイル的なデータ整備・活用戦略 モックアップ・ボトムアップ戦略 活用現場を起点に モックアップ (プロトタイプ) を作成 活用現場を起点にモックアップを短期間(3ヶ月以内)で作成、現場で効果が出たものをブラッシュアップ 現場導入 ブラッシュアップ 続行判断 データ整備 ↔ データ活用 効果あり 効果なし

Slide 12

Slide 12 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 12 組織カルチャーとの親和性 GENDA 3つのValue Speed is King スピードが大事、ではなく「スピード最優先」 GRIT and GRIT 「やり抜く力」こそが、成功の最も重要な要素 Enjoy our Journey 皆で一緒にこの道のりを楽しみ、より大きな夢を叶えよう GENDAは「スピードある成長」を会社・社員が共に目指し続けており、その行動指針として「GENDAバリュー」を掲げている

Slide 13

Slide 13 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 13 アミューズメント施設「GiGO」での景品発注自動化プロジェクトPAO (Prize Alllocation Optimizer) 事例1:プロジェクトPAOの概要 ③どの店に、何を、何箱割振るか 景品調達フロー メーカーから送られてくる 数千種類の景品リスト 全店舗まとめて、景品リストのうち どの景品を仕入れるかを決定 景品需要、在庫状況、 店舗計画に従い、発注量を決定 どの店舗に 何箱割り振るかを決定 ②何箱買うか ①何を買うか ⓪景品リスト PAO施策対象 アミューズメント施設「GiGO」でのプライズゲームの「景品調達」のDX化への取り組み。 プライズゲームは2015年以降から急速に成長を開始したため、現場対応が追い付いておらず、手作業の限界を迎えていた。 DX化の第一段階として、景品調達フローの最終工程である「調達した景品の全国各店舗への割振」を解決した。

Slide 14

Slide 14 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 14 プロジェクトPAOの詳細 事例1:プロジェクトPAOの流れ 約2ヶ月でモックアップ作成 データチーム BizDev 現場担当者 ブラッシュアップ 効果あり 現場導入 問題設定の決定 業務のヒアリング 要件定義 ロジック開発 データ整備 現場ツール開発 ︙ 経営層への報告 関係各所への調整 制約条件の追加 不具合修正 現場オペレーションの修正 リプレイス検討 ︙ データチームとBizDev(事業開発で価値向上させる部署)での協業プロジェクト 「調達した景品の全国各店舗への割振」はエクセルと担当者の手作業で行っており、毎月40時間ほどの作業が必要だった。 また、店舗数と景品数増加に伴い時間が足りず完全な配分が行えないことがあり、「機会損失(人気商品の不足を菓子景品などで補填)」 と「廃棄(景品の過剰配送)」が発生していた。この問題を解決するため、作業の自動化を行った。

Slide 15

Slide 15 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 15 プロジェクトPAOの成果:景品廃棄及び機会損失を極小化 事例1:プロジェクトPAOの成果 施策を実施した244店舗の内、9割の227店舗において「店舗ごとの景品発注計画」と「実際の景品割振り」を96-100%に収めることに成功。 自動化により、機会損失の減少による売上向上、および景品廃棄の減少が今後も期待できる。 標準偏差:32.6 0 店舗数 機会損失 人気商品の不足を定番景品で補填していた Before After 店舗ごとの発注計画 vs 実際の割振の乖離率(%) 標準偏差:4.9 75 71 85 81 90 86 95 91 100 96 105 101 110 106 115 111 - 120 116 125 121 - 126+ 廃棄 景品が多く配送されすぎたので廃棄していた 店舗ごとの発注計画 vs 実際の割振の乖離率(%) 店舗数 0 0 0 0 227 5 7 1 0 0 4 1 9 34 57 46 28 18 10 4 25 12 店舗ごとの発注計画 vs 実際の割振の乖離率(%) 店舗数 0 0 76 80 - - - - - - - - - 75 71 70% 85 81 90 86 95 91 100 96 105 101 110 106 115 111 - 120 116 125 121 - 126+ 76 80 - - - - - - - - - - 0 0 70% - 0

Slide 16

Slide 16 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 16 登壇者交代 山口

Slide 17

Slide 17 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 17 データマネジメント2025 データカタログとRAG×LLM Chatbotで行うメタデータ整備と活用

Slide 18

Slide 18 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 18 山口歩夢 所属 株式会社GENDA データエンジニア 経歴 インプレスホールディングス 株式会社リットーミュージックにて、デジマートの出店営業 株式会社ICEにて、データ基盤の構築・運用・保守 など 発信 著書   :Streamlit入門 Pythonで学ぶデータ可視化&アプリ開発入門 ブログ   :https://qiita.com/Ayumu-y X(旧Twitter) :https://x.com/Yamaguchi_aaaaa Snowflake Squad:https://www.snowflake.com/en/snowflake-squad/ 自己紹介

Slide 19

Slide 19 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 19 背景と課題 GENDAのデータ管理・活用の課題 グループ間のシナジーを生むため横断的なデータ活用推進したいが、 メタデータが整備されておらず、データ利用者が望むデータにアクセスすることが困難

Slide 20

Slide 20 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 20 課題への取り組み結果 データ管理・活用の課題 01 メタデータ整備 グループ全体でデータを有効活用するためには、社内に散在しているメタデータの収集および整備が必要であった。 特に、一部のデータは担当者のみが定義を把握している場合があり、そのような情報は担当者にテキスト化して共有してもらう必要 があった。データカタログの有用性を実感してもらうことで、担当者と周囲の協力を得ることができた。 02 データカタログ導入 社内ではデータカタログの存在自体が広く認知されていなかったため、その有用性を実感してもらう必要があった。 まずは学習コストが低く、必要最低限の機能を備えたデータカタログを導入した。 利用者が慣れた段階で、より多機能なOSSデータカタログへ段階的に移行することで、抵抗感を抑えつつスムーズな導入ができた。 03 Chatbot導入 データカタログを導入したものの、一部のユーザーには活用にハードルがあり、担当者への問い合わせが多く発生した。 そこで、Chatbotを導入することで活用のハードルを下げ、利用者からの質問にも迅速に対応できる仕組みを構築した。 ユーザーの利便性が向上するとともに、担当者の工数削減も実現できた。

Slide 21

Slide 21 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 21 GENDA当初のメタデータ管理・整理の負の循環 メタデータ整備とデータカタログ導入の課題 メタデータ整備 Excelや口頭で伝わっており カタログに入れるメタデータがない メタデータの活用シーンが無く 整備できない・整備する必要性が無い データカタログ導入

Slide 22

Slide 22 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 22 モックアップとしてデータカタログを作成 データカタログのモックアップを作成 カタログの対象を限定 グループ全体のデータのメタデータを全て集めるには時間がかかるため、メタデータの所在が把握できており、 活用ニーズが高いデータに限定した データカタログの開発 社内ではデータカタログの存在自体が広く認知されていなかったため、その有用性を実感してもらう必要があった。 ユーザーへの学習コストが低く、必要最低限の機能を備えたデータカタログを導入するため開発した。

Slide 23

Slide 23 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 1. データエンジニアのみで開発可能 ○ PythonやSQLを中心に開発可能 2. 必要最小限の機能を迅速に開発できる必要 ○ UI ○ アプリを操作するウィジェット ○ メタデータの取得・表示 3. Snowflake(既存データ基盤)との親和性 ○ Snowflakeの機能を使ったメタデータやアプリの管理が可能 1. PythonベースのWEBアプリケーションフレームワーク ○ Pythonのみでアプリ開発が可能なため、WEB開発の知識が不要 2. データ系アプリのプロトタイピングに最適 ○ 様々な関数を提供しており、迅速な開発が可能 ■ テキストやデータを関数に渡すのみで表示可能 ■ インタラクティブなウィジェットを関数一つで生成可能 3. Snowflakeとの高い親和性 ○ Snowflake社がStreamlitを買収 ■ コードをSnowflakeに貼り付けるのみでデプロイ ■ SnowflakeのCOMMENT機能を活用してメタデータ管理 23 Streamlitによるデータカタログの開発 データカタログの導入 Streamlitの特徴 データカタログ開発で満たすべき条件

Slide 24

Slide 24 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 24 カタログで確認できる情報 ● 指定したスキーマ内のテーブル一覧 ● テーブルのカラム情報 ● テーブル内のデータのプレビュー データカタログの導入

Slide 25

Slide 25 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 25 メタデータ管理 データカタログの導入 ● yamlファイルで定義し、SnowflakeのCOMMENT機能を用いてメタデータを更新 ● GitHub Actionsを活用したCI/CDを実装 ○ yamlをmainにmergeすると同時にメタデータを更新 name: "EMPLOYEES" comment: "従業員マスター " change_tracking: false columns: - name: "EMPLOYEE_ID" type: "NUMBER(38,0)" comment: "従業員ID。このテーブルの主キー。 " nullable: false - name: "FIRST_NAME" type: "VARCHAR(50)" comment: "名前。" nullable: true - name: "LAST_NAME" type: "VARCHAR(50)" comment: "苗字。" nullable: true - name: "SALARY" type: "NUMBER(10,2)" comment: "給与。ドル単位で格納。 " nullable: true - name: "HIRE_DATE" type: "DATE" comment: "雇用した日。日本時間にて格納。 " nullable: true

Slide 26

Slide 26 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 26 データカタログの有用性の認知と必要な機能の洗い出しが行えた 導入結果 データアナリストが活用 ● データアナリストがデータ分析時にデータカタログを活用する体制が整備 ○ ER図が欲しい、利用例を知りたいなどの要望 プロダクトのエンジニアからの共有体制 ● プロダクトのエンジニアにメタデータの重要性が周知でき、メタデータの最新情報の共有体制が整備 実現したいことを再認識 ● データ異常発生時の迅速な原因特定 ● 集計値に一貫性のあるデータマートの提供 ● データマート作成者の管理 ● メタデータを継続的な更新

Slide 27

Slide 27 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 27 OpenMetadataへのリプレイス 導入結果 データカタログの有用性が認知されたので、OSSへのリプレイス 新たに追加された機能 ● データリネージ機能 ○ データに問題が発生した際、影響範囲や調査箇所を瞬時に特定可能 ● ER図 ○ データ間のリレーションを視覚的に把握し、構造理解を促進 ● データ品質機能 ○ データの正確性と信頼性を維持し、常に正しいデータを利用可能 ● データマートの作成者把握 ○ データの問い合わせ先を明確化 ● ユーザーのコメント機能 ○ データの利用例やカラムの詳細を記載できるようにし、メタデータのブラッシュアップ

Slide 28

Slide 28 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 28 実現したかったこと Chatbotの導入 ● データ分析に使用すべきテーブルの所在を質問可能 ○ ユーザーが必要なテーブルを迅速に特定できるようにし、担当者への問い合わせを削減 ● 気軽に質問ができる窓口の提供 ○ ユーザーが担当者の工数を気にせず、繰り返し質問できる環境を整備 ● 瞬時に回答を提供 ○ 待ち時間をなくし、データ分析のスピードと効率を向上 ※AWSを中心に開発

Slide 29

Slide 29 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 29 実装機能 Chatbotの導入 ● SlackのチャンネルにChatbotを統合 ○ メンションで瞬時に返信 ○ 特定のアプリを開く手間がなく、手軽に利用可能 ● 前の質問内容を参照するように実装 ○ 実際の会話のように前の質問を参考に回答を得られる ● RAGによる社内情報への対応 ○ 会社のプロダクト情報や社内用語を含む質問にも回答可能 ● 愛着が沸くキャラクターに仕上げた ○ ユーザーの回答への期待値を下げる効果も……

Slide 30

Slide 30 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 30 現在の状況 現在の状況と今後の展望 ● OpenMetadataのdescriptionにコメントをもらう体制を整えている ○ 現状、メタデータは簡潔な文章で定義されている ○ 今後は、テーブルやカラムの用途などの詳細を付け加える ■ アナリストが現場でメタデータをどのように活用しているのか ■ 不足している情報はないか 今後の展望 ● 以下の取り組みを継続 ○ OpenMetadataのdescriptionにコメントをブラッシュアップ ○ SnowflakeのCOMMENT機能で管理しているメタデータを更新する ○ 更新後のメタデータを基にRAGを更新 ● メタデータをRAGのナレッジベースに組み込むための、データパイプラインを実装する

Slide 31

Slide 31 text

© GENDA Inc. 「Speed is King」な活用現場を起点としたデータ整備・活用戦略 31 まとめ 全体のまとめ 01 現場課題やニーズから始まるデータ活用 データ活用を効果的に進めるためには、現場の課題やニーズを出発点としたアプローチが重要である。 実業務で直面している課題や改善点を起点にデータの整備・活用を進めることで、現場に即した実践的な活用が可能となる。 02 「Speed is King」なプロジェクト促進 スピードを最優先にしてデータ整備・活用を進めることが重要である。 モックアップで早期に結果を提示することで、プロジェクト初期の関心が高いタイミングで関係者の信頼を獲得できる。 仮に失敗しても、失うコストは最小限に抑えられるため、次の改善に迅速に活かすことができる。 03 データ整備と活用の両面からの推進が不可欠 データ活用の効果を最大化するためには、データ整備と活用の両面からの推進が不可欠である。 データ整備と活用は切り離せない関係にあり、どちらか一方だけで完結することは稀である。 整備されたデータがあるからこそ有益な活用が可能となり、活用のニーズがあるからこそ適切にデータを整備できる。