Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データマネジメント新年会 〜去年のしくじりを共有し、正月ボケを解消する〜

データマネジメント新年会 〜去年のしくじりを共有し、正月ボケを解消する〜

2024年 1月 10日(水)にSansan・クリエイティブサーベイ・Uniposの3社で開催したイベントに弊社インターン永井が登壇した際の資料です。

CREATIVE SURVEY Inc.

January 11, 2024
Tweet

More Decks by CREATIVE SURVEY Inc.

Other Decks in Technology

Transcript

  1. Confidential © CREATIVE SURVEY Outline 1. 導⼊ 2. 去年いちばんのしくじり 3.

    しくじりの背景 4. しくじりについての深掘り 5. 今後しくじらないために 6. 今後の展望
  2. © 2023 CREATIVE SURVEY INC. All Rights Reserved. 自己紹介 永井僚

    クリエイティブサーベイ株式会社 開発部インターン生 2019年4月明治大学総合数理学部入学。 2023年4月同大学院先端数理科学研究科入学。 ロボットシステムインテグレーション研究室にて、移動ロ ボットや深層強化学習、ネットワークロボットに関する研 究を行っている。 2023年1月よりエンジニアインターン生1号として現職。
  3. Confidential © CREATIVE SURVEY 概要 主要株主 許認可 会社概要 会社名:クリエイティブサーベイ株式会社 設 ⽴:2014年7⽉

    代表取締役:⽯野 真吾 Sansan株式会社 、株式会社フォーデジット プライバシーマーク(Pマーク)取得 国際規格ISO27001(ISMS)取得 Salesforce 正規パートナー Confidential © CREATIVE SURVEY
  4. Confidential © CREATIVE SURVEY データチームとは • データ分析基盤の構築 ◦ プロダクトが保存しているDBのデータをデータ分析基盤に統合
 •

    データ利活⽤の促進に向けた動き ◦ 契約企業ごとの解約リスクのスコアリング ◦ ヒアリングからダッシュボード作成
  5. Confidential © CREATIVE SURVEY 参画時期 2023年1月~2023年2月 (期間:2ヶ月) 担当工程 企画 /

    要件定義 / 設計 / コーディング / 運用・保守 / データ分析 担当職種 データエンジニア / データアナリスト 去年いちばんのしくじりの概要
  6. Confidential © CREATIVE SURVEY ダッシュボード作成 • Amazon QuickSight上での可視化 ◦ トレンド分析とファネル分析のダッシュボードの作成

    データ分析基盤の整備 • 60名規模が扱うデータ分析基盤の構築 ◦ データの自動更新 課題に対するアプローチ
  7. Confidential © CREATIVE SURVEY プロジェクトを通して⾒つけた予期せぬ課題‧反省点 • 現場の方々に浸透しなかった ◦ S&Mチームの上司にしか課題のヒアリングを行わなかった ◦

    上司の方しか求めていなかった、スプシで十分だった • 現場レベルの人の巻き込みが足りなかった ◦ 他部署との連携は、自部署完結のプロジェクトに比べて障壁が増える ▪ (まずは自部署でデータ利活用の経験を積んでも良かった) • ヒアリングからダッシュボード作成を行うまでに時間が掛かってしまった ◦ S&Mチームのタイムリーな要求分析に応えられなかった • データエンジニア業務とアナリスト業務の両立がかなり大変 ◦ 工数増え、時間が掛かった主な原因の一つ
  8. Confidential © CREATIVE SURVEY セルフサービスモデルの取り入れ方 • 基盤整理までの業務(データパイプライン、データウェアハウス層の整備) ◦ 主な担当:データエンジニア ◦

    実際にやったこと:dbtの導入 • それ以降のデータ分析業務 ◦ 主な担当:各現場の担当者 ◦ 実際にやったこと:ダッシュボード作成 今後しくじらないために
  9. Confidential © CREATIVE SURVEY dbtの実装 • RDSデータソースを整える ◦ 開発部や他部署の⽅が使いやすいようにデータソースを整備 •

    Incrementalモデルを用いたデータの増分更新の実装 ◦ 洗い替えによるデータロードのコスト削減 データパイプラインの整備
  10. Confidential © CREATIVE SURVEY • 顧客のプロダクトデータダッシュボード作成のフローの仕組み化 1. ローカル環境でSQLが通ることを確認 2. 「依頼に必要な項⽬」を埋めてデータチームとSREチームの担当者にメンション

    3. データチームのSQLレビューを経て、必要があれば現場に修正依頼を出す 4. 開発の⽅でsnowflakeへテーブルのインポート、完了次第、開発から連絡 • 依頼に必要な項⽬ a. 解析に利⽤する⽬的 i. 例:顧客の解約リスクの定量化のために、ユーザーのログイン頻度をヘルススコアに追加したいため。 b. インポートしてほしいテーブル c. 実⾏する予定のSQL(Docker環境で通ることが確認できたSQL) d. いつまでに必要か(期限) 実際にCSの⽅々とやったこと
  11. Confidential © CREATIVE SURVEY データ分析基盤の整備
 • プロダクトにデータ分析基盤を活用する動きを進めている • データソースの拡充 ◦

    Salesforce上のデータソースもdbtで管理できるように
 データ利活用の促進 • データ分析基盤の布教 • CSだけでなく、他部署にもデータ活用を推進する 今後の展望