Upgrade to Pro — share decks privately, control downloads, hide ads and more …

FivetranとGoogleCloudにより実現するセールスデータの統合と分析への活用

 FivetranとGoogleCloudにより実現するセールスデータの統合と分析への活用

Masahiro ISHII

June 19, 2024
Tweet

More Decks by Masahiro ISHII

Other Decks in Technology

Transcript

  1. 自己紹介 石井 正浩 / @marufeuille 2022/8 タイミー入社 & DREチームJoin データ基盤の開発・運用やってます。最近はデータ

    コントラクトの実現を悩んでます。 趣味でコーヒー☕淹れたり、煎ったりしてます
  2. タイミーの実績 スキマ バイト No.1 ※1 ※2 [調査方法]インターネット調査 [調査期間]2024 年 2

    月 9 日~11 日 [調査概要]スキマバイトアプリサービスの実態調査 [調査 委託先]株式会社マクロミル 利用率 ・リピート率 ※1 ※2 導入事業者数 98,000企業 ワーカー数 700万人
  3. 7

  4. アプリケーション上のデータ ワーカー様 ワーカー 登録した DB ユーザ情報が 生成される 案件に マッチングした マッチング情報が

    生成される 実際に働いた 働いたという情報が 生成される クライアント企業様 ワーカー様 求人を出す 求人情報が 生成される ワーカー様と やりとりをする やり取りに関する情報が 生成される
  5. データ活用の例 利用状況をみてク ライアント企業様 へリテンション施 策が打ちたい セールス DS/エンジニア クライアント企業 担当者様 勤務する

    ワーカー様の 一覧がほしい ワーカー様へ案件の レコメンドがしたい 必要なデータの鮮度(例) 先月分が揃っていれば良い 前日分まで揃っていてほしい 直前1時間分がほしい
  6. 全体感 DB app log クライアント企業様 ワーカー様 Timee App 管理画面 行動

    履歴 DB app log 行動 履歴 タイミーのセールス/CS データ 基盤 商談 その他 外部データ Timee App 様々なデータソースを統合し、ユーザニーズに合わせて提供していく必要がある 様々なニーズ
  7. 課題感 状態 データソースの追加が大変 embulkのプラグインとして公開されていればすぐ。な い場合自前でプラグインを書かないといけない(ruby or javaだが、チーム内でメンテナンスは困難) インフラ管理が大変 インフラ(OSレベル)の管理が必要。 障害調査が大変

    ログが読みにくい... SaaSからのデータ連携が大変 SaaSはエンドポイント単位でAPI limitが制限されてい るが、1つのSaaSから複数オブジェクトを転送する場 合にアクセスの制御ができない 一言でいうと、運用がツライ
  8. DataStreamによるニアリアルタイム連携 BigQuery Datastream DataLake Timee App Embulk Timee App 導入前

    導入後 データが 生成される データ基盤上で 利用可能になる SLO 1日 SLO 15分
  9. DataStreamによる導入前後の業務の変化 BigQuery Datastream DataLake Timee App Embulk Timee App 導入前

    導入後 よりリアルタイム性が高い業務 SLO1日で十分な業務 一本化