Slide 1

Slide 1 text

不動産情報サイトにおける リアルタイムデータ分析基盤の活用 Jagu'e'r データ利活用分科会 LT大会 2023.12.07

Slide 2

Slide 2 text

目次 1. 自己紹介/弊社紹介 2. 本日話すこと/話さないこと 3. なぜリアルタイムデータが必要なのか 4. 分析基盤のシステム構成 5. リアルタイムデータの活用方法 6. その他

Slide 3

Slide 3 text

自己紹介 杉山 隆(Takashi Sugiyama) 3 • 所属 • 株式会社Red Frasco • 職種 • データエンジニア/MLエンジニア • 技術 • Google Cloud, Python, Golang • よく使うGCPサービス • Cloud Composer, Dataflow, Dataproc, BigQuery, ...

Slide 4

Slide 4 text

株式会社Red Frasco • https://www.red-frasco.com/ • 不動産業界に特化したプロダクト開発・集客支援を実施 • 今回はとある 賃貸不動産情報サイトのデータ分析基盤 のお話 4

Slide 5

Slide 5 text

本日話すこと/話さないこと • 話すこと • データ分析基盤内のリアルタイムデータについて • 目的、取得方法、活用方法・・・等 • 話さないこと • データ分析基盤のその他の仕組み • データパイプライン、DWH、BI・・・等 5

Slide 6

Slide 6 text

なぜリアルタイムデータが必要なのか(1/2) • 賃貸不動産情報サイトにおけるユーザーの行動パターン • ほとんどのユーザは初回訪問でコンバージョン(Web での問い合わせ 等)する • そのためセッション内での訴求が重要となり、行動ログ等のユーザ データをリアルタイムで取得、さらにセッション内の行動を計測でき るようにすることが望まれる 6

Slide 7

Slide 7 text

なぜリアルタイムデータが必要なのか(2/2) • Google アナリティクスでは要件を満たせなかった • BigQuery Export 機能 • エクスポートされるタイミングが遅い(要件定義時は翌日午後) • 最近早くなってきた(翌日早朝)が、それでも要件を満たしていない • ストリーミングエクスポート機能 • 翌日以降にエクスポートされたレコードと比較すると、2〜3割程度のレコード欠 損がある?(※今回の対象サイトだけかもしれません。ご参考まで。) • 将来的には GA からリアルタイムデータへの移行を検討 • UA → GA4 の移行に伴う作業が大変だった・・・ 7

Slide 8

Slide 8 text

分析基盤のシステム構成(1/6) 全体構成 8

Slide 9

Slide 9 text

分析基盤のシステム構成(2/6) 本日話す内容はここ! 9

Slide 10

Slide 10 text

分析基盤のシステム構成(3/6) 拡大 + 開発中の機能も表示 10

Slide 11

Slide 11 text

分析基盤のシステム構成(4/6) • ログを取得する仕組みは API で提供 • アプリケーション側に極力手が入らないように • 開発チームとの分離 • バックエンドは Cloud Run で構築 • 運用が楽! 11

Slide 12

Slide 12 text

分析基盤のシステム構成(5/6) • ログの保存先は2つ • Cloud Run → Bigtable • ログをすぐに利用したい場合の保存先 • 過去2日分を保存 • Cloud Run → Pub/Sub → Dataflow → BigQuery • 通常利用の保存先 • 過去分全てを保存 12

Slide 13

Slide 13 text

分析基盤のシステム構成(6/6) • 当初は Bigtable ではなく Firestore を利用していたが 書き込みエラーが多く出たため変更 • エラー原因は結局分からず・・・ • 「500/50/5」ルールはきちんと守っていた・・・はず・・・ 13

Slide 14

Slide 14 text

リアルタイムデータの活用方法 • レコメンド機能 • ユーザーの行動ログを基にした User-to-Item レコメンド • 直近(同一セッション内)の行動ログを特徴量として使用 • 鋭意開発中! 14

Slide 15

Slide 15 text

その他 • その他の機能も機会があれば話させてください! もしくは懇親会で! • Embedding を使用した Item-to-Item レコメンド • Cloud Composer のノウハウ • Redash on GKE・・・等 15

Slide 16

Slide 16 text

Thanks for listening!