Slide 1

Slide 1 text

GA4 x dbt Jagu'e'r LT 2023/02 GA4の生ログの弱点と、それを補うdbtパッケージを試してみ た

Slide 2

Slide 2 text

小林 寛和 株式会社primeNumber 取締役執行役員 CPO hiro_koba_jp 慶應義塾大学卒業後、2014年より株式会社リブセンス へ入社し、データエンジニアとして同社分析基盤 立ち上げをリード。 trocco®のプロダクト発案者で、現プロダクト責任者。 Data Engineering Studyの共同主催者も務める。

Slide 3

Slide 3 text

Agenda GA4の生ログの概要と、課題 1 dbtでGA4の生ログをより使いやすく 2 まとめ 3

Slide 4

Slide 4 text

GA4の生ログの概要と、課題

Slide 5

Slide 5 text

GA4のさまざまな使い方 Google AnalyticsのブラウザUIから見る Looker Studioとかでつないで可視化する GA4のBigQuery Exportを使い、生ログからデータ分析 ©2023 primeNumber Inc. All Rights Reserved. Confidential. 5

Slide 6

Slide 6 text

GA4のさまざまな使い方 Google AnalyticsのブラウザUIから見る Looker Studioとかでつないで可視化する GA4のBigQuery Exportを使い、生ログからデータ分析 ©2023 primeNumber Inc. All Rights Reserved. Confidential. 6

Slide 7

Slide 7 text

GA4の生ログの弱点 データ構造が扱いにくい event_timestampがUNIXTIMEなので変換が必要 ログがいつ来るのか分からない・タイムラグがある ©2023 primeNumber Inc. All Rights Reserved. Confidential. 7

Slide 8

Slide 8 text

データ構造が扱いにくい

Slide 9

Slide 9 text

集計しようとすると・・・

Slide 10

Slide 10 text

GA4の生ログを使いやすくするために、 dbtというツールを使ってみた

Slide 11

Slide 11 text

先程の弱点を解決するには ひたすらクエリで頑張る 1 扱いやすい形に整形してから使う 2 ©2023 primeNumber Inc. All Rights Reserved. Confidential. 11

Slide 12

Slide 12 text

先程の弱点を解決するには ひたすらクエリで頑張る 1 扱いやすい形に整形してから使う 2 ©2023 primeNumber Inc. All Rights Reserved. Confidential. 12

Slide 13

Slide 13 text

データウェアハウス層を作っ て 扱いやすくしたい もう少し専門用語でいうと ©2023 primeNumber Inc. All Rights Reserved. Confidential. 13

Slide 14

Slide 14 text

GA4のスキーマなんて全世界共通なんだし、 誰かがいい感じの作ってくれてるんじゃない の?

Slide 15

Slide 15 text

dbt-ga4なるものが!!!

Slide 16

Slide 16 text

とりあえず使ってみ た

Slide 17

Slide 17 text

導入手順 dbtのプロジェクトを作る packages.ymlにdbt-ga4パッケージを追加 dbt_project.ymlでご自身のGA4の設定を記載 dbt deps実行 dbt build実行 1 2 3 4 5 ©2023 primeNumber Inc. All Rights Reserved. Confidential. 17

Slide 18

Slide 18 text

めちゃくちゃ楽

Slide 19

Slide 19 text

成果物を、もう少し詳し く

Slide 20

Slide 20 text

全体像 BigQuery Export GA4 BigQuery生ログテーブル (データレイク層) 整形後のテーブル (データウェアハウス 層) dbt-ga4 ©2023 primeNumber Inc. All Rights Reserved. Confidential. 20

Slide 21

Slide 21 text

No content

Slide 22

Slide 22 text

No content

Slide 23

Slide 23 text

スタースキーマっぽくなってる dim_sessions dim_users fct_session fct_pages ©2023 primeNumber Inc. All Rights Reserved. Confidential. 23

Slide 24

Slide 24 text

No content

Slide 25

Slide 25 text

No content

Slide 26

Slide 26 text

No content

Slide 27

Slide 27 text

できればこうして欲しかった 1行がページビュー単位など、イベント別にテ ーブルを用意する dim_sessionに情報もたせ過ぎない パーティショニング対応 タイムラグ問題は解決していない・・・ 探索的な分析をする最小粒度なので デバイスや国・地域などもディメンションテーブル化 ©2023 primeNumber Inc. All Rights Reserved. Confidential. 27

Slide 28

Slide 28 text

最後に宣伝を・・・

Slide 29

Slide 29 text

No content

Slide 30

Slide 30 text

trocco「Web行動ログ収集SDK」 Web分析に必要なデータを取得 1タグでPV、イベント、メール開封ログなどが収集可能 GAと同じデータが生ログで、任意のDWHに蓄積 セッションやチャネルの定義はGAを踏襲 お好きなDWH(BigQuery/Redshift)に10分以内に転送 BigQueryのパーティショニングにも各種対応 広告アトリビューション分析が可能 重複のない、正確なコンバージョン数の集計に必要な アトリビューション分析が行なえます。 広告アトリビューション分析の詳細は担当営業まで お問い合わせ下さい ©2023 primeNumber Inc. All Rights Reserved. Confidential. 30

Slide 31

Slide 31 text

この辺の話に興味ある方、つながってくださ い! (DMもウェルカムです) Twitter: @hiro_koba_jp ©2023 primeNumber Inc. All Rights Reserved. Confidential. 31

Slide 32

Slide 32 text

ご清聴ありがとうございました