Upgrade to Pro — share decks privately, control downloads, hide ads and more …

BigQuery・Glue・S3・QuickSightの連携をしたお話

 BigQuery・Glue・S3・QuickSightの連携をしたお話

BigQuery・Glue・S3・QuickSightの連携をしたお話

kenkentarou

June 04, 2022
Tweet

More Decks by kenkentarou

Other Decks in Technology

Transcript

  1. 自己紹介 • 臺 健太郎(だい けんたろう) • 出身: 大阪府 • 株式会社Relic

    テクノロジープラットフォームグループ/バックエンドエンジニア • 入社約2年2ヶ月 = エンジニア歴 • 初めてコードを書いたのは2019/9 • 業務でよく触る分野 ◦ Rails,Nuxt.js,AWS,GCP,Docker,CircleCI,GithubAcitons etc • twitter: kenkentaro@kenkentarouu • facebook: https://www.facebook.com/kentaro.di/
  2. • アプリ側のコードにGoogleAnalyticsのタグを埋め込み • ユーザーがイベントを踏むと発火しデータをGoogleAnalyticsへ送信 • GoogleAnalyticsで取得しているデータをBigQueryに定期的にエクスポートして BigQuery上に永続化しておく • BigQuery上で1日前のデータが入ったテーブルを作成して日々データを追加して いくクエリの定期実行をスケジューリングする(22:30に実行)

    • AWS上でGlueを使いコネクター経由でBigQuery上のテーブルデータをその実行 時点までの全件取得して取り込んでCSV形式に変換してS3へ吐き出す定期実行 のジョブを作成し一度実行 • AWS上でGlueを使いコネクター経由で1日前に追加されたBigQuery上のテーブ ルデータを取り込んでCSV形式に変換してS3へ吐き出す定期実行のジョブを作成 し1日1回実行するようにスケジューリング(23:00に実行) • S3へ置いたCSVデータとQuickSightを連携させる • QuickSight上で連携したCSVデータをとRDSのDBデータとを結合させ一覧表示
  3. アプリサーバー FirebaseAnalytics event送信 - pageviewなどの規定イ ベント - カスタムイベント BigQueryのSQLパラメータを 付加してAPIリクエスト

    アプリサーバーを介して BigQueryの実行結果を受け 取る FirebaseAnalytics BigQuery Google Cloud Platform 連携 ・ネイティブ側はアプリサーバーを介して BigQueryの結果を受け取る ・FAとBigQueryをあらかじめ紐づけておく ネイティブから受け取った BigQueryのSQLパラメータ を使ってBigQueryAPIでリ クエスト 1日一回定期的に FAの データをBigQueryにエクス ポートしてBigQuery上で永 続化
  4. FirebaseAnalytics Google Cloud Platform 1日一回定期的にFAのデータを BigQueryにエクスポートして BigQuery上で永続化 テーブル BigQuery クエリ定期実行

    AWS Glue S3 テーブル生成 (データを日々追加していく) CSV形式へ 変換 ジョブの定期実行の中で S3 へデータを吐き出す CSVデータ を保存 QuickSight データを閲覧 コネクター経 由 Glueのジョブを 定期実行してテーブル データを取り込む RDS 接続 接続
  5. • アプリ側のコードにGoogleAnalyticsのタグを埋め込み • ユーザーがイベントを踏むと発火しデータをGoogleAnalyticsへ送信 • GoogleAnalyticsで取得しているデータをBigQueryに定期的にエクスポートして BigQuery上に永続化しておく • BigQuery上で1日前のデータが入ったテーブルを作成して日々データを追加して いくクエリの定期実行をスケジューリングする(22:30に実行)

    • AWS上でGlueを使いコネクター経由でBigQuery上のテーブルデータをその実行 時点までの全件取得して取り込んでCSV形式に変換してS3へ吐き出す定期実行 のジョブを作成し一度実行 • AWS上でGlueを使いコネクター経由で1日前に追加されたBigQuery上のテーブ ルデータを取り込んでCSV形式に変換してS3へ吐き出す定期実行のジョブを作成 し1日1回実行するようにスケジューリング(23:00に実行) • S3へ置いたCSVデータとQuickSightを連携させる • QuickSight上で連携したCSVデータをとRDSのDBデータとを結合させ一覧表示
  6. QuickSightから見る
 • QuickSightの単位 ◦ 分析 ▪ ダッシュボード ◦ データセット ▪

    データソース(RDSのデータやS3のCSVデータなど) を元にして作成される概念 ◦ データソース ▪ データソースはRDBのデータであったりGlueでS3に 吐き出したデータなど