2023/03/27_『アナリティクスエンジニア』のリアル~リクルートのデータマネジメント、試行錯誤の最前線~での、近藤の講演資料になります
© Recruit Co., Ltd. All Rights Reserved2023年時点でLookerでやっていること、いないこと株式会社リクルート データ推進室 D3M 部近藤 慧2023/03/27
View Slide
© Recruit Co., Ltd. All Rights Reserved今日お話しすること:時代は変わったね、、、って話をします2018● Lookerってのがあるらしいぞ22023● ModernDataStack!● AnalyticsEngineer!(AE)● dbt!dbt!dbt!
© Recruit Co., Ltd. All Rights Reservedお品書き3● 組織の2018->2023● Looker利用の2018->2023● その他AE業務のテーマ● まとめ#recruitdata
© Recruit Co., Ltd. All Rights Reserved自己紹介近藤 慧 (こんどう さとる)所属: まなびデータソリューション部 まなびD3MグループTableau DATA Saber/Lookerは2018年ごろから2022年度よりAnalytics Engineerが職務に4#recruitdata
© Recruit Co., Ltd. All Rights Reserved組織の2018->20235
© Recruit Co., Ltd. All Rights Reserved2018 -> 2023での組織内の変化6まなび領域内データ組織数(グループ格)14DWHサービス数21Looker User数(disable含む)64313
© Recruit Co., Ltd. All Rights Reserved2018 -> 2023での組織内の変化7まなび領域内データ組織数(グループ格)14DWHサービス数21Looker User数(disable含む)64313● 拡大、専門のための分業化が進んでいる● 2022年度よりAnalytics Enginieer職の追加
© Recruit Co., Ltd. All Rights ReservedLookerの振り返り8
© Recruit Co., Ltd. All Rights Reserved当時何を語っていたか & 今一度Lookerとはエンジニアの LOVE が詰まった BI、それが Looker1. 外部の DWH・DB を使うことを前提にしている2. LookML で全てを記述できる3. BI ツールなのに GitHub 連携ができる4. ほとんどの操作を API 経由で実行できる5. 見られている・見られていない指標がすぐわかる6. カスタマー LOVE の溢れるサポートがついてくる9引用)https://blog.studysapuri.jp/entry/2018/06/04/080000
© Recruit Co., Ltd. All Rights Reserved今日の内容エンジニアの LOVE が詰まった BI、それが Looker1. 外部の DWH・DB を使うことを前提にしている2. LookML で全てを記述できる3. BI ツールなのに GitHub 連携ができる4. ほとんどの操作を API 経由で実行できる5. 見られている・見られていない指標がすぐわかる6. カスタマー LOVE の溢れるサポートがついてくる10振り返りテーマ その他テーマ
© Recruit Co., Ltd. All Rights Reserved今日の内容エンジニアの LOVE が詰まった BI、それが Looker1. 外部の DWH・DB を使うことを前提にしている2. LookML で全てを記述できる3. BI ツールなのに GitHub 連携ができる4. ほとんどの操作を API 経由で実行できる5. 見られている・見られていない指標がすぐわかる6. カスタマー LOVE の溢れるサポートがついてくる11振り返りテーマ その他テーマ
© Recruit Co., Ltd. All Rights Reserved「LookML で全てを記述できる」の振り返り2018● measure や dimension といった項目の定義まで LookMLという YAML ベースの書式で記述することが可能○ SQLでのロジック○ ラベル○ PKといっためた情報○ 数値フォーマットなど● 可読性や検索性が向上122023
© Recruit Co., Ltd. All Rights Reserved「LookML で全てを記述できる」の振り返り2018● measure や dimension といった項目の定義まで LookMLという YAML ベースの書式で記述することが可能○ SQLでのロジック○ ラベル○ PKといっためた情報○ 数値フォーマットなど● 可読性や検索性が向上132023● 定義をファイルに、かつ一ヶ所にそのファイルをまとめておいておけるだけで保守性が高いBI・アナリスト業務
© Recruit Co., Ltd. All Rights Reserved「LookML で全てを記述できる」の振り返り2018● measure や dimension といった項目の定義まで LookMLという YAML ベースの書式で記述することが可能○ SQLでのロジック○ ラベル○ PKといっためた情報○ 数値フォーマットなど● 可読性や検索性が向上142023● 定義をファイルに、かつ一ヶ所にそのファイルをまとめておいておけるだけで保守性が高いBI・アナリスト業務定義のキャッチアップや調査の際に一つずつダウンロードして、ファイルを開いて、コメントとロジックから定義を拾って...をやらないで良い。特に5年立って開発されたものが増え、新規メンバーも来て、という時に辛さが少ない。
© Recruit Co., Ltd. All Rights Reserved「LookML で全てを記述できる」の振り返り2018● measure や dimension といった項目の定義まで LookMLという YAML ベースの書式で記述することが可能○ SQLでのロジック○ ラベル○ PKといっためた情報○ 数値フォーマットなど● 可読性や検索性が向上152023● 定義をファイルに、かつ一ヶ所にそのファイルをまとめておいておけるだけで保守性が高い● ファイルの分割や抽象化、テスト定義を一部実施中。(コードやデータの品質担保)AEテーマ
© Recruit Co., Ltd. All Rights Reserved「LookML で全てを記述できる」の振り返り2018● measure や dimension といった項目の定義まで LookMLという YAML ベースの書式で記述することが可能○ SQLでのロジック○ ラベル○ PKといっためた情報○ 数値フォーマットなど● 可読性や検索性が向上162023● 定義をファイルに、かつ一ヶ所にそのファイルをまとめておいておけるだけで保守性が高い● ファイルの分割や抽象化、テスト定義を一部実施中。(コードやデータの品質担保)AEテーマ増えすぎた成果物を管理できるようにしたり、時間が経ってレガシー化したものをリファクタリングする際に特に使うようになった。BI・アナリストだとどうしても事業貢献に引っ張られ、負債を積み上げて苦しむところを、 AEポジションがやっていく。
© Recruit Co., Ltd. All Rights Reserved今日の内容エンジニアの LOVE が詰まった BI、それが Looker1. 外部の DWH・DB を使うことを前提にしている2. LookML で全てを記述できる3. BI ツールなのに GitHub 連携ができる4. ほとんどの操作を API 経由で実行できる5. 見られている・見られていない指標がすぐわかる6. カスタマー LOVE の溢れるサポートがついてくる17振り返りテーマ その他テーマ
© Recruit Co., Ltd. All Rights Reserved「BI ツールなのに GitHub 連携ができる」の振り返り2018● Looker はモデルやビューの定義の変更を自動的に GitHubをはじめとした Git リポジトリに同期● 履歴を追って復元● ブランチでプルリクエストを送ってレビューを経てマージ182023
© Recruit Co., Ltd. All Rights Reserved「BI ツールなのに GitHub 連携ができる」の振り返り2018● Looker はモデルやビューの定義の変更を自動的に GitHubをはじめとした Git リポジトリに同期● 履歴を追って復元● ブランチでプルリクエストを送ってレビューを経てマージ192023● (強制フローにしてあるので当たり前だが)みんなブランチを切って、プルリク出してをやっているBI・アナリスト業務
© Recruit Co., Ltd. All Rights Reserved「BI ツールなのに GitHub 連携ができる」の振り返り2018● Looker はモデルやビューの定義の変更を自動的に GitHubをはじめとした Git リポジトリに同期● 履歴を追って復元● ブランチでプルリクエストを送ってレビューを経てマージ202023● (強制フローにしてあるので当たり前だが)みんなブランチを切って、プルリク出してをやっているBI・アナリスト業務「事業レポート_v1.0_3月最新版」とかに苦しめられないし、デグレしたり消してしまった時に、誰のローカルが一番stableだったけ、、、とかに苦しまないだけ、幸せと言ってももはやポカンとされる。
© Recruit Co., Ltd. All Rights Reserved「BI ツールなのに GitHub 連携ができる」の振り返り2018● Looker はモデルやビューの定義の変更を自動的に GitHubをはじめとした Git リポジトリに同期● 履歴を追って復元● ブランチでプルリクエストを送ってレビューを経てマージ212023● (強制フローにしてあるので当たり前だが)みんなブランチを切って、プルリク出してをやっている● CI/CDでLinterなどを取り入れて、より開発体験やレビュー体験をよりよくできないか、などは検討中AEテーマ
© Recruit Co., Ltd. All Rights Reserved「BI ツールなのに GitHub 連携ができる」の振り返り2018● Looker はモデルやビューの定義の変更を自動的に GitHubをはじめとした Git リポジトリに同期● 履歴を追って復元● ブランチでプルリクエストを送ってレビューを経てマージ222023● (強制フローにしてあるので当たり前だが)みんなブランチを切って、プルリク出してをやっている● CI/CDでLinterなどを取り入れて、より開発体験やレビュー体験をよりよくできないか、などは検討中AEテーマ積み重なった負債で苦しんだ経験から、作る時の負債を少しでも減らしたいが、それを人間がレビューで指摘する時の心理負荷を減少したいという動機がかなりある。これもまた、AEというポジションができたおかげで、検討する余裕ができた。何より、DevOpsなどの考えを取り入れようとする時に「なんで?」と言われないだけで正直動きやすい。。。
© Recruit Co., Ltd. All Rights Reserved今日の内容エンジニアの LOVE が詰まった BI、それが Looker1. 外部の DWH・DB を使うことを前提にしている2. LookML で全てを記述できる3. BI ツールなのに GitHub 連携ができる4. ほとんどの操作を API 経由で実行できる5. 見られている・見られていない指標がすぐわかる6. カスタマー LOVE の溢れるサポートがついてくる23振り返りテーマ その他テーマ
© Recruit Co., Ltd. All Rights Reserved「ほとんどの操作を API 経由で実行できる」の振り返り2018● ダッシュボードの更新、ユーザの管理に到るまでかなりのことがAPI を通して実行可能242023
© Recruit Co., Ltd. All Rights Reserved「ほとんどの操作を API 経由で実行できる」の振り返り2018● ダッシュボードの更新、ユーザの管理に到るまでかなりのことがAPI を通して実行可能252023● あまり使っていないBI・アナリスト業務
© Recruit Co., Ltd. All Rights Reserved「ほとんどの操作を API 経由で実行できる」の振り返り2018● ダッシュボードの更新、ユーザの管理に到るまでかなりのことがAPI を通して実行可能262023● あまり使っていない○ 業務量が少ないため、手動対応で一旦どうにかなっているため○ APIを定期的にキックする仕組みや、その運用に習熟しているわけではないというものあるBI・アナリスト業務
© Recruit Co., Ltd. All Rights Reserved「ほとんどの操作を API 経由で実行できる」の振り返り2018● ダッシュボードの更新、ユーザの管理に到るまでかなりのことがAPI を通して実行可能272023● あまり使っていない○ 業務量が少ないため、手動対応で一旦どうにかなっているため○ APIを定期的にキックする仕組みや、その運用に習熟しているわけではないというものあるBI・アナリスト業務アナリスト兼務のAdminが、APIを用いて、GoogleSpreadsheetなどに出力したり、ユーザーの削除などを実施している。ただ、アナリストからは、「自分たちとは遠い業務」に感じがちで、こういう所から AEの分業化の必要性が高まってきていた。
© Recruit Co., Ltd. All Rights Reserved「ほとんどの操作を API 経由で実行できる」の振り返り2018● ダッシュボードの更新、ユーザの管理に到るまでかなりのことがAPI を通して実行可能282023● あまり使っていない● 業務標準化のため、ユーザ管理/パーミッション管理などをYAML+SDK+APIでできないか検討中AEテーマ
© Recruit Co., Ltd. All Rights Reserved「ほとんどの操作を API 経由で実行できる」の振り返り2018● ダッシュボードの更新、ユーザの管理に到るまでかなりのことがAPI を通して実行可能292023● あまり使っていない● 業務標準化のため、ユーザ管理/パーミッション管理などをYAML+SDK+APIでできないか検討中AEテーマ手動でアナリストが設定して、パーミッションが上手くいってない、などがあった。BI・アナリスト側でここを綺麗にするのは難しいので、AEポジションから、Terraformなどで、管理できないかなどを検討中
© Recruit Co., Ltd. All Rights Reservedその他AEテーマのご紹介30
© Recruit Co., Ltd. All Rights Reservedセマンティックレイヤー:まなびデータソリューション部だけでなく、事業全体の拡大に伴い、よりガバナンスが効いたデータ提供の必要性が高まる。データの利用者数の増加と、SSOTなどのガバナンスがトレードオフにならないように、セマンティックレイヤーはどうあるべきかを、検討中31データ定義(Looker)Dashboard(Looker)slackGoogleSpreadsheetcsvLooker?DBT?データ利用者AEテーマ詳細な分析探索/モニタリングモニタリングポスト出力連携セマンティックレイヤーからの連携組織拡大に伴い、バックグラウンド(データへの慣れ、使うツール)や目的、分析対象の多様化が進む
© Recruit Co., Ltd. All Rights Reservedデータ障害を未然に防ぐ取り組み:運用するデータ/ダッシュボードの増加に伴い、Looker前のTransformation部分での情報共有/品質担保/異常検知の仕組み化の必要性あり。データエンジニアと共同し、複数のツール+自前実装で対応中。32メタデータ基盤(GoogleData Plex)Dashboard基盤(Looker)テスト/監視基盤(DBT)2021実現BigQueryTransformation基盤(Airflow)2022実現Dashboardの観測基盤今後のAEテーマメタデータをDBTのテストに変換schema定義のテスト内容のanomaly detectiontransformmodelingvisualization定義情報の連携observation
© Recruit Co., Ltd. All Rights Reservedまとめ33
© Recruit Co., Ltd. All Rights Reservedまとめ①【Lookerの振り返り】アナリストとしてはもちろん、 AEっぽいことをやる場合でも、Lookerの機能は使えるので、5年経ってもまだまだ使い倒せそうという振り返り。➔ というか、5年たち、色々あったからこそ使い倒さないと辛いことがわかってきているのかも。(正直DBTとかが出てきてくれたから、比較して、ひとまずLookerのこの機能でまずやってみるか、みたいな進め方も多い)②【AE業務】アナリストで辛かったことに他の人が将来苦しまないための打ち手を、AEとしてやっている感じ。➔ AEが必須の職能、とまではまだ言えないけれど、「AEがいる・認められている」組織は、これからくる辛さなどをどうにかしようと思ってくれているということだから、BI・アナリストにとっても良い組織になりそうだな、という所感。34
© Recruit Co., Ltd. All Rights Reserved最後に振り返ってみると、近年では、アナリストたちが草の根でやっていたことの重要度が認識され、AEという名前で呼ばれ始めてる。(弊社は必要性を認識し、ロールとして定義し、増やそうとしてます。)● アナリスト->AE : なりやすそう● SWE,SRE -> AE: これから増えそう● AEスタート:そんなキャリアもありかも、、、え、もういます?35実は、あなたも既にAEかも?
© Recruit Co., Ltd. All Rights ReservedThank You36