2020/1/31(金) に開催したExploratory データサイエンス勉強会#12の株式会社リクルートマーケティングパートナーズ様のご登壇資料です。
データ組織の課題とコラボレーション・サーバーデータイノベーション推進部 データ分析グループ 林田 祐輝株式会社リクルートマーケティングパートナーズ2020.01.31 Exploratory データサイエンス勉強会 & ミートアップ
View Slide
ソーシャルゲーム開発会社でデータ分析基盤の整備や分析を担当した後、2017年に株式会社リクルートマーケティングパートナーズに入社。スタディサプリ全般に関わる分析、チームマネジメントを担当。Exploratory歴は1年ちょい。林田 祐輝 @yukihayashidaCareerJob
今日話すこと● (弊社の)データ組織の課題● コラボレーション・サーバーについての導入事例 見解話さないこと● データ分析事例● Exploratory デスクトップについてのHow toこんな使い方もあるよとか懇親会で教えてもらえる嬉しいです。はじめに
Agenda | 010203弊社のご紹介データ組織と課題コラボレーション・サーバーを考える
弊社のご紹介01
弊社のサービス出会い・結婚・出産 自動車 学習・進路
日本 インドネシア フィリピン メキシコ対象学年 小・中学校 高校 大学・社会人 高校 高校 中学オンラインビデオ(B to C)オンラインビデオ&アセスメント(B to B to C)オンラインコーチング各国で様々なサービスラインナップにて事業展開をしていますパーソナルコーチプランサービスラインナップ
データ組織と課題02
組織について海外支店 Quipper Global(Indonesia, etc) ToC日本支店 スタディサプリ ENGLISH横断的技術プロジェクトDataSRE学校向けWeb Mobile Design PMWeb Design PMデータ組織
企画提案研究開発実証実験性能改善本番実装本番運用効果検証要因分析施策立案データ分析データサイエンティストデータプロダクト開発データエンジニアデータプロダクト企画データリサーチエンジニア
企画提案研究開発実証実験性能改善本番実装本番運用データ分析データサイエンティストデータプロダクト開発データエンジニアデータプロダクト企画データリサーチエンジニアExploratoryデスクトップを活用
伴走分析データ抽出分析中学講座・小学講座大学受験講座・高校講座スタディサプリ日常英会話TOEIC L&RTEST 対策スタディサプリENGLISHモニタリング(Looker)学校導入ビジネス英語効果検証事業KPI学習効果効果検証事業KPI学習効果BizDev ・ PMマーケティング 高校営業BizDev ・ PMマーケティング
日常英会話TOEIC L&RTEST 対策ビジネス英語伴走分析データ抽出分析スタディサプリスタディサプリENGLISHモニタリング(Looker)学校導入効果検証事業KPI学習効果効果検証事業KPI学習効果BizDev ・ PMマーケティング 高校営業BizDev ・ PMマーケティングサービス単位でアナリストを配置事業の成り立ちや紐づくデータベースが異なるため、チームが分かれている。中学講座・小学講座大学受験講座・高校講座
抽出業務の比重が多く、そこに業務が集中して探索的なデータ分析に割く時間が取れない。抽出が効率化する環境作りや、非アナリストによる抽出スキル育成など。テーブルの定義、ドメイン知識、各指標の定義・出し方など、分析をする上での前提知識がまとまっていない。知っている人からの口伝に依存している。データ分析組織の課題ナレッジ共有 データ知識 抽出業務の効率化過去に行った分析結果の参照や、サービス間での分析結果のシェアを行えること。分析手法、流れ、クエリなどが追いづらい。
データ分析組織の課題分析Handbookの作成 ドキュメント整備 SQL講習会の実施抽出業務の比重が多く、そこに業務が集中して探索的なデータ分析に割く時間が取れない。抽出が効率化する環境作りや、非アナリストによる抽出スキル育成など。テーブルの定義、ドメイン知識、各指標の定義・出し方など、分析をする上での前提知識がまとまっていない。知っている人からの口伝に依存している。ナレッジ共有 データ知識 抽出業務の効率化過去に行った分析結果の参照や、サービス間での分析結果のシェアを行えること。分析手法、流れ、クエリなどが追いづらい。
【ナレッジ共有】分析Handbook
【データ知識】ドキュメント整備Github の WikiGoogleスプレッドシート
【抽出業務の効率化】SQL講習会
● ナレッジ共有 ☀○ 分析Handbookには月1、2本のペースで追加。○ タグ検索なども自分たちのお手製。(少しメンテナンスが必要)● ドキュメント整備 ☂○ テーブル定義などはまとめたが、完全に網羅できてない。○ いくつかのツールが乱立している。(スプレッドシート、 Github Wiki、Tettra)○ 作ったドキュメントがどこにあるか問題。● SQL講習会 ☁○ 実施直後の満足度は高い。○ 業務要件によってデータに触れる機会に波があり、スキルが定着しない。各改善策の実施状況
コラボレーション・サーバーを考える03
コラボレーション・サーバー:インサイト
コラボレーション・サーバー:データカタログ
データカタログ● データ定義をデータカタログにする● みんな大好きサマリビューが使えるのも◎コラボレーション・サーバーに期待できることナレッジ共有 データ知識 抽出業務の効率化コラボレーション・サーバー Exploratory デスクトップインサイト・ノート● ノートは弊社のHandbookと同じMarkdown構造。● タグや検索が使えるので、アクセス性も高い。● View数やLike数などでエンゲージメントも確認できる。● EDFのDownloadで、他の人の作業内容を追随可能。ツール教育● SQL + データラングリング + 集計で、データ抽出ができる人が増やせる。データカタログ● よく使う便利なデータマート + スケジュール + Download機能で、SQL使わずExplroratoryだけでデータ出しが完結するかも。
● ツールが増えること(ドキュメント管理ツールと捉えた時)○ 分析ツールまでなら、アナリスト個人で完結できる。○ ドキュメントやナレッジ共有ツールなら、他の組織と統合するか?論があがる。■ 既存のドキュメントとの統合。■ 開発組織のドキュメントを混ぜるのか?会社のルールなども盛り込むか?● 他分析ツールとの統合・棲み分け○ コラボレーション・サーバーへの編集には、 Exploratory(Desktop)を使うしかない。○ R Studio / Jupyter Notebook / Tableauなど、使用している他ツールとの棲み分け。○ メンバーによって業務での使用頻度が異なるので、 Exploratoryを同じ粒度で使用しない。■ ノート編集だけで十分なユーザー → Exploratoryの機能はtoo much。(一方で)コラボレーション・サーバーで検討が必要な点
まとめ期待すること良かったこと➔ Exploratoryがないと始まらないので、他のツールとの併用できること。➔ パワポなど既存の分析報告をExploratoryのノートに楽に変換できる。➔ ドキュメント問題は組織全体の課題に及ぶので、分析ナレッジを超えた使い道。➔ コラボレーションサーバの一部だけ編集可のライセンスが欲しい。(ノートだけとか)➔ インサイト(特にノート)などは、既にある分析ナレッジを共有するのに便利。➔ データカタログを使えば、定義書+サマリビューでの確認で、データの理解が早そう。➔ EDFのDownloadで、他のラングリングやアナリティクスを追随できる。➔ インサイトやデータを整備する仕組みがない(ex. 立ち上げたばかり)では助かる。
コラボレーション・サーバーはExploratoryデスクトップと異なり、今までの分析業務フローを大きく変えるものだと感じた。組織内外での連携強化など、他の分析ツールにないメリットがあり、導入に当たる障害・懸念などを今後解決していけるかに期待したい。まとめ
ご静聴ありがとうございました