Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データ組織の課題と コラボレーション・サーバー
Search
Ikuya Murasato
January 31, 2020
Business
0
9.3k
データ組織の課題と コラボレーション・サーバー
2020/1/31(金) に開催したExploratory データサイエンス勉強会#12の株式会社リクルートマーケティングパートナーズ様のご登壇資料です。
Ikuya Murasato
January 31, 2020
Tweet
Share
More Decks by Ikuya Murasato
See All by Ikuya Murasato
トピックモデル分析を活用した問合せ業務の効率化
ikuyam
1
270
回帰分析の活用による新商品の販売力予測
ikuyam
1
180
生存分析モデルを利用したLineのブロック要因分析
ikuyam
0
120
自動車トラブルと気象条件などの探索的データ分析
ikuyam
0
100
データサイエンス「も」使えるチェンジメーカー輩出への挑戦
ikuyam
0
450
ExploratoryとRによる全学データサイエンス教育
ikuyam
0
660
エンゲージメント向上のための人事制度改革 - 管理部門におけるExploratoryの活用
ikuyam
0
2k
「学ぶ」分析技術から「使う」分析技術へ - Exploratoryによるドリル演習
ikuyam
0
480
データサイエンス入門教育の現場から - 46歳新任教員2年間の苦闘
ikuyam
0
590
Other Decks in Business
See All in Business
なぜ、あのPdMは「時間がない」と言わないのか? ~元エンジニアPdMが実践する「ドキュメント化 x MCP」の全貌~
sam8helloworld
0
140
週4社員しながら個人開発にベットする / Betting on Personal Projects While Working a Four-Day Week
kohii00
4
3.1k
Где вы ошибётесь и что с этим сделать
alexanderbyndyu
0
400
【新卒採用資料】Natee Company Deck _202512
nateehr
0
1.4k
変化を抱擁するシステムの作り方〜「人が増えても速くならない」より
kuranuki
8
2.8k
【ニトエル株式会社】会社紹介資料
hr_nitoel
0
180
組織としてのプロダクトマネジメント力を高める〜Sansanの実践と課題〜
sansantech
PRO
3
130
jinjer recruiting pitch
jinjer_official
0
120k
Company Profile
katsuegu23
2
12k
MEEM_Company_Deck202512.pdf
info_meem
0
590
Chatwork×BPaaS×AIエージェントで創る 次世代コーディネート基盤
kubell_hr
0
3k
「要はバランス」を見極める - ADR実践で目指す技術的卓越への道 / It Depends: Practicing ADRs Toward Technical Excellence
ewa
0
680
Featured
See All Featured
Building AI with AI
inesmontani
PRO
1
610
Designing for humans not robots
tammielis
254
26k
Claude Code のすすめ
schroneko
67
210k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.3k
AI: The stuff that nobody shows you
jnunemaker
PRO
1
160
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.6k
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
330
Paper Plane (Part 1)
katiecoart
PRO
0
2.8k
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
250
Transcript
データ組織の課題と コラボレーション・サーバー データイノベーション推進部 データ分析グループ 林田 祐輝 株式会社リクルートマーケティングパートナーズ 2020.01.31 Exploratory データサイエンス勉強会
& ミートアップ
ソーシャルゲーム開発会社でデータ分析基盤の整 備や分析を担当した後、2017年に株式会社リク ルートマーケティングパートナーズに入社。 スタディサプリ全般に関わる分析、チームマネジメ ントを担当。 Exploratory歴は1年ちょい。 林田 祐輝 @yukihayashida Career
Job
今日話すこと • (弊社の)データ組織の課題 • コラボレーション・サーバーについての導入事例 見解 話さないこと • データ分析事例 •
Exploratory デスクトップについてのHow to こんな使い方もあるよとか懇親会で教えてもらえる嬉しいです。 はじめに
Agenda | 01 02 03 弊社のご紹介 データ組織と課題 コラボレーション・サーバーを考える
弊社のご紹介 01
弊社のサービス 出会い・結婚・出産 自動車 学習・進路
弊社のサービス 出会い・結婚・出産 自動車 学習・進路
日本 インドネシア フィリピン メキシコ 対象学年 小・中学校 高校 大学・社会人 高校 高校
中学 オンラインビデオ (B to C) オンラインビデオ& アセスメント (B to B to C) オンラインコーチング 各国で様々なサービスラインナップにて事業展開をしています パーソナルコーチプラン サービスラインナップ
データ組織と課題 02
組織について 海外支店 Quipper Global(Indonesia, etc) ToC 日本支店 スタディサプリ ENGLISH 横断的技術
プロジェクト Data SRE 学校向け Web Mobile Design PM Web Design PM データ組織
企画提案 研究開発 実証実験 性能改善 本番実装 本番運用 効果検証 要因分析 施策立案 データ分析
データサイエンティスト データプロダクト 開発 データエンジニア データプロダクト 企画 データリサーチエンジニア
企画提案 研究開発 実証実験 性能改善 本番実装 本番運用 データ分析 データサイエンティスト データプロダクト 開発
データエンジニア データプロダクト 企画 データリサーチエンジニア Exploratory デスクトップを活用
伴走分析 データ抽出 分 析 中学講座・小学講座 大学受験講座・高校講座 スタディサプリ 日常 英会話 TOEIC
L&R TEST 対策 スタディサプリ ENGLISH モニタリング(Looker) 学校導入 ビジネス 英語 効果検証 事業KPI 学習効果 効果検証 事業KPI 学習効果 BizDev ・ PM マーケティング 高校営業 BizDev ・ PM マーケティング
日常 英会話 TOEIC L&R TEST 対策 ビジネス 英語 伴走分析 データ抽出
分 析 スタディサプリ スタディサプリ ENGLISH モニタリング(Looker) 学校導入 効果検証 事業KPI 学習効果 効果検証 事業KPI 学習効果 BizDev ・ PM マーケティング 高校営業 BizDev ・ PM マーケティング サービス単位で アナリストを配置 事業の成り立ちや紐づくデータベー スが異なるため、チームが分かれて いる。 中学講座・小学講座 大学受験講座・高校講座
抽出業務の比重が多く、そこに業務が 集中して探索的なデータ分析に割く時間 が取れない。 抽出が効率化する環境作りや、非アナリ ストによる抽出スキル育成など。 テーブルの定義、ドメイン知識、各指標 の定義・出し方など、分析をする上での 前提知識がまとまっていない。 知っている人からの口伝に依存してい る。
データ分析組織の課題 ナレッジ共有 データ知識 抽出業務の効率化 過去に行った分析結果の参照や、サー ビス間での分析結果のシェアを行えるこ と。 分析手法、流れ、クエリなどが追いづら い。
データ分析組織の課題 分析Handbookの作成 ドキュメント整備 SQL講習会の実施 抽出業務の比重が多く、そこに業務が 集中して探索的なデータ分析に割く時間 が取れない。 抽出が効率化する環境作りや、非アナリ ストによる抽出スキル育成など。 テーブルの定義、ドメイン知識、各指標
の定義・出し方など、分析をする上での 前提知識がまとまっていない。 知っている人からの口伝に依存してい る。 ナレッジ共有 データ知識 抽出業務の効率化 過去に行った分析結果の参照や、サー ビス間での分析結果のシェアを行えるこ と。 分析手法、流れ、クエリなどが追いづら い。
【ナレッジ共有】分析Handbook
【データ知識】ドキュメント整備 Github の Wiki Google スプレッドシート
【抽出業務の効率化】SQL講習会
• ナレッジ共有 ☀ ◦ 分析Handbookには月1、2本のペースで追加。 ◦ タグ検索なども自分たちのお手製。(少しメンテナンスが必要) • ドキュメント整備 ☂
◦ テーブル定義などはまとめたが、完全に網羅できてない。 ◦ いくつかのツールが乱立している。(スプレッドシート、 Github Wiki、Tettra) ◦ 作ったドキュメントがどこにあるか問題。 • SQL講習会 ☁ ◦ 実施直後の満足度は高い。 ◦ 業務要件によってデータに触れる機会に波があり、スキルが定着しない。 各改善策の実施状況
コラボレーション・サーバーを考える 03
コラボレーション・サーバー:インサイト
コラボレーション・サーバー:データカタログ
データカタログ • データ定義をデータカタログにする • みんな大好きサマリビューが使えるのも ◎ コラボレーション・サーバーに期待できること ナレッジ共有 データ知識 抽出業務の効率化
コラボレーション・サーバー Exploratory デスクトップ インサイト・ノート • ノートは弊社のHandbookと同じ Markdown構造。 • タグや検索が使えるので、アクセス性も 高い。 • View数やLike数などでエンゲージメント も確認できる。 • EDFのDownloadで、他の人の作業内 容を追随可能。 ツール教育 • SQL + データラングリング + 集計で、 データ抽出ができる人が増やせる。 データカタログ • よく使う便利なデータマート + スケジュー ル + Download機能で、SQL使わず Explroratoryだけでデータ出しが完結 するかも。
• ツールが増えること(ドキュメント管理ツールと捉えた時) ◦ 分析ツールまでなら、アナリスト個人で完結できる。 ◦ ドキュメントやナレッジ共有ツールなら、他の組織と統合するか?論があがる。 ▪ 既存のドキュメントとの統合。 ▪ 開発組織のドキュメントを混ぜるのか?会社のルールなども盛り込むか?
• 他分析ツールとの統合・棲み分け ◦ コラボレーション・サーバーへの編集には、 Exploratory(Desktop)を使うしかない。 ◦ R Studio / Jupyter Notebook / Tableauなど、使用している他ツールとの棲み分け。 ◦ メンバーによって業務での使用頻度が異なるので、 Exploratoryを同じ粒度で使用しない。 ▪ ノート編集だけで十分なユーザー → Exploratoryの機能はtoo much。 (一方で)コラボレーション・サーバーで検討が必要な点
まとめ 期待すること 良かったこと ➔ Exploratoryがないと始まらないので、他のツールとの併用できること。 ➔ パワポなど既存の分析報告をExploratoryのノートに楽に変換できる。 ➔ ドキュメント問題は組織全体の課題に及ぶので、分析ナレッジを超えた使い道。 ➔
コラボレーションサーバの一部だけ編集可のライセンスが欲しい。(ノートだけとか) ➔ インサイト(特にノート)などは、既にある分析ナレッジを共有するのに便利。 ➔ データカタログを使えば、定義書+サマリビューでの確認で、データの理解が早そう。 ➔ EDFのDownloadで、他のラングリングやアナリティクスを追随できる。 ➔ インサイトやデータを整備する仕組みがない(ex. 立ち上げたばかり)では助かる。
コラボレーション・サーバーはExploratoryデスクトップと異なり、 今までの分析業務フローを大きく変えるものだと感じた。 組織内外での連携強化など、他の分析ツールにないメリットがあり、 導入に当たる障害・懸念などを今後解決していけるかに期待したい。 まとめ
ご静聴ありがとうございました