Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データの民主化 〜Chatworkのデータ活用の取り組み〜
Search
Ikuya Murasato
May 29, 2020
Business
9.2k
0
Share
データの民主化 〜Chatworkのデータ活用の取り組み〜
2020/5/29(金)に開催したExploratory データサイエンス勉強会#13のChatwork株式会社様のご登壇資料です。
Ikuya Murasato
May 29, 2020
More Decks by Ikuya Murasato
See All by Ikuya Murasato
トピックモデル分析を活用した問合せ業務の効率化
ikuyam
1
300
回帰分析の活用による新商品の販売力予測
ikuyam
1
200
生存分析モデルを利用したLineのブロック要因分析
ikuyam
0
140
自動車トラブルと気象条件などの探索的データ分析
ikuyam
0
120
データサイエンス「も」使えるチェンジメーカー輩出への挑戦
ikuyam
0
480
ExploratoryとRによる全学データサイエンス教育
ikuyam
0
720
エンゲージメント向上のための人事制度改革 - 管理部門におけるExploratoryの活用
ikuyam
0
2.1k
「学ぶ」分析技術から「使う」分析技術へ - Exploratoryによるドリル演習
ikuyam
0
520
データサイエンス入門教育の現場から - 46歳新任教員2年間の苦闘
ikuyam
0
650
Other Decks in Business
See All in Business
メンバーズ会社紹介資料/Members company brochure
members_recruiting
0
36k
AIを意識した経営・執行の設計と実行
kan
4
3.9k
ログラス会社紹介資料 / Loglass Company Deck
loglass2019
17
540k
"分からないまま走る"をやめたら不確実性に向き合えるチームになっていった話 ~開発指標で語るプロセス改善~
bicstone
1
180
Speee_2026年9月期第2四半期 決算説明資料
speee_pr
0
3.3k
PIVOT:BPエントランスブック
sotaro04
0
170
スポンサーブースの企画で 『RubyKaigi Map』を 作った話
aratike
0
300
クラウド人材バンク 会社説明資料
cloudhrbank
0
160
Mercari-Fact-book_en
mercari_inc
2
35k
三井物産グループのデジタル証券~イオン大宮~徹底解説セミナー
c0rp_mdm
PRO
0
1.5k
経営管理について / About Corporate Planning
loglass2019
1
34k
『今日から使える認知行動療法』でみつけた もっと人生をたのしむヒント
mkitahara01985
1
680
Featured
See All Featured
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.3k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
Scaling GitHub
holman
464
140k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.8k
Ethics towards AI in product and experience design
skipperchong
2
300
Bash Introduction
62gerente
615
210k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
2.1k
The Curse of the Amulet
leimatthew05
1
13k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
360
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
300
Transcript
2020.05.29 Exploratory様 データサイエンス勉強会 #13 Chatwork株式会社 プロダクトマネジメント室 プロダクトマネージャー 田中 亜希 データの民主化 〜Chatworkのデータ活用の取り組み〜
目次 2 • 自己紹介 • テーマ「データの民主化」 • SQLの民主化 • BIツール
自己紹介 3 田中 亜希 • Chatworkのグロース施策担当 ◦ ユーザーのアクティベーション ◦ フリープランユーザー有料化 •
Exploratoryの導入など、社内のデータ活用の普及活動 Chatwork 株式会社 プロダクトマネージャー室
01 テーマ「データの民主化」 属人化することの課題 4
データが属人化している状態とは 5 • 例えば ◦ エンジニア(データを記録してくれている・SQL書ける) ◦ データサイエンティスト、データアナリスト(専門家) • 他のメンバーはどんなデータがあるか知らない、知っていても使い方がわからない状態
データをみられるのは社内の一部メンバーのみ
ここでいう「データ」とは 6 • 本来このようなデータを最も活用できる立場にあるのは ◦ プロダクトの企画運営者(プロダクトマネージャー) ◦ カスタマーサクセス ◦ マーケター、セールスなど
• 彼らが自分でデータを使えない状態=データの属人化 プロダクト利用状況 ユーザー属性 セールスリード・商談 各機能がどれくらい 使われているか 登録時期、言語、利 用プラン、業種など 見込み顧客の状況 誰が活用できるか
データが属人化することの課題 7 改善のサイクルが回らない プロダクト リリース ユーザーが使う データを収集 データから学ぶ プロダクトを 改善する
参照:データ・バーチュアス・サイクル ひたすらデータ が溜まっていく ① ② ③ ④ ⑤
誰かに依頼して必要なデータを取得してもらうことはできる。でも・・・ 8 • 一部メンバーに依頼が集中 ◦ 専業のメンバーがいない場合、依頼先のメンバーは本来の業務に集中できない • 例:エンジニアは実装が本務。データ抽出依頼は自然と後回しに・・ 時間がかかってしまう →誰もが自分でデータを使えるようにしたい(データの民主化)
そもそもどんなデータがあるかがわからない • イメージしているものが取得できる・できないを判断できない ◦ 非現実的な依頼になってしまう
02 SQLの民主化 教えて広める 9
Chatworkでの取り組み例 10 • 元々は社内唯一のデータアナリスト(ただし専業ではない)が始めた取り組み ◦ 参加もレクチャーも任意 • カリキュラム(30分4コマくらい) ◦ 社内のデータ分析環境(データベースアーキテクチャ)
◦ 記録されているデータについて(どんなテーブルがあるのか) ◦ SQL概要(サブクエリくらいまで) • 疑問点はチャットでも随時サポート(チャットの会社なので・・) 非エンジニアを対象にしたSQLのレクチャー会の実施
職種で選べる2つのコース 11 コース プロダクトコース セールス・マーケコース 参加者 プロダクトマネージャー デザイナー マーケター インサイドセールス
内容 プロダクトやユーザーのデータ中心 リード(Salesforce、Marketo)の データ中心 • 職種によってよく使うデータが違う • レクチャーのゴール ◦ 実際にSQLをガッツリ書けるようになるよりも、どんなデータが使えて、SQLでどん な抽出ができるのかを理解することがまず重要
03 BIツール ツールを使って簡単に 12
なぜBIツールが必要か 13 データの収集・集計 可視化 • 全てをSQLだけで行うのは難しい ◦ レクチャーだけでは不十分 ◦ 複雑になるほど長大なSQLに
• ダッシュボードツールだけでは不十分 ◦ 例:Redash ▪ リファレンスラインをひく ▪ 箱ヒゲ図 BIツールでできること(一部)
• 某大手BIツールを導入してみた(2019年) ◦ 減っていく利用者 ▪ 定常的に使われていたのは10ライセンス中2ライセンス・・ • 使われなかった要因 ◦ 全てをGUIで操作できるが、最初のデータ読み込みに時間がかかりつまづく
▪ 効率的にデータを読み込むには結局SQLを書く必要がある ◦ メンバー間で協力しづらい ◦ サポート体制 ▪ 上記のような状態を改善できず ChatworkではBIツールも活用しています 14 しかし導入すればよいというものではなかった・・
15 • 当初はデータをSQLで抽出する時点で導入難しいと思った • しかし、全員がゼロからデータ分析しなくても運用できる方法がある ◦ 同じ職種であれば使うデータは似通っている ▪ 誰かがデータ抽出のテンプレートを作り、他の人はそれを使ってほぼ可 視化だけをすればいい
• これがうまくはまった ◦ Exploratory導入へ(2020年) Exploratory導入のポイント 全員がゼロからデータ分析しなくてもいい
1. テンプレート作成者はオンライン上で各種データフレーム(抽出するデータの単位)を共 有 2. 利用者は共有されたデータフレームをダウンロードし、必要なカスタマイズをして利用す る Exploratory運用ポイント 16 データフレームを パブリッシュ
ダウンロード テンプレート作成者 利用者
1. データフレーム作成時に、データの「取得期間」や「対象のカテゴリー」など、利用者が 変更する可能性のある箇所はパラメーター(変数)にしておく a. 「@{パラメーター名}」の部分 1.テンプレート作成(作成者) 17 パラメーターの利用
1. データフレームごとにタグをつけたり概要説明も書いてわかりやすくしておく 2.データフレームの共有(作成者) 18 パブリッシュ
1. 利用者はデータカタログ(Exploraotryでのパブリッシュされたデータのこと)からEDFで データをダウンロード 3.データフレームのダウンロード(利用者) 19 データカタログ
4.データをカスタマイズ(利用者) 20 パラメーターの編集 1. EDFファイルをExploratoryのデスクトップアプリで開く 2. データの加工のステップやパラメータの設定が残っているので必要に応じてカスタマイズ 3. 可視化をするなどして分析(すぐ分析できてカンタン)
まとめ 21 データの属人化の課題 • 社内にどんなデータがあるのか、データ抽出の基本としてのSQLを広めていく • データ集計・可視化を自分で簡単に行うためにBIツールを導入 • 誰もがデータを自分で扱えるようになり、データの属人化が解消される データの民主化へ
• サービス運営・企画、マーケティングなどデータを活用できる職種のメンバーが自分で データを活用できない • 誰かに依頼するとしてもどんな依頼ができるかわからない・時間がかかってしまう • データがただ溜まっていくだけでデータから学ぶサイクルが回らない
04 最後に お知らせ 22
グロース担当プロダクトマネージャー募集中 23 https://www.wantedly.com/projects/429264 ご入社でもれなく Exploratoryライセンス進呈!
働くをもっと楽しく、創造的に 24