2020/5/29(金)に開催したExploratory データサイエンス勉強会#13のChatwork株式会社様のご登壇資料です。
2020.05.29 Exploratory様 データサイエンス勉強会 #13Chatwork株式会社プロダクトマネジメント室 プロダクトマネージャー田中 亜希データの民主化〜Chatworkのデータ活用の取り組み〜
View Slide
目次2● 自己紹介● テーマ「データの民主化」● SQLの民主化● BIツール
自己紹介3田中 亜希● Chatworkのグロース施策担当○ ユーザーのアクティベーション○ フリープランユーザー有料化● Exploratoryの導入など、社内のデータ活用の普及活動Chatwork 株式会社 プロダクトマネージャー室
01テーマ「データの民主化」属人化することの課題4
データが属人化している状態とは5● 例えば○ エンジニア(データを記録してくれている・SQL書ける)○ データサイエンティスト、データアナリスト(専門家)● 他のメンバーはどんなデータがあるか知らない、知っていても使い方がわからない状態データをみられるのは社内の一部メンバーのみ
ここでいう「データ」とは6● 本来このようなデータを最も活用できる立場にあるのは○ プロダクトの企画運営者(プロダクトマネージャー)○ カスタマーサクセス○ マーケター、セールスなど● 彼らが自分でデータを使えない状態=データの属人化プロダクト利用状況 ユーザー属性 セールスリード・商談各機能がどれくらい使われているか登録時期、言語、利用プラン、業種など見込み顧客の状況誰が活用できるか
データが属人化することの課題7改善のサイクルが回らないプロダクトリリースユーザーが使うデータを収集データから学ぶプロダクトを改善する参照:データ・バーチュアス・サイクルひたすらデータが溜まっていく①②③④⑤
誰かに依頼して必要なデータを取得してもらうことはできる。でも・・・8● 一部メンバーに依頼が集中○ 専業のメンバーがいない場合、依頼先のメンバーは本来の業務に集中できない● 例:エンジニアは実装が本務。データ抽出依頼は自然と後回しに・・時間がかかってしまう→誰もが自分でデータを使えるようにしたい(データの民主化)そもそもどんなデータがあるかがわからない● イメージしているものが取得できる・できないを判断できない○ 非現実的な依頼になってしまう
02SQLの民主化教えて広める9
Chatworkでの取り組み例10● 元々は社内唯一のデータアナリスト(ただし専業ではない)が始めた取り組み○ 参加もレクチャーも任意● カリキュラム(30分4コマくらい)○ 社内のデータ分析環境(データベースアーキテクチャ)○ 記録されているデータについて(どんなテーブルがあるのか)○ SQL概要(サブクエリくらいまで)● 疑問点はチャットでも随時サポート(チャットの会社なので・・)非エンジニアを対象にしたSQLのレクチャー会の実施
職種で選べる2つのコース11コース プロダクトコース セールス・マーケコース参加者プロダクトマネージャーデザイナーマーケターインサイドセールス内容 プロダクトやユーザーのデータ中心リード(Salesforce、Marketo)のデータ中心● 職種によってよく使うデータが違う● レクチャーのゴール○ 実際にSQLをガッツリ書けるようになるよりも、どんなデータが使えて、SQLでどんな抽出ができるのかを理解することがまず重要
03BIツールツールを使って簡単に12
なぜBIツールが必要か13データの収集・集計 可視化● 全てをSQLだけで行うのは難しい○ レクチャーだけでは不十分○ 複雑になるほど長大なSQLに● ダッシュボードツールだけでは不十分○ 例:Redash■ リファレンスラインをひく■ 箱ヒゲ図BIツールでできること(一部)
● 某大手BIツールを導入してみた(2019年)○ 減っていく利用者■ 定常的に使われていたのは10ライセンス中2ライセンス・・● 使われなかった要因○ 全てをGUIで操作できるが、最初のデータ読み込みに時間がかかりつまづく■ 効率的にデータを読み込むには結局SQLを書く必要がある○ メンバー間で協力しづらい○ サポート体制■ 上記のような状態を改善できずChatworkではBIツールも活用しています14しかし導入すればよいというものではなかった・・
15● 当初はデータをSQLで抽出する時点で導入難しいと思った● しかし、全員がゼロからデータ分析しなくても運用できる方法がある○ 同じ職種であれば使うデータは似通っている■ 誰かがデータ抽出のテンプレートを作り、他の人はそれを使ってほぼ可視化だけをすればいい● これがうまくはまった○ Exploratory導入へ(2020年)Exploratory導入のポイント全員がゼロからデータ分析しなくてもいい
1. テンプレート作成者はオンライン上で各種データフレーム(抽出するデータの単位)を共有2. 利用者は共有されたデータフレームをダウンロードし、必要なカスタマイズをして利用するExploratory運用ポイント16データフレームをパブリッシュダウンロードテンプレート作成者 利用者
1. データフレーム作成時に、データの「取得期間」や「対象のカテゴリー」など、利用者が変更する可能性のある箇所はパラメーター(変数)にしておくa. 「@{パラメーター名}」の部分1.テンプレート作成(作成者)17パラメーターの利用
1. データフレームごとにタグをつけたり概要説明も書いてわかりやすくしておく2.データフレームの共有(作成者)18パブリッシュ
1. 利用者はデータカタログ(Exploraotryでのパブリッシュされたデータのこと)からEDFでデータをダウンロード3.データフレームのダウンロード(利用者)19データカタログ
4.データをカスタマイズ(利用者)20パラメーターの編集1. EDFファイルをExploratoryのデスクトップアプリで開く2. データの加工のステップやパラメータの設定が残っているので必要に応じてカスタマイズ3. 可視化をするなどして分析(すぐ分析できてカンタン)
まとめ21データの属人化の課題● 社内にどんなデータがあるのか、データ抽出の基本としてのSQLを広めていく● データ集計・可視化を自分で簡単に行うためにBIツールを導入● 誰もがデータを自分で扱えるようになり、データの属人化が解消されるデータの民主化へ● サービス運営・企画、マーケティングなどデータを活用できる職種のメンバーが自分でデータを活用できない● 誰かに依頼するとしてもどんな依頼ができるかわからない・時間がかかってしまう● データがただ溜まっていくだけでデータから学ぶサイクルが回らない
04最後にお知らせ22
グロース担当プロダクトマネージャー募集中23https://www.wantedly.com/projects/429264ご入社でもれなくExploratoryライセンス進呈!
働くをもっと楽しく、創造的に24