THE GUILD勉強会 #03「データ×UXデザイン」資料
データ分析のトレーニング「データ道場」など日経のデータドリブン関連の施策について
1創業140年の古い会社でデータの民主化を進めた話日本経済新聞社 鈴木陽介
View Slide
鈴木陽介(Suzuki Yosuke)ウェブサイトの運用・編集・記者、新聞記者などを経て2009年から日経電子版の企画開発に関わる。2011年ごろから社内エンジニアによる開発の内製化を主導、初代スマホウェブ版や「爆速化」したウェブ版を担当。2017年データドリブンを加速するための教育制度「データ道場」を開始。現在は機械学習・AIのプロジェクトを管轄しつつ、開発環境の改善や社内人員のトレーニングに取り組んでいる。自己紹介2
日本経済新聞社について31876年(明治9年)12月創刊約140年の歴史全世界で300万部(紙・電子版の合計)を発行する世界最大の経済新聞社
4日経電子版って消費者向けのインターネット有料サービスの先駆け。月額4200円!という高いサービスに60万人もの有料会員がいる※紙とのセット売りでは電子版部分は1000円
● ブラウザー向け● iPhone/Android向けアプリ● 認証、課金● CRM・データ分析● コンテンツマネジメント・システム● 広告● グループ会社、サードパーティー連携● ビジュアライゼーションコンテンツ制作などの企画・開発を手がける日経電子版の開発業務5
6ビジュアライゼーションデータ、技術、デザインを総合的に駆使するコンテンツ開発vdata.nikkei.com
日経電子版で働く人たち7エンジニア、データサインティスト、デザイナー、マーケター、ビジネス企画
8FTとの連携● 2015年買収● 爆速サイト開発● データ分析プロジェクト○ 1人渡英中● 編集システムなどの情報を共有● 英語力++○ 英語ランチ会も実施中
新聞販売店が間に入り、読者が誰で、どんな風に、どんな記事を読んでいるかの情報は持っていなかった。※アンケート等で収集したものは除く日経電子版以前9
電子版では読者との直接取り引きとなり、いつ、誰がどんな風にどの記事を読んでいるかわかるようになった日経電子版以降(2010年)以降10
800万人以上の日経ID会員データ250万件の記事● どのボタンを押したか● どこまでスクロールしたか● どの記事の見出しをみて、どの記事を結果的に読んだか/読まなかったか平日1日のデータ量 1億件11
読者の過去20日間の利用頻度、閲覧した記事本数から算出される数値を事業に関わる人全体で向上させるべきものとして定義→エンゲージメント指標→この数値が高いほど読者が解約しにくいデータを元に共通の目標を設定12
13● Super Loyal● Loyal● Middle● Light● Dormantエンゲージメントの数値によって5つのカテゴリーにわけているエンゲージメントレベル
14● 外部のSaaS型+オンプレからAWS上に内製のプラットフォームを構築● データを分析したり、収集したりする自由度が圧倒的に上がった○ RedashやElasticsearch/Kibanaで分析新データプラットフォーム Atlas
ここまでの話● そもそも顧客データを持っていなかった会社が集めるようになった● 自社製のデータプラットフォームを構築→あとはデータを扱える人を増やしていく「データ分析の民主化」15
お金や人をかけて、仕組みは作った。、、、でも誰も使わない実際よくある話16触り方がわからない、アクセス方法がわからない、忙しくて手が付かない
2017年からデータドリブンを進めていくためのトレーニングの枠組みとして「データ道場」を開始そこで「データ道場」17
データ道場の概要● 3ヶ月に渡ってデータ分析のためのノウハウを身につけるためのトレーニング● 毎週1日3時間、5〜10人ぐらい● 宿題が出るときも● データ分析のトレーニングをやっているデータミックス社にカリキュラム作成と講師役を委託18
データ道場のカリキュラム19● SQL基礎○ 簡単なSELECT文○ 縦持ち横持ち○ with句● 実践編○ PDCAサイクルをどう回すのか○ 各チームごとの事情に合わせてカスタマイズ
施策をやるときの基本姿勢を身につける● ビジネス上のゴールに結びついているか● ビジネスゴールに結びつくKPIを設定● KPIとそれをトラッキングするダッシュボード● 施策の中止条件● サンプルサイズの決め方● 予想されるインパクト(期待値)○ できればシミュレーションする20
21ダッシュボード各担当者がredashでクエリを書いて、ダッシュボードを作成Kibanaなど他の可視化ツールを使うこともある
● シミュレーションをしてみると、やろうと思っていた施策があまりインパクト出ないかもしれないことがわかる○ 例:機械学習でユーザーの回遊性をあげるよりも、スマホアプリのインストール率/利用率を上げるほうが効果がある● 特に直接経費がかかるようなものは試算してみる施策をする前にインパクトを考えてみる22
事例:PC版の記事下リンクパーツ23データ道場に参加した担当者がその後UI改善に取り組んで、クリック率を4倍にアップさせた
● 分析・マーケティング担当者向け● 編集関係者向け● PCサイト担当者向け● SQL基礎編のみコース(デザイナー、マーケティング、広告担当者なども)● B2B担当者向け● マーケティング・プロモーション担当者向け社員200人以上がSQLの基礎的な知識を持っているこれまでのデータ道場24
● データ分析はまともにやろうとするとかなりコストがかかる○ 一部のデータサイエンティストだけに任しておいても、やれる範囲が限られる● 分析をすることで担当者が初めて足りないデータに気がつく○ たいてい最初はPVなどの最低限のデータしかとってない○ 分析ができないことで、追加で取得しないといけないデータがわかる→開発時にそれを入れ込むようになる● 各プロダクトの担当者が関わることで初めて本当に役立つデータが取れるようになるそもそも何でデータの民主化が必要なんだっけ?25
● まだまだ道半ば● より大きな施策にたくさん取り組んでいかないといけない○ その際に必ずデータを見る能力が必要になる○ たくさんの人が同じ知識レベルで話せるようにしたい実際には26