Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
創業140年の古い会社でデータの民主化を進めた話 / nikkei data driven 2...
Search
Yosuke
August 23, 2018
Technology
17
24k
創業140年の古い会社でデータの民主化を進めた話 / nikkei data driven 20180823
THE GUILD勉強会 #03「データ×UXデザイン」資料
データ分析のトレーニング「データ道場」など日経のデータドリブン関連の施策について
Yosuke
August 23, 2018
Tweet
Share
More Decks by Yosuke
See All by Yosuke
ONA20 presentation: How Nikkei improves user retention through consultation
yosukesuzuki
1
360
How Nikkei improves user retention with new subscriber consultation
yosukesuzuki
0
440
Google App Engine の日経での利用事例 / appengine at nikkei
yosukesuzuki
5
2.3k
Development and Infrastructure for Microservice Architecture
yosukesuzuki
0
1.1k
PythonでもPythonじゃなくても使える汎用的なMicroservice実行環境 / nikkei microservice
yosukesuzuki
13
18k
5 years with Google App Engine
yosukesuzuki
2
1.9k
日経電子版 開発内製化の取り組み / nikkei web development 2015
yosukesuzuki
54
37k
Other Decks in Technology
See All in Technology
サンドボックス技術でAI利活用を促進する
koh_naga
0
200
RSCの時代にReactとフレームワークの境界を探る
uhyo
10
3.4k
下手な強制、ダメ!絶対! 「ガードレール」を「檻」にさせない"ガバナンス"の取り方とは?
tsukaman
2
440
Autonomous Database - Dedicated 技術詳細 / adb-d_technical_detail_jp
oracle4engineer
PRO
4
10k
Function Body Macros で、SwiftUI の View に Accessibility Identifier を自動付与する/Function Body Macros: Autogenerate accessibility identifiers for SwiftUI Views
miichan
2
180
Language Update: Java
skrb
2
290
Codeful Serverless / 一人運用でもやり抜く力
_kensh
7
400
JTCにおける内製×スクラム開発への挑戦〜内製化率95%達成の舞台裏/JTC's challenge of in-house development with Scrum
aeonpeople
0
210
Django's GeneratedField by example - DjangoCon US 2025
pauloxnet
0
140
エラーとアクセシビリティ
schktjm
1
1.2k
COVESA VSSによる車両データモデルの標準化とAWS IoT FleetWiseの活用
osawa
1
270
roppongirb_20250911
igaiga
1
220
Featured
See All Featured
Visualization
eitanlees
148
16k
Scaling GitHub
holman
463
140k
Building Adaptive Systems
keathley
43
2.7k
KATA
mclloyd
32
14k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.5k
BBQ
matthewcrist
89
9.8k
Practical Orchestrator
shlominoach
190
11k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
61k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3k
Rebuilding a faster, lazier Slack
samanthasiow
83
9.2k
Speed Design
sergeychernyshev
32
1.1k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
Transcript
1 創業140年の古い会社でデータの民主化を 進めた話 日本経済新聞社 鈴木陽介
鈴木陽介(Suzuki Yosuke) ウェブサイトの運用・編集・記者、新聞記者などを経て2009年から 日経電子版の企画開発に関わる。 2011年ごろから社内エンジニアによる開発の内製化を主導、初代 スマホウェブ版や「爆速化」したウェブ版を担当。 2017年データドリブンを加速するための教育制度「データ道場」を 開始。現在は機械学習・AIのプロジェクトを管轄しつつ、開発環境 の改善や社内人員のトレーニングに取り組んでいる。 自己紹介
2
日本経済新聞社について 3 1876年(明治9年)12月創刊 約140年の歴史 全世界で300万部(紙・電子 版の合計)を発行する世界 最大の経済新聞社
4 日経電子版って 消費者向けのインターネット有料サービスの先駆け。 月額4200円!という高いサービスに60万人もの有料会員がいる ※紙とのセット売りでは電子版部分は1000円
• ブラウザー向け • iPhone/Android向けアプリ • 認証、課金 • CRM・データ分析 • コンテンツマネジメント・システム
• 広告 • グループ会社、サードパーティー連携 • ビジュアライゼーションコンテンツ制作 などの企画・開発を手がける 日経電子版の開発業務 5
6 ビジュアライゼーション データ、技術、デザ インを総合的に駆 使するコンテンツ開 発 vdata.nikkei.com
日経電子版で働く人たち 7 エンジニア、データサインティスト、デザイナー、マーケ ター、ビジネス企画
8 FTとの連携 • 2015年買収 • 爆速サイト開発 • データ分析プロジェクト ◦ 1人渡英中
• 編集システムなどの情報 を共有 • 英語力++ ◦ 英語ランチ会も実施中
新聞販売店が間に入り、読者が誰で、どんな風に、どんな記事を 読んでいるかの情報は持っていなかった。 ※アンケート等で収集したものは除く 日経電子版以前 9
電子版では読者との直接取り引きとなり、いつ、誰がどんな風 にどの記事を読んでいるかわかるようになった 日経電子版以降(2010年)以降 10
800万人以上の日経ID会員データ 250万件の記事 • どのボタンを押したか • どこまでスクロールしたか • どの記事の見出しをみて、どの記事を結果的に読ん だか/読まなかったか 平日1日のデータ量 1億件
11
読者の過去20日間の利用頻度、閲覧した記事本数か ら算出される数値を事業に関わる人全体で向上させる べきものとして定義 →エンゲージメント指標 →この数値が高いほど読者が解約しにくい データを元に共通の目標を設定 12
13 • Super Loyal • Loyal • Middle • Light
• Dormant エンゲージメントの数値によって5つのカテゴリーにわ けている エンゲージメントレベル
14 • 外部のSaaS型+オンプレからAWS上に内製のプラットフォーム を構築 • データを分析したり、収集したりする自由度が圧倒的に上がった ◦ RedashやElasticsearch/Kibanaで分析 新データプラットフォーム Atlas
ここまでの話 • そもそも顧客データを持っていなかった会社が集める ようになった • 自社製のデータプラットフォームを構築 →あとはデータを扱える人を増やしていく 「データ分析の民主化」 15
お金や人をかけて、仕組みは作った。 、、、でも誰も使わない 実際よくある話 16 触り方がわからない、 アクセス方法がわからない、 忙しくて手が付かない
2017年からデータドリブンを進めていくためのトレーニングの枠組み として「データ道場」を開始 そこで「データ道場」 17
データ道場の概要 • 3ヶ月に渡ってデータ分析のためのノウハウを身につけるための トレーニング • 毎週1日3時間、5〜10人ぐらい • 宿題が出るときも • データ分析のトレーニングをやっているデータミックス社にカリ
キュラム作成と講師役を委託 18
データ道場のカリキュラム 19 • SQL基礎 ◦ 簡単なSELECT文 ◦ 縦持ち横持ち ◦ with句
• 実践編 ◦ PDCAサイクルをど う回すのか ◦ 各チームごとの事 情に合わせてカス タマイズ
施策をやるときの基本姿勢を身につける • ビジネス上のゴールに結びついているか • ビジネスゴールに結びつくKPIを設定 • KPIとそれをトラッキングするダッシュボード • 施策の中止条件 •
サンプルサイズの決め方 • 予想されるインパクト(期待値) ◦ できればシミュレーションする 20
21 ダッシュボード 各担当者がredashでクエリを書いて、ダッシュボードを作成 Kibanaなど他の可視化ツールを使うこともある
• シミュレーションをしてみると、やろうと思っていた施 策があまりインパクト出ないかもしれないことがわか る ◦ 例:機械学習でユーザーの回遊性をあげるよりも、 スマホアプリのインストール率/利用率を上げるほう が効果がある • 特に直接経費がかかるようなものは試算してみる
施策をする前にインパクトを考えてみる 22
事例:PC版の記事下リンクパーツ 23 データ道場に参加した担当者がその後UI改善に取り組んで、クリッ ク率を4倍にアップさせた
• 分析・マーケティング担当者向け • 編集関係者向け • PCサイト担当者向け • SQL基礎編のみコース(デザイナー、マーケティング、広告担当 者なども) •
B2B担当者向け • マーケティング・プロモーション担当者向け 社員200人以上がSQLの基礎的な知識を持っている これまでのデータ道場 24
• データ分析はまともにやろうとするとかなりコストがかかる ◦ 一部のデータサイエンティストだけに任しておいても、やれる範 囲が限られる • 分析をすることで担当者が初めて足りないデータに気がつく ◦ たいてい最初はPVなどの最低限のデータしかとってない ◦
分析ができないことで、追加で取得しないといけないデータがわ かる→開発時にそれを入れ込むようになる • 各プロダクトの担当者が関わることで初めて本当に役立つデータ が取れるようになる そもそも何でデータの民主化が必要なんだっけ? 25
• まだまだ道半ば • より大きな施策にたくさん取り組んでいかないといけな い ◦ その際に必ずデータを見る能力が必要になる ◦ たくさんの人が同じ知識レベルで話せるようにしたい 実際には
26