Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
いま、データに必要な解像度
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Hikaru Kashida
December 09, 2024
Business
58
23k
いま、データに必要な解像度
Hikaru Kashida
December 09, 2024
Tweet
Share
More Decks by Hikaru Kashida
See All by Hikaru Kashida
本気で解かれるべき 課題を創る(アジェンダ・セッティング)
hik0107
2
280
データをどう使うか?ーメルカリでの学び, デジタル庁の挑戦
hik0107
18
4.5k
Growth Grand Theory - Dos and Donts
hik0107
25
9.4k
Data, Design and Government
hik0107
53
38k
戦略と実行をつなぐデータ
hik0107
53
27k
FREE AGENDA #65 施策を通じて得た抽象的な学び
hik0107
14
5k
noteの躍進を支えた”定性と定量の甘い関係”
hik0107
14
37k
なんでデータアナリストやってるの
hik0107
17
7k
Simple Data Analytics Leads impact
hik0107
147
170k
Other Decks in Business
See All in Business
AI浅慮の時代における「考える」と「視点」、そして「創造性」
masayamoriofficial
1
2k
株式会社ジュニ - 採用ピッチ
junni_inc
2
25k
-生きる-AI時代におけるライターの生存戦略
mimuhayashi
0
230
株式会社Gizumo_会社紹介資料(2026.1更新)
gizumo
0
630
malna-recruiting-pitch
malna
0
14k
株式会社EventHub 会社紹介資料
eventhub
1
44k
急成長プロダクトを支える「組織の検査と適応」—— SmartHR 労務ドメイン Scrum@Scale 導入半年間のリアルと展望
wadak8sk
1
350
202601〜【合同会社プレップ湘南】COMPANY DECK
prepp
0
190
習慣化するための技術 / Techniques for Habit Formation
3l4l5
1
280
株式会社High Link_会社紹介資料
highlink_hr
2
81k
VISASQ: ABOUT DEV TEAM
eikohashiba
6
41k
【SBO勉強会】感謝されるAI活用&ツール導入法
sakiyogoro
1
230
Featured
See All Featured
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
BBQ
matthewcrist
89
10k
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
66
37k
Code Reviewing Like a Champion
maltzj
527
40k
Site-Speed That Sticks
csswizardry
13
1.1k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
450
エンジニアに許された特別な時間の終わり
watany
106
230k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
180
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
9.6k
KATA
mclloyd
PRO
34
15k
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
3.6k
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
0
440
Transcript
2024.12.10 Zero to One Conference いま、データに必要な解像度 Hikaru Kashida - Chief
Analytics Officer, デジタル庁
Current 日本政府 デジタル庁(2022-) - CxO(Chief Analytics Officer) Past 株式会社メルカリ(2016-2020) -
Head of Data Analyst 株式会社ブレインパッド(2014-2016) - Data Scientist etc. Speaker - Hikaru Kashida
Policy Data Dashboard Project(政策データダッシュボード) https://www.digital.go.jp/resources/govdashboard
いま、データに必要な解像度
「解像度」とは: 観測対象がどこまで詳しく描写されているか、異なる対象がどこまで分離されているかを意味する (wikipediaより 一部意訳的に引用) データ分析は事業の「解像度」を上げるための営み モノリシックなものを分離し、事業をより良く理解し、アクションの精度を上げる 例:KPIツリーによる事業目標の分解、セグメンテーションによる顧客の分解(最終形がone to one)
だが、そもそも我々は「データ」というものに対して解像度が低くないか データという言葉の名の下、いろいろなものが十把一絡げに語られている(=異なるものが分離されていない) このセッションを通して、いくつかの質問とそれに対する世間的な通説の否定を通して、 「データ」について、 解像度を高めるための議論をしてみたいと思う。
1 データを使うとはどういうことか 2 データ分析は何に使えるか 3 データに求められる態度とは 4 データの価値は何で決まるか Conclusion Theme
- いま、データに必要な解像度
データを使うとはどういうことか? Theme1
よく耳にする定説 データをビジネスに役立てること Theme1
いま必要な解像度 情報量をデータ消費者の言語体系に調整すること Theme1
データを使うとは 情報量をデータ消費者に最適化して調整すること 定説の否定:データ消費者の種別と特徴について解像度が低い データの消費者によって最適な情報量は全く異なる
事業マネジメント (言語:事業目標、事業計画) 企画 (言語:KPI、施策、顧客体験) アナリティクス (言語:分析モデル、インサイト) 機械言語 (言語:Python、SQL) 計算インフラ 最終的なアクションポイント
(顧客やオペレーション) 人間判断介在モデル → Human Friendlyな情報量であることが最重要 自動化モデル → データ量と特徴量Engeeringが最重要 要件解釈 データ準備・ プログラミング 判断の上でのアクション 言語の異なる5つのバリューチェーンと情報量の調整プロセス 1 2 3
いま必要な解像度 情報量をデータ消費者に最適化して調整すること データ消費者が人間の場合、あくまで情報の摂取の容易さと判断のしやすさ が最も優先される。関係者が多いほど、より平易さが求められる 直感的な指標設計、統計量 適度な分解の粒度(~20カテゴリなどを超えると無理) わかりやすい可視化 データ量の大きさ、モデルの精緻さetc. は重要性としてはセカンダリ 最終消費者が機械の場合、評価関数の巧拙・データ量・特徴量の設計が重要
それぞれで必要なアジェンダが全く異なる
データ分析は何に使えるか? Theme2
よく耳にする定説 データは意思決定のためにある Theme2
いま必要な解像度 データは意思決定と実行の間にある Theme2
データ分析は何に使えるか データは意思決定と実行の間にある 定説の否定: データと意思決定と事業の関係について解像度が低い 大きな意思決定(戦略) 、小さな意思決定(オペレーション)がある 日本型組織の意思決定は「瞬間的」ではなく「逐次浸透的」 意思決定と実行の熱伝導は常に100%ではない. 両者は地続きの関係にある。事業の本質は「実行」 データ
× 大きな意思決定 のみにこだわると 実は市場が小さい 戦略と実行の間にあると考えるのが適切で最もバリューを発揮すると考える 意思決定と云う言葉のダイナミックさはまやかしを含んでいる。むしろ、空気のように目立たずに戦略 と行動に介入している方がはるかに上策
ideal realistic
出典:Hunter × Hunter
“俺は一人じゃねえ 人間を舐めるなよ メルエム“ ー ネテロ(ハンター協会会長) 人間の強さ・賢さ 直感・知識に寄る相応な戦略の策定 集合知/暗黙知の集積を用いて、それらしい戦略を組み立てることが出来る 複合的な、複雑な要素を加味して、最適解を導き出せる 人間と組織の愚かしさ
戦略と実行のベクトルの内積が常に「1」にならない 組織の構成員にはばらつきがある。全員に正しく戦略を熱伝導させるのは至難 人は怠ける 自分の好奇心で動く 戦略の理解が正しくない etc. 人間を舐めるな 俺は一人じゃねえ 人間(の集団の愚かさ)を舐めるな
戦略 実行 データ(数値)を元に 戦略が実行に一致することを図る データ(数値)を元に 実行が戦略に一致していることを測る データ (数値) データは意思決定と実行の間にある
データに求められる態度とは? Theme3
よく耳にする定説 データは常に客観的であるべき Theme3
いま必要な解像度 データは主観×客観 の重ね合わせ Theme3
データに求められる態度とは データは主観×客観 の重ね合わせ 定説の否定:データの役割、客観性の意味について解像度が低い 分析: 「ある事物を分解し、それらを成立させている成分・要素・側面を明らかにする」 分解に真の客観性はない。我々は常に何かしら現実の環境要因によって世界を恣意的に見ている 例:自然言語における種族の分解
セグメントに正解はない。そこにあるのは「世界をどう見たいか」という “意思の反映” 言語学等、世界の認識に関する学問でも提唱されていることと同じ 日本語:鳩 英語:白い鳩はDove 黒い鳩はPigeon 仏語:Papillon(パピヨン) 日本語:蛾と蝶 日本語:ウマ モンゴル:オス
or メス・去勢の有無・馬齢 が違うとそれぞれに専用の単語がある 英語:Rain 日本語:五月雨、時雨、霧雨、夕立、小雨、天気雨、俄雨 ...400種類! → どこの国でも世界の存在は変わらないが、世界を切り取るセグメントのあり方は様々。 どれが正しいというものはない。あるのは「世界をどう分解すれば最も良く生きれるか」という視点の結果のみ
3ヶ月前 3ヶ月前 - - - • • ✕ ✕ ✕
✕ • • 前々月 前々月 - - ✕ ✕ - 前月 前月 - - • • 初 今月 今月 初 初 新規 1000 1000 新規 既存 5,000 500 既存 ルーキー 復帰 2000 4500 2000 復帰 • • • • • ユーザセグメントは事業で何を重んじるかを表現している必要がある。 ある程度既存ユーザが積み上がっている事業 シンプルさを重視して3セグメントに絞り込んで考える 新規ユーザの次月残存を重視するセグメント組みにする 新規ユーザの残存に課題がある事業 500 1000
いま必要な解像度 データは主観×客観 の重ね合わせ 客観性は美しさであり、弱さ 過度に客観的であろうとするスタンスは、怠慢であり、逃避であり、弱さである 事業とは「行動」の蓄積。 客観性と行動の間には距離がある。空→雨→傘 の間を誰が埋めるか? 客観的な事実を提供するだけで仕事が成立するのは、長いバリューチェーンを許容される環境だけ 自分がいるのがそういった環境であるのか、の峻別の上で判断されるべき
データの価値は何で決まるか Theme4
よく耳にする定説 データの価値はデータの量、データ基盤、 分析のクオリティで決まる Theme4
いま必要な解像度 データの価値はユースケースで決まる Theme4
データの価値は何で決まるか データの価値はユースケースで決まる 定説の否定:データの価値が出せる条件について解像度が低い データ分析によるアウトプットが機能する範囲はそれほど実は広くない。 間違った分野にどれだけリッチなデータを投入しても、 Rich-In / Garbage-Out になる スタートアップと同じ。間違った市場に参入した時点で、99%負ける
データを適用するシーンが適切であればSmall Dataでも勝機は十分ある 「狭い必要十分条件」を理解する必要がある データは大概のシーンでMust-Haveな要素ではない データを使わずとも事業は最低限は成り立つ。この事実を真摯に受け止める必要がある 「スポーツ科学を知らずとも、Apple Healthcareを使わずともダイエットは出来る」
データ(分析)が機能するシーンの類型を理解する 経験上、パターンはそれほど多くない 80%は「対他者で必要だから」 20%は「自身が知りたいから」 善意のデータ活用は尊いが、20%程度。 監督者と実施者との間のフリクションが発生するところに陣取るほうがマーケットとしては強い 監督者と実施者との間のフリクション モデル(全体の80%) ガバナンス・監理(事業計画など) 大きい判断の正当化、説明責任(マーケティング投資など)
戦略 <-> 実行 の橋渡し、実行者への説明 と 実行からのフィードバック 善意のデータ活用 モデル(全体の20%) パフォーマンス連動で給与が決まるなど、どんな手を使っても成果を上げたい 自身のサービスのフィードバックと改善に純粋に飢えている ハマるユースケースを自分でイチから見つけ出すのは実は簡単ではない。事業の特性とガバナンス構造、 キーパーソンの性格の理解など、割と全人格的な能力が求められる。
サピエンスが優れているのは、集団で虚構(共同幻想)を共有するこ とで大人数でも一体となって行動できるから。 (サピエンス全史, ユヴァル・ノア・ハラリ) 企業組織はその代表例。 会社のような大人数の集団が一致団結してコトに当たるのは実はそんなに簡単ではない 他者間で常に意見の不一致と疑いが発生する 集団の中で信じられる共通認識を作る、はデータの一つの大きな市場 この世で最もコストが高く付くことのひとつは「疑うこと」 データによって疑うコスト、意見の不一致や、不毛な主観同士の衝突を調停するだけで、組織のスルー
プットは大きく上がる
余談 データと世界3大発明 羅針盤 → 意思決定材料 主な功績:大航海時代において、航海の成功率(生還率)を高め、世界の開拓に寄与 例えると:正しい意思決定のための材料 活版印刷 主な功績:教会にしかなかった聖書を一般家庭でも保有可能にするなど、情報の非対称性の打破 例えると:正しい情報や方針の普及啓蒙、社会上層部のサイロ化の喝破
火薬 → AI 等 主な功績:火薬を用いた武器により、それまでの「兵力(頭数) 」∝ 勝率 の構造に技術力が介入 例えると:データを用いたビジネス、非労働集約依存型のビジネスモデルの創出
Conclusion 1 データを使うとはどういうことか 情報量をデータ消費者の言語体系に調整すること (定説:データをビジネスに役立てること ) 2 データ分析は何に使えるか データは意思決定と実行の間にある (定説:データは意思決定のためにある
) 3 データに必要な態度とは データは主観×客観 の重ね合わせ (定説:データは常に客観的であるべき ) 4 データの価値は何で決まるか データの価値はユースケースで決まる (定説:データの価値はデータの量、データ基盤、分析のクオリティで決まる ) Conclusion
結論 正直、データについての一般的な言説は、不正確で無責任な幻想が多い。 それらは主に「事業とデータの交点」に関する解像度の低さから来ている。 机上の空想から生み出された、現実には役立たないセオリーに惑わされないこと。 常に「十分な解像度で理解しているか」を意識すること。データも事業も。 Conclusion