Slide 1

Slide 1 text

2024.12.10 Zero to One Conference いま、データに必要な解像度 Hikaru Kashida - Chief Analytics Officer, デジタル庁

Slide 2

Slide 2 text

Current 日本政府 デジタル庁(2022-) - CxO(Chief Analytics Officer) Past 株式会社メルカリ(2016-2020) - Head of Data Analyst 株式会社ブレインパッド(2014-2016) - Data Scientist etc. Speaker - Hikaru Kashida

Slide 3

Slide 3 text

Policy Data Dashboard Project(政策データダッシュボード) https://www.digital.go.jp/resources/govdashboard

Slide 4

Slide 4 text

いま、データに必要な解像度

Slide 5

Slide 5 text

「解像度」とは: 観測対象がどこまで詳しく描写されているか、異なる対象がどこまで分離されているかを意味する    (wikipediaより 一部意訳的に引用) データ分析は事業の「解像度」を上げるための営み モノリシックなものを分離し、事業をより良く理解し、アクションの精度を上げる 例:KPIツリーによる事業目標の分解、セグメンテーションによる顧客の分解(最終形がone to one) だが、そもそも我々は「データ」というものに対して解像度が低くないか データという言葉の名の下、いろいろなものが十把一絡げに語られている(=異なるものが分離されていない) このセッションを通して、いくつかの質問とそれに対する世間的な通説の否定を通して、 「データ」について、 解像度を高めるための議論をしてみたいと思う。

Slide 6

Slide 6 text

1 データを使うとはどういうことか 2 データ分析は何に使えるか 3 データに求められる態度とは 4 データの価値は何で決まるか Conclusion Theme - いま、データに必要な解像度

Slide 7

Slide 7 text

データを使うとはどういうことか? Theme1

Slide 8

Slide 8 text

よく耳にする定説 データをビジネスに役立てること Theme1

Slide 9

Slide 9 text

いま必要な解像度 情報量をデータ消費者の言語体系に調整すること Theme1

Slide 10

Slide 10 text

データを使うとは 情報量をデータ消費者に最適化して調整すること 定説の否定:データ消費者の種別と特徴について解像度が低い データの消費者によって最適な情報量は全く異なる

Slide 11

Slide 11 text

事業マネジメント (言語:事業目標、事業計画) 企画 (言語:KPI、施策、顧客体験) アナリティクス (言語:分析モデル、インサイト) 機械言語 (言語:Python、SQL) 計算インフラ 最終的なアクションポイント (顧客やオペレーション) 人間判断介在モデル → Human Friendlyな情報量であることが最重要 自動化モデル → データ量と特徴量Engeeringが最重要 要件解釈 データ準備・ プログラミング 判断の上でのアクション 言語の異なる5つのバリューチェーンと情報量の調整プロセス 1 2 3

Slide 12

Slide 12 text

いま必要な解像度 情報量をデータ消費者に最適化して調整すること データ消費者が人間の場合、あくまで情報の摂取の容易さと判断のしやすさ が最も優先される。関係者が多いほど、より平易さが求められる 直感的な指標設計、統計量 適度な分解の粒度(~20カテゴリなどを超えると無理) わかりやすい可視化 データ量の大きさ、モデルの精緻さetc. は重要性としてはセカンダリ 最終消費者が機械の場合、評価関数の巧拙・データ量・特徴量の設計が重要 それぞれで必要なアジェンダが全く異なる

Slide 13

Slide 13 text

データ分析は何に使えるか? Theme2

Slide 14

Slide 14 text

よく耳にする定説 データは意思決定のためにある Theme2

Slide 15

Slide 15 text

いま必要な解像度 データは意思決定と実行の間にある Theme2

Slide 16

Slide 16 text

データ分析は何に使えるか データは意思決定と実行の間にある 定説の否定: データと意思決定と事業の関係について解像度が低い 大きな意思決定(戦略) 、小さな意思決定(オペレーション)がある 日本型組織の意思決定は「瞬間的」ではなく「逐次浸透的」 意思決定と実行の熱伝導は常に100%ではない. 両者は地続きの関係にある。事業の本質は「実行」 データ × 大きな意思決定 のみにこだわると 実は市場が小さい 戦略と実行の間にあると考えるのが適切で最もバリューを発揮すると考える 意思決定と云う言葉のダイナミックさはまやかしを含んでいる。むしろ、空気のように目立たずに戦略 と行動に介入している方がはるかに上策

Slide 17

Slide 17 text

ideal realistic

Slide 18

Slide 18 text

出典:Hunter × Hunter

Slide 19

Slide 19 text

“俺は一人じゃねえ 人間を舐めるなよ メルエム“ ー ネテロ(ハンター協会会長) 人間の強さ・賢さ 直感・知識に寄る相応な戦略の策定 集合知/暗黙知の集積を用いて、それらしい戦略を組み立てることが出来る 複合的な、複雑な要素を加味して、最適解を導き出せる 人間と組織の愚かしさ 戦略と実行のベクトルの内積が常に「1」にならない 組織の構成員にはばらつきがある。全員に正しく戦略を熱伝導させるのは至難 人は怠ける 自分の好奇心で動く 戦略の理解が正しくない etc. 人間を舐めるな 俺は一人じゃねえ 人間(の集団の愚かさ)を舐めるな

Slide 20

Slide 20 text

戦略 実行 データ(数値)を元に 戦略が実行に一致することを図る データ(数値)を元に 実行が戦略に一致していることを測る データ (数値) データは意思決定と実行の間にある

Slide 21

Slide 21 text

データに求められる態度とは? Theme3

Slide 22

Slide 22 text

よく耳にする定説 データは常に客観的であるべき Theme3

Slide 23

Slide 23 text

いま必要な解像度 データは主観×客観 の重ね合わせ Theme3

Slide 24

Slide 24 text

データに求められる態度とは データは主観×客観 の重ね合わせ 定説の否定:データの役割、客観性の意味について解像度が低い 分析: 「ある事物を分解し、それらを成立させている成分・要素・側面を明らかにする」 分解に真の客観性はない。我々は常に何かしら現実の環境要因によって世界を恣意的に見ている 例:自然言語における種族の分解

Slide 25

Slide 25 text

セグメントに正解はない。そこにあるのは「世界をどう見たいか」という “意思の反映” 言語学等、世界の認識に関する学問でも提唱されていることと同じ 日本語:鳩 英語:白い鳩はDove 黒い鳩はPigeon 仏語:Papillon(パピヨン) 日本語:蛾と蝶 日本語:ウマ モンゴル:オス or メス・去勢の有無・馬齢 が違うとそれぞれに専用の単語がある 英語:Rain 日本語:五月雨、時雨、霧雨、夕立、小雨、天気雨、俄雨
...400種類! → どこの国でも世界の存在は変わらないが、世界を切り取るセグメントのあり方は様々。 どれが正しいというものはない。あるのは「世界をどう分解すれば最も良く生きれるか」という視点の結果のみ

Slide 26

Slide 26 text

3ヶ月前 3ヶ月前 - - - ● ● ✕ ✕ ✕ ✕ ● ● 前々月 前々月 - - ✕ ✕ - 前月 前月 - - ● ● 初 今月 今月 初 初 新規 1000 1000 新規 既存 5,000 500 既存 ルーキー 復帰 2000 4500 2000 復帰 ● ● ● ● ● ユーザセグメントは事業で何を重んじるかを表現している必要がある。 ある程度既存ユーザが積み上がっている事業 シンプルさを重視して3セグメントに絞り込んで考える 新規ユーザの次月残存を重視するセグメント組みにする 新規ユーザの残存に課題がある事業 500 1000

Slide 27

Slide 27 text

いま必要な解像度 データは主観×客観 の重ね合わせ 客観性は美しさであり、弱さ 過度に客観的であろうとするスタンスは、怠慢であり、逃避であり、弱さである 事業とは「行動」の蓄積。 客観性と行動の間には距離がある。空→雨→傘 の間を誰が埋めるか? 客観的な事実を提供するだけで仕事が成立するのは、長いバリューチェーンを許容される環境だけ 自分がいるのがそういった環境であるのか、の峻別の上で判断されるべき

Slide 28

Slide 28 text

データの価値は何で決まるか Theme4

Slide 29

Slide 29 text

よく耳にする定説 データの価値はデータの量、データ基盤、 分析のクオリティで決まる Theme4

Slide 30

Slide 30 text

いま必要な解像度 データの価値はユースケースで決まる Theme4

Slide 31

Slide 31 text

データの価値は何で決まるか データの価値はユースケースで決まる 定説の否定:データの価値が出せる条件について解像度が低い データ分析によるアウトプットが機能する範囲はそれほど実は広くない。 間違った分野にどれだけリッチなデータを投入しても、 Rich-In / Garbage-Out になる スタートアップと同じ。間違った市場に参入した時点で、99%負ける データを適用するシーンが適切であればSmall Dataでも勝機は十分ある 「狭い必要十分条件」を理解する必要がある データは大概のシーンでMust-Haveな要素ではない データを使わずとも事業は最低限は成り立つ。この事実を真摯に受け止める必要がある 「スポーツ科学を知らずとも、Apple Healthcareを使わずともダイエットは出来る」

Slide 32

Slide 32 text

データ(分析)が機能するシーンの類型を理解する 経験上、パターンはそれほど多くない 80%は「対他者で必要だから」 20%は「自身が知りたいから」 善意のデータ活用は尊いが、20%程度。 監督者と実施者との間のフリクションが発生するところに陣取るほうがマーケットとしては強い 監督者と実施者との間のフリクション モデル(全体の80%) ガバナンス・監理(事業計画など) 大きい判断の正当化、説明責任(マーケティング投資など) 戦略 <-> 実行 の橋渡し、実行者への説明 と 実行からのフィードバック 善意のデータ活用 モデル(全体の20%) パフォーマンス連動で給与が決まるなど、どんな手を使っても成果を上げたい 自身のサービスのフィードバックと改善に純粋に飢えている ハマるユースケースを自分でイチから見つけ出すのは実は簡単ではない。事業の特性とガバナンス構造、 キーパーソンの性格の理解など、割と全人格的な能力が求められる。

Slide 33

Slide 33 text

サピエンスが優れているのは、集団で虚構(共同幻想)を共有するこ とで大人数でも一体となって行動できるから。 (サピエンス全史, ユヴァル・ノア・ハラリ) 企業組織はその代表例。 会社のような大人数の集団が一致団結してコトに当たるのは実はそんなに簡単ではない 他者間で常に意見の不一致と疑いが発生する 集団の中で信じられる共通認識を作る、はデータの一つの大きな市場 この世で最もコストが高く付くことのひとつは「疑うこと」 データによって疑うコスト、意見の不一致や、不毛な主観同士の衝突を調停するだけで、組織のスルー プットは大きく上がる

Slide 34

Slide 34 text

余談 データと世界3大発明 羅針盤 → 意思決定材料 主な功績:大航海時代において、航海の成功率(生還率)を高め、世界の開拓に寄与 例えると:正しい意思決定のための材料 活版印刷 主な功績:教会にしかなかった聖書を一般家庭でも保有可能にするなど、情報の非対称性の打破 例えると:正しい情報や方針の普及啓蒙、社会上層部のサイロ化の喝破 火薬 → AI 等 主な功績:火薬を用いた武器により、それまでの「兵力(頭数) 」∝ 勝率 の構造に技術力が介入 例えると:データを用いたビジネス、非労働集約依存型のビジネスモデルの創出

Slide 35

Slide 35 text

Conclusion 1 データを使うとはどういうことか 情報量をデータ消費者の言語体系に調整すること (定説:データをビジネスに役立てること ) 2 データ分析は何に使えるか データは意思決定と実行の間にある (定説:データは意思決定のためにある ) 3 データに必要な態度とは データは主観×客観 の重ね合わせ (定説:データは常に客観的であるべき ) 4 データの価値は何で決まるか データの価値はユースケースで決まる (定説:データの価値はデータの量、データ基盤、分析のクオリティで決まる ) Conclusion

Slide 36

Slide 36 text

結論 正直、データについての一般的な言説は、不正確で無責任な幻想が多い。 それらは主に「事業とデータの交点」に関する解像度の低さから来ている。 机上の空想から生み出された、現実には役立たないセオリーに惑わされないこと。 常に「十分な解像度で理解しているか」を意識すること。データも事業も。 Conclusion