Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Randomized Controlled Trial

Randomized Controlled Trial

科学的検証に基づくビジネスの意思決定

Takumi Kato

September 13, 2022
Tweet

More Decks by Takumi Kato

Other Decks in Marketing & SEO

Transcript

  1. 位置付け 顧客管理と効果測定 戦略と実⾏ 価値づくりの考え⽅ 調査による客観的な状況把握 #01 マーケティング #02 ブランドマネジメント #04

    市場調査 #07 科学的検証 #08 感性⼯学 #05 消費者⾏動 #03 ロイヤルティとCRM #10 クチコミ #09 戦略と組織能⼒ 仮説⽴案 具現化 検証 #06 知覚品質
  2. 「強い⼯場・弱い本社」症候群1 1: 藤本隆宏. (2004). ⽇本のもの造り哲学. ⽇本経済新聞社 ⽇本のメーカーは,依然として現場のオペレーション能⼒は⾼い。 にもかかわらず,収益⼒で劣るのは,「戦略的な弱さ」が要因。 • ⼯場は安定の源泉,本社は⼤きな成⻑の源泉

    - ⽇本︓強い⼯場・弱い本社 → 安定的な利益 - 北⽶︓弱い⼯場・強い本社 → 短期間に⼤きな収益・損失 • オペレーションの強い組織は極端に下がることは少ないが, その上に戦略があれば,確実に強くなる
  3. 「会議の準備」という膨⼤な作業 1: Mankins, M. (2014). Yes, You Can Make Meetings

    More Productive. Harvard Business Review, https://hbr.org/2014/06/yes-you-can-make-meetings-more-productive. 2:パーソル総合研究所. (2018).無駄な社内会議による企業の損失額を算出従業員1万⼈規模で年間15億円,1500⼈規模で年間2億円の損失. https://rc.persol- group.co.jp/news/201809060935.html 3: Mankins, M. C. (2004). Stop wasting valuable time. Harvard Business Review, 82(9), 58-67. • 1万⼈規模の企業では,無駄な会議時間は300⼈以上の年間業務量に達する1-2 • 経営会議の65%以上は,意思決定ではなく,単なる情報交換等に使われる3 意思決定の根拠が曖昧なまま,決裁者によって求めるものが異なるため, 会議の準備・会議⾃体に膨⼤なムダが発⽣
  4. 無意識に⼊り込むノイズとバイアス ⼈間の意思決定は,無意識にあまりに多くの影響を受けるため, 科学的根拠に基づいていなければ,無駄が発⽣して当然 (過去の経験,話題のニュース,報告部⾨・報告者,気分,空腹具合,天気,椅⼦の固さ...) 1: Kahneman, D., Rosenfield, A. M.,

    Gandhi, L., Blaser, T. (2016). Noise: How to overcome the high, hidden cost of inconsistent decision making. Harvard business review, 94(10), 38-46. ノイズが少ない バイアスが少ない 成功確率の⾼い 意思決定 バイアスが⼤きく いつも偏った意⾒ ノイズが⼤きく コロコロ変わる 意思決定におけるノイズとバイアス1
  5. 意思決定にはびこるバイアスの例 Soyer, E., Hogarth, R. M. (2015). Fooled by experience.

    Harvard Business Review, 93(5), 72-77. 結果 バイアス 利⽤可能性 バイアス 確証 バイアス • プロセスより結果重視 • 偶然の成功を過信 • 1回の失敗で価値ある戦略を破棄 • ⾃分が思いつく範囲の情報に頼る • ⾝近な情報を過⼤評価 • ⼿元のデータの偏りに気づかない • 意向に沿わない情報を無意識に排除 • ⾃説を⽀持する情報を収集 • 質が低い過去の経験の記憶を過信
  6. 意思決定へのアプローチ 感覚的・場当たり的な意思決定と検証しない⽂化では,PDCAを回せない あるべき意思決定 ありがちな意思決定 Plan Do Check Action 根拠に基づく戦略 戦略

    具現化 予測と実績の乖離 に対する原因分析 具体的 改善 Plan Do Check Action 感覚的・場当たり的な戦略 戦略なき 全⽅位的 実⾏ 科学的検証をせず 失敗を活かせない 単なる 次期計画 • 在宅勤務の検証はしたか︖ • 多様性導⼊の検証はしたか︖ • 採⽤基準の検証はしたか︖ 例
  7. 選択バイアスを回避した統計学者の意思決定 Denrell, J. (2005). Selection bias and the perils of

    benchmarking. Harvard Business Review, 83(4), 114-9. 第⼆次世界⼤戦中の⽶軍の意思決定 • 帰還した戦闘機は⾚い点が集中被弾しており,その補強をしようとしていた • しかし,統計学者のワルドは,被弾していない部分を強化すべきと提⾔ • なぜなら,被弾しても帰還できたということは,そこは致命的な部位ではない Image from: Wikipedia 成功事例を集めても因果関係の特定は難しく,そこから仮説を⽴てて検証すべき
  8. 成功事例から導かれた優秀企業の集落 Smith, G. (2014). Standard deviations: Flawed assumptions, tortured data,

    and other ways to lie with statistics. Abrams. • エクセレント・カンパニー出版の15年後には,優良企業は43社中5社のみ • 成功企業の統計分析から導かれた結論は,いつも凋落の⼀途を辿る • 成功企業の特徴を探せば何かしら共通点は⾒つかるが,因果効果ではない Tom Peters (1982) エクセレント・カンパニー Jim Collins (1994) ビジョナリー・カンパニー
  9. • なによりも根本的な思想に重きを置く • Toyotaの実例を横展開しても,上⼿くいかないことを⼗分に理解 • 実際に教える具体的内容は,製品の特徴・企業の内情・現在の実⼒ によって柔軟に変える 1: 藤本隆宏. (2004).

    ⽇本のもの造り哲学. ⽇本経済新聞社. Toyota式カイゼンは「⽅法」ではなく「思想」 書籍等で得た具体内容をマネしただけで満⾜している組織に, 思想を植え付けると,短期間で⽣産性が何倍にも⾼まる カイゼンを外部に伝える場合1
  10. 問題の発⾒ 仮説⽴案 検証 意思決定⽀援 • 感染症の原因は負傷ではなく,不衛⽣な環境にあると推察 • ベッド間隔の拡張,換気,シーツの洗浄が効果的と仮説を⽴案 • 繰り返しの検証から,対策の効果を定量的に算出

    • 数字嫌いなヴィクトリア⼥王にグラフでわかりやすく説明 ナイチンゲールの科学的な意思決定⽀援 野戦病院における感染症の発症率低減1 1: 新井紀⼦. (2018). AI vs. 教科書が読めない⼦どもたち. 東洋経済新報社.
  11. この商品・サービスのコンセプトは何なのか︖どんな問題を解決してくれるのか︖ AI ウェルネス SDGs サステナブル ロボティクス DX コネクテッド シェアリング パーソナライズ

    世界初 オープン イノベーション コトづくり デザイン シンキング ⾃動運転 VR/AR メタバース 電動化 6G 相関に溺れた結末
  12. 1. そもそも解決したい問題が不明確 2. 問題の原因とその対策(仮説)を考える時間が圧倒的に少ない 3. 設計した調査・検証を実施しない (探索と検証が同じデータ) 4. 再現性を気にせず,1回の検証で結論を導出 5.

    (⽬的ドリブンではなく)⼿元にあるデータドリブン 6. 信頼性の乏しい膨⼤なデータを気にせず使⽤ 7. (分析の前に)やりたいことが決まってる 相関を追い求めやすいプロジェクトの特徴 解決したい問題なきまま,トレンドを追い,ビッグデータを集め,相関を探すべからず
  13. 価値づくりの仕事 仮説⽴案 検証 • 重要な問題を発⾒したか︖ • どれだけ仮説を考えたか︖ • どれだけ試作したか︖ ・価値を考える

    ・つくる • 科学的に検証しているか︖ • どれだけ検証したか︖ • 消費者の実環境で検証したか︖
  14. 科学である条件 相関ではなく,因果 (有効性) • 相関と因果は天と地の差であり,因果を推定して効果を主張すること • 因果効果の推定には仮説が必要であり,適切な調査・検証を設計すること 偶然ではなく,再現可能 (再現性) •

    いつ,どこで,だれが検証しても,再現が可能であること • もし主観が必要な場合は,理論に基づいた明確な基準を設定すること 思いつきではなく,先⼈の知の上に⽴つ主張 (新規性) • 先⼈の積み重ねた知⾒に基づいて,新たな知⾒を導出すること • “型があるから型破り,型がなければ型なし”
  15. 「データ=科学的」では断じてなく,信頼性の⾼い検証⽅法を重視すべき 科学的根拠としての信頼性 メタ分析 ランダム化⽐較試験 (RCT) 調査観察研究 回帰分析 信頼性 低 ⾼

    複数のランダム化⽐較試験 の結果を統合して結論を導出 最も信頼性が⾼い 因果効果の検証⽅法 実験ができない場合に 擬似的に無作為割付する⽅法 簡単にできるが,未知の交絡因⼦の 影響除外は困難
  16. 因果効果を推定する2つのアプローチ ランダムに割り当てた実験が可能か否かによって,2つのアプローチに分けられる 因果効果 の推定 実験検証 調査観察検証 • 処置を施す処置群と施さない統制群を⽐較 • 最重要ポイントは,2群の無作為割当

    • 例︓ランダム化⽐較試験 (RCT) • 理論的・倫理的に, 処置の無作為割当が 困難な場合に観察データから因果推定 • 例︓傾向スコア 実験ができる場合 実験ができない場合
  17. ⾮常に厳しい (=価値づくりに意味がある)評価⽅法のため,簡単に結果は出ない ランダム化⽐較試験は厳しい評価⽅法 過剰な評価 (⼀対⽐較, 全選択肢提⽰) A B C D

    1位︓B 2位︓A 3位︓C 4位︓D ランダム化 ⽐較試験 A B C D 差異なし (購⼊⾏動に影響の あるものだけを評価) 何の 意味︖
  18. RCTに基づいた意思決定の実践 1: Iyer, B., Davenport, T. H. (2008). Reverse engineering

    Google's innovation machine. Harvard Business Review, 86(4), 58-68. 2:伊藤公⼀朗. (2017). データ分析の⼒ 因果関係に迫る思考法 (光⽂社新書). • 意思決定は分析的かつ⺠主的 (≠感覚的・官僚的) • ⽇々何千件という無作為抽出によるRCTを実施 • デザインや広告,⾔葉遣いまで,科学で決定 Google • 経済学の博⼠が分析部隊を率いる • 「UberはRCTに積極的」と⼤学に呼びかけ • ダイナミックプライシングを科学的検証から推定 Uber
  19. RCTの調査設計のカギ 環境によって⾏動は⼤きく変わるため,物理的・⼼理的環境の設計が肝 ホーソン効果 注⽬を浴びることで,期待に応えようとする⼼理から,⾏動に良い変化が起きる 被験者に「誰が・何の検証を・どうやってしているのか」を意識させない • 普段の環境と異なる要素はないか︖ • 処置の説明をしてしまっていないか︖ •

    普段意識することがない項⽬を無理に聞いていないか︖ ⽣産性向上の検証1 • ⼯場における照明の明るさや,報酬・休憩時間が⽣産性に与える影響を検証 • 従業員は実験対象に選ばれ,注⽬されているという意識から⽣産性が向上した 1: Mayo, E. (1933). The human problems of an industrial civilization. New York, Macmillan. (村本栄⼀訳. (1967). 産業⽂明における⼈間問題 ホーソン実験とその展開.⽇本能率協会)
  20. データ形式別の統計検定⽅法 ランダム化⽐較試験で得たデータは,形式に基づいて,適切な検定⽅法を選択 フリードマン検定 ウェルチのt検定 スチューデントのt検定 対応のあるt検定 分散分析 カイ⼆乗検定 フィッシャー正確確率検定 ブルンナー・ムンツェル検定

    ウィルコクソンの順位和検定 マン-ホイットニーのU検定 フィッシャーの正確確率検定 ウィルコクソンの符号順位検定 マクネマー検定 クラスカル・ウォリス検定 データ形式 連続 カテゴリー ・2値 正規分布 2群 対応あり 多群 非正規分布 2群 対応なし 対応あり 多群 等分散 等分散を 仮定しない 2群 対応なし セル内件数 が多い セル内件数 が少ない 対応あり 多群 対応のある t検定 分散分析 ブルンナー ・ ムンツェル 検定 ウィルコク ソンの符号 順位検定 フリードマ ン検定 ウィルコク ソンの順位 和検定 or マン-ホイッ トニーのU 検定 カイ二乗 検定 フィッシャ ーの正確 確率検定 マクネマー 検定 対応なし 等分散 等分散を 仮定しない ウェルチのt 検定 スチューデ ントのt検定 クラスカル ・ウォリス 検定 対応なし 対応あり セル内件数 が多い セル内件数 が少ない カイ二乗 検定 フィッシャ ーの正確 確率検定
  21. 因果効果を推定する2つのアプローチ 因果効果 の推定 実験検証 調査観察検証 • 処置を施す処置群と施さない統制群を⽐較 • 最重要ポイントは,2群の無作為割当 •

    例︓ランダム化⽐較試験 (RCT) • 理論的・倫理的に, 処置の無作為割当が 困難な場合に観察データから因果推定 • 例︓傾向スコア 実験ができる場合 実験ができない場合
  22. 調査観察研究の代表例 2社の⽔道利⽤者のうち,属性を同質化して,⽔道の影響を因果評価 1894年ロンドンにおけるコレラの発⽣原因の特定 • コレラの原因は,汚染された空気と考えられていた • 「テムズ川に放出された下⽔を飲み⽔に循環していることが原因」と仮説⽴案 • ランダム化⽐較試験の実施は困難なため,調査観察研究の実施を模索 •

    ちょうどその時期に,ロンドンの2⼤⽔道局の1社が,テムズ川以外の地域から ⽔を引く⼯事を実施したため,2社の⽔道利⽤者の差異を検証した • その結果,テムズ川の⽔道利⽤者に有意にコレラが発⽣したことが判明 Smith, G. (2014). Standard deviations: Flawed assumptions, tortured data, and other ways to lie with statistics. Abrams.
  23. END