Slide 1

Slide 1 text

意思決定につなげる データサイエンティストであるために 白金鉱業 Meetup Vol.11 2019/10/24 Kei Inoue

Slide 2

Slide 2 text

なぜ、使われない分析が生まれるのか?

Slide 3

Slide 3 text

分析が意思決定に使われないのは データサイエンティストの仕事で悲しいことのひとつ

Slide 4

Slide 4 text

数理 モデリング 意思決定 デザイン 意思決定につなげる仕事をする

Slide 5

Slide 5 text

自己紹介 井上 佳 (Kei Inoue) データサイエンティストの苦労がチョットワカル • 株式会社ブレインパッド • データサイエンティスト部署の副部長(受託分析 90名弱) 略歴 • 自動車会社で数理を使った業務カイゼン担当 • ブレインパッドで受託分析プロジェクトマネジャー ※本発表は個人の見解で、所属する組織の公式見解ではありません 1章が無料で読めます https://note.mu/morikita/n/n4fdfc62cec29

Slide 6

Slide 6 text

データサイエンティストは意思決定の支援者 • 意思決定とは、目標を達成するための方策を選択肢から選ぶこと • 意思決定に至る方法はデータ以外にもある データ サイエンティスト 実行者 意思決定者 意思決定に基づく 指示 データ分析による 知見・洞察の提供

Slide 7

Slide 7 text

意思決定の支援は色々なところでつまづく 途中で終わるプロジェクト 積まれるレポート 使われないシステム AIで何をすべきかわからない 延々と精度不足で先へ進まない ユーザーが使ってくれない 思ったほど成果がでない モデル運用が大変 活用される分析結果

Slide 8

Slide 8 text

失敗の一因は、意思決定サイクルをまわせていないこと よくある原因 • AIなら何かいい結果が出せるだろう(目的の曖昧さ) • それを予測しても意味がない(アウトプットの設計不備) • 深層学習を使いたい(手段の目的化) • 使えない、意味がわからない(ユーザーの非協力) • 今あるデータが使えるはずだ(データがない、低品質) • ROIがでない、業務インパクトが出てない(精度の不足) • PoCができれば本番もいけるはず(スコープ調整の不足) • 担当者の推進力がない(プロジェクトマネジメントの不足) • ツールを使えば誰でもできるはずだ(体制、スキル不足) 意思決定プロセスを 曖昧にしたまま進めがち 状況に適応した 意思決定サイクルが まわせていない その他、 プロジェクト進行の問題

Slide 9

Slide 9 text

2種類の意思決定に対して答える必要がある 1.実現したい意思決定そのもの • その製品は不良品か? • どのくらい商品を発注すべきか? • 顧客に対してどんな施策を打つべきか? 2.メタ意思決定 • AIを意思決定に組み込むべきか? • どのようなAI/数理的な枠組みが妥当か? • そのデータ分析の結果は信頼してよいか? PoCで暗黙的に求められるもの 1について答えを出す過程で2を証明する

Slide 10

Slide 10 text

意思決定の支援にはデータサイエンスだけでは限界がある 意思決定 の質 定型・くりかえし 可逆・検証容易 類似の状況下での判断 アクションが多様 唯一の状況・1回の判断 不可逆・検証困難 データ の状況 データが十分にある データと経験が一致する データが一部しかない ノイズ、欠損がある 多変量・非線形・非定常・分散大 データがない データ化できない 正解の定義が困難 難易度 意思決定の自動化が可能 (機械学習エンジニアの領域) AIに対する期待、ニーズが高いが それだけでは戦えない (データサイエンティストの領域) アート・ビジョンの世界 (起業家の領域) 不良品検知 商品企画 在庫管理 事業戦略 マーケ施策 レコメンデーション CRM 自動運転 配送計画 要素作業 戦略立案

Slide 11

Slide 11 text

数理 モデリング 意思決定 デザイン 意思決定につなげる仕事をする

Slide 12

Slide 12 text

数理 モデリング 意思決定 デザイン 2つの軸で仕事をシフトする 1.意思決定プロセスをつなげる 2.感性品質を 高める

Slide 13

Slide 13 text

数理 モデリング 意思決定 デザイン 2つの軸で仕事をシフトする 1.意思決定プロセスをつなげる 2.感性品質を 高める

Slide 14

Slide 14 text

意思決定フレームワークOODAで考える Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動

Slide 15

Slide 15 text

自動車の運転におけるOODAの例 Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 • 時速20m/sで走っている • 右折箇所まで40mある • 対向車が見える • 2秒後右折箇所に到達する • そのまま右折すると対向車と衝突しそう • 加速していくより減速したほうが安全 • 減速して対向車をやり過ごして右折 • ブレーキを踏む

Slide 16

Slide 16 text

OODAに対応する分析タスク Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 変数xの理解 関数f(x)の構築 適用・最適化 argmax g(x) 変数の操作 数理的 解釈 データアセスメント 基礎集計 特徴量作成 予測モデル構築 制約条件の設定 シミュレーション ハイパラ・閾値の決定 予測・最適化 (部分問題) データ タスク

Slide 17

Slide 17 text

OODAに対応する分析タスク Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 変数xの理解 関数f(x)の構築 適用・最適化 argmax g(x) 変数の操作 数理的 解釈 データアセスメント 基礎集計 特徴量作成 予測モデル構築 制約条件の設定 シミュレーション ハイパラ・閾値の決定 予測・最適化 (部分問題) データ タスク すべてを数理的につなげて構築できると美しいが、 現実はそうではない

Slide 18

Slide 18 text

データアセスメント 基礎集計 特徴量作成 予測モデル構築 制約条件の設定 シミュレーション ハイパラ・閾値の決定 予測・最適化 (部分問題) データ タスク ドメイン知識・ 非データの収集、理解 情報の統合 現実的方策の列挙 影響の把握 意思決定基準設定 意思決定 (部分問題) 非データ タスク 非データタスク含めて意思決定サイクルを回す Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 意思決定による行動までつなげてサイクルをまわしていくことが重要

Slide 19

Slide 19 text

データアセスメント 基礎集計 特徴量作成 予測モデル構築 制約条件の設定 シミュレーション ハイパラ・閾値の決定 予測・最適化 (部分問題) データ タスク ドメイン知識・ 非データの収集、理解 情報の統合 現実的方策の列挙 影響の把握 意思決定基準設定 意思決定 (部分問題) 非データ タスク 集計だけでも十分貢献できるパターン Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 • 状況判断に足るモデルがデータ不足によりできないが、 人間で情報の統合がうまくいって貢献できる

Slide 20

Slide 20 text

ハイパラ・閾値の決定 予測・最適化 データアセスメント 基礎集計 特徴量作成 予測モデル構築 制約条件の設定 シミュレーション (部分問題) ドメイン知識・ 非データの収集、理解 情報の統合 現実的方策の列挙 影響の把握 意思決定基準設定 意思決定 (部分問題) データ タスク 非データ タスク 「肌感と違うんだけど・・・」パターン Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 • 意思決定者に対していきなり最適化結果だけを見せてしまう • データ/非データの観察・状況判断を意思決定者と並走していく

Slide 21

Slide 21 text

データアセスメント 基礎集計 特徴量作成 予測モデル構築 制約条件の設定 シミュレーション ハイパラ・閾値の決定 予測・最適化 (部分問題) ドメイン知識・ 非データの収集、理解 情報の統合 現実的方策の列挙 影響の把握 意思決定基準設定 意思決定 (部分問題) データ タスク 非データ タスク 「面白かったよ、で何が言えるの?」パターン Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 • 状況判断につながらない集計や予測タスク • 目的が曖昧なままの作業化、作りっぱなしで方策につなげられない

Slide 22

Slide 22 text

目的に沿った状況判断を行う 精度が高いし、 需要予測に基づいて生産すれば 在庫・欠品がゼロになる! • オペレーション改善=精度向上の罠 • なぜ余剰、欠品が起きるか?を見出すべき 精度が低くても、予測値をそのまま 使うことだけが方策ではない • 管理不能な要素(天気/休日)と 管理可能な要素(価格/広告/…)のダイナミズム • 価格を変えるか? • 多めに生産して雨天施策を実施するか? • 生産リードタイムを短縮するか?

Slide 23

Slide 23 text

「とりあえず施策案出してよ」パターン・「AIやりたいんだ」パターン Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 前提・目的 • 行動の結果が評価されておらず、サイクルがまわっていない • 目的自体の修正が必要(ダブルループ学習)

Slide 24

Slide 24 text

データアセスメント 基礎集計 特徴量作成 予測モデル構築 制約条件の設定 シミュレーション ハイパラ・閾値の決定 予測・最適化 (部分問題) ドメイン知識・ 非データの収集、理解 情報の統合 現実的方策の列挙 影響の把握 意思決定基準設定 意思決定 (部分問題) データ タスク 非データ タスク 「精度向上しないと使えないよ」パターン Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 • 精度とビジネスインパクトの関係をイメージできていないまま 精度向上を求められる

Slide 25

Slide 25 text

モデル精度への投資と実際の効果を考えたQCDマネジメント 精度 時間 精度 効果 精度と効果が直結 (オペレーション直結) 精度に対して効果が逓減 (オペレーションで吸収) 効果が不連続 (人員削減など、方策の制約) 精度はすぐ頭打ち(Kaggleも同じ) ブレークスルーなしに時間をかけるのは望み薄 モデル精度だけでなくトータルのビジネスインパクトのイメージを考える

Slide 26

Slide 26 text

数理 モデリング 意思決定 デザイン 2つの軸で仕事をシフトする 1.意思決定プロセスをつなげる 2.感性品質を 高める

Slide 27

Slide 27 text

製造業における品質の考え 製造品質 できばえの品質 ばらつき・不良がない(公差±x%以内) 設計品質 ねらいの品質 スペックが高い(高馬力、低燃費) 感性品質 使用者が感じる品質(UX) かっこいい、気持ちいい、高級、安心 昔は製造品質でも差別化要素となったが、今は感性品質の時代

Slide 28

Slide 28 text

意思決定支援の品質とめざすべきところ 製造品質 再現性 再現性 汎化性 バグなし 設計品質 評価可能性 解決可能性 意思決定の意義 訓練データの精度 問題設定のよさ 感性品質 説明可能性(わかりやすいか) 負担感(楽か) 納得感(代案が検討されたか) 信頼感(議論が尽くされたか) 意思決定者に対して、感性品質を高めるアウトプットを作る データタスクの品質 意思決定の品質 ユーザーに対する品質 AutoML の台頭 重要性 が増す

Slide 29

Slide 29 text

モデルの説明性ではない、データサイエンティストのものがたり(UX) 『人は物語る動物である』 「当たり前の結果」・「肌感と違う」 という言葉の根底に、 ものがたり(ナラティブ)への欲求がある ディープラーニングは数式で表現される ホワイトボックス 関数(相関)から物語(因果)を語る

Slide 30

Slide 30 text

意思決定にはエネルギーがいる。それを助ける(UI) 単純作業的な意思決定の自動化は 受け入れられやすい。辛いから 少しでもわかりやすい可視化 アクションに紐づく指標化・ラベル化 不良品確率 [0.6] ランクB 取り除いて 検品してください

Slide 31

Slide 31 text

データ分析を通じたUX・UI・IAデザイン 意思決定支援の品質をUXまで含めてトータルで設計する 欠損・ノイズ モデル誤差 論理的誤謬 認知バイアス 数理 論理 認知 データ ドメイン知識 ・非データ データ サイエンティスト 意思決定者

Slide 32

Slide 32 text

データで紡ぎ、ココロ動かす、楽しいデータ分析のためのまとめ • 意思決定プロセス全体をつなげ、サイクルをまわす • 非データタスクも意思決定者と並走する • 情報の統合/現実的方策の列挙/影響の把握/意思決定基準の設定 • 行動の結果を次の観察フェーズや、前提・目的にフィードバックする • 設計・製造品質だけでなく、感性品質を高める • わかりやすいものがたり • 楽になる仕掛けづくり(可視化・指標化・ラベル化)

Slide 33

Slide 33 text

数理 モデリング 意思決定 デザイン チームで解決するか、今後のキャリアとするか 意思決定プロセスをつなげる 感性品質を 高める データ サイエンス デザイン デシジョン サイエンス

Slide 34

Slide 34 text

おわり