意思決定につなげるデータサイエンティストであるために / To be a data scientist who can make decisions

by BrainPad

Slide 1

Slide 1 text

意思決定につなげるデータサイエンティストであるために白金鉱業 Meetup Vol.11 2019/10/24 Kei Inoue

Slide 2

Slide 2 text

なぜ、使われない分析が生まれるのか？

Slide 3

Slide 3 text

分析が意思決定に使われないのはデータサイエンティストの仕事で悲しいことのひとつ

Slide 4

Slide 4 text

数理モデリング意思決定デザイン意思決定につなげる仕事をする

Slide 5

Slide 5 text

自己紹介井上佳 (Kei Inoue) データサイエンティストの苦労がチョットワカル • 株式会社ブレインパッド • データサイエンティスト部署の副部長(受託分析 90名弱) 略歴 • 自動車会社で数理を使った業務カイゼン担当 • ブレインパッドで受託分析プロジェクトマネジャー ※本発表は個人の見解で、所属する組織の公式見解ではありません 1章が無料で読めます https://note.mu/morikita/n/n4fdfc62cec29

Slide 6

Slide 6 text

データサイエンティストは意思決定の支援者 • 意思決定とは、目標を達成するための方策を選択肢から選ぶこと • 意思決定に至る方法はデータ以外にもあるデータサイエンティスト実行者意思決定者意思決定に基づく指示データ分析による知見・洞察の提供

Slide 7

Slide 7 text

意思決定の支援は色々なところでつまづく途中で終わるプロジェクト積まれるレポート使われないシステム AIで何をすべきかわからない延々と精度不足で先へ進まないユーザーが使ってくれない思ったほど成果がでないモデル運用が大変活用される分析結果

Slide 8

Slide 8 text

失敗の一因は、意思決定サイクルをまわせていないことよくある原因 • AIなら何かいい結果が出せるだろう（目的の曖昧さ） • それを予測しても意味がない（アウトプットの設計不備） • 深層学習を使いたい（手段の目的化） • 使えない、意味がわからない（ユーザーの非協力） • 今あるデータが使えるはずだ（データがない、低品質） • ROIがでない、業務インパクトが出てない（精度の不足） • PoCができれば本番もいけるはず（スコープ調整の不足） • 担当者の推進力がない（プロジェクトマネジメントの不足） • ツールを使えば誰でもできるはずだ（体制、スキル不足）意思決定プロセスを曖昧にしたまま進めがち状況に適応した意思決定サイクルがまわせていないその他、プロジェクト進行の問題

Slide 9

Slide 9 text

２種類の意思決定に対して答える必要がある１．実現したい意思決定そのもの • その製品は不良品か？ • どのくらい商品を発注すべきか？ • 顧客に対してどんな施策を打つべきか？２．メタ意思決定 • AIを意思決定に組み込むべきか？ • どのようなAI/数理的な枠組みが妥当か？ • そのデータ分析の結果は信頼してよいか？ PoCで暗黙的に求められるもの１について答えを出す過程で２を証明する

Slide 10

Slide 10 text

意思決定の支援にはデータサイエンスだけでは限界がある意思決定の質定型・くりかえし可逆・検証容易類似の状況下での判断アクションが多様唯一の状況・1回の判断不可逆・検証困難データの状況データが十分にあるデータと経験が一致するデータが一部しかないノイズ、欠損がある多変量・非線形・非定常・分散大データがないデータ化できない正解の定義が困難難易度意思決定の自動化が可能（機械学習エンジニアの領域） AIに対する期待、ニーズが高いがそれだけでは戦えない（データサイエンティストの領域）アート・ビジョンの世界（起業家の領域）不良品検知商品企画在庫管理事業戦略マーケ施策レコメンデーション CRM 自動運転配送計画要素作業戦略立案

Slide 11

Slide 11 text

数理モデリング意思決定デザイン意思決定につなげる仕事をする

Slide 12

Slide 12 text

数理モデリング意思決定デザイン２つの軸で仕事をシフトする１．意思決定プロセスをつなげる２．感性品質を高める

Slide 13

Slide 13 text

数理モデリング意思決定デザイン２つの軸で仕事をシフトする１．意思決定プロセスをつなげる２．感性品質を高める

Slide 14

Slide 14 text

意思決定フレームワークOODAで考える Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動

Slide 15

Slide 15 text

自動車の運転におけるOODAの例 Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 • 時速20m/sで走っている • 右折箇所まで40mある • 対向車が見える • 2秒後右折箇所に到達する • そのまま右折すると対向車と衝突しそう • 加速していくより減速したほうが安全 • 減速して対向車をやり過ごして右折 • ブレーキを踏む

Slide 16

Slide 16 text

OODAに対応する分析タスク Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動変数xの理解関数f(x)の構築適用・最適化 argmax g(x) 変数の操作数理的解釈データアセスメント基礎集計特徴量作成予測モデル構築制約条件の設定シミュレーションハイパラ・閾値の決定予測・最適化（部分問題）データタスク

Slide 17

Slide 17 text

Slide 18

Slide 18 text

データアセスメント基礎集計特徴量作成予測モデル構築制約条件の設定シミュレーションハイパラ・閾値の決定予測・最適化（部分問題）データタスクドメイン知識・非データの収集、理解情報の統合現実的方策の列挙影響の把握意思決定基準設定意思決定（部分問題）非データタスク非データタスク含めて意思決定サイクルを回す Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動意思決定による行動までつなげてサイクルをまわしていくことが重要

Slide 19

Slide 19 text

データアセスメント基礎集計特徴量作成予測モデル構築制約条件の設定シミュレーションハイパラ・閾値の決定予測・最適化（部分問題）データタスクドメイン知識・非データの収集、理解情報の統合現実的方策の列挙影響の把握意思決定基準設定意思決定（部分問題）非データタスク集計だけでも十分貢献できるパターン Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 • 状況判断に足るモデルがデータ不足によりできないが、人間で情報の統合がうまくいって貢献できる

Slide 20

Slide 20 text

ハイパラ・閾値の決定予測・最適化データアセスメント基礎集計特徴量作成予測モデル構築制約条件の設定シミュレーション（部分問題）ドメイン知識・非データの収集、理解情報の統合現実的方策の列挙影響の把握意思決定基準設定意思決定（部分問題）データタスク非データタスク「肌感と違うんだけど・・・」パターン Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 • 意思決定者に対していきなり最適化結果だけを見せてしまう • データ/非データの観察・状況判断を意思決定者と並走していく

Slide 21

Slide 21 text

データアセスメント基礎集計特徴量作成予測モデル構築制約条件の設定シミュレーションハイパラ・閾値の決定予測・最適化（部分問題）ドメイン知識・非データの収集、理解情報の統合現実的方策の列挙影響の把握意思決定基準設定意思決定（部分問題）データタスク非データタスク「面白かったよ、で何が言えるの？」パターン Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 • 状況判断につながらない集計や予測タスク • 目的が曖昧なままの作業化、作りっぱなしで方策につなげられない

Slide 22

Slide 22 text

目的に沿った状況判断を行う精度が高いし、需要予測に基づいて生産すれば在庫・欠品がゼロになる！ • オペレーション改善＝精度向上の罠 • なぜ余剰、欠品が起きるか？を見出すべき精度が低くても、予測値をそのまま使うことだけが方策ではない • 管理不能な要素(天気/休日)と管理可能な要素(価格/広告/…)のダイナミズム • 価格を変えるか？ • 多めに生産して雨天施策を実施するか？ • 生産リードタイムを短縮するか？

Slide 23

Slide 23 text

「とりあえず施策案出してよ」パターン・「AIやりたいんだ」パターン Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動前提・目的 • 行動の結果が評価されておらず、サイクルがまわっていない • 目的自体の修正が必要（ダブルループ学習）

Slide 24

Slide 24 text

データアセスメント基礎集計特徴量作成予測モデル構築制約条件の設定シミュレーションハイパラ・閾値の決定予測・最適化（部分問題）ドメイン知識・非データの収集、理解情報の統合現実的方策の列挙影響の把握意思決定基準設定意思決定（部分問題）データタスク非データタスク「精度向上しないと使えないよ」パターン Observe 観察 Orient 状況判断 Decide 意思決定 Act 行動 • 精度とビジネスインパクトの関係をイメージできていないまま精度向上を求められる

Slide 25

Slide 25 text

モデル精度への投資と実際の効果を考えたQCDマネジメント精度時間精度効果精度と効果が直結（オペレーション直結）精度に対して効果が逓減（オペレーションで吸収）効果が不連続（人員削減など、方策の制約）精度はすぐ頭打ち（Kaggleも同じ）ブレークスルーなしに時間をかけるのは望み薄モデル精度だけでなくトータルのビジネスインパクトのイメージを考える

Slide 26

Slide 26 text

数理モデリング意思決定デザイン２つの軸で仕事をシフトする１．意思決定プロセスをつなげる２．感性品質を高める

Slide 27

Slide 27 text

製造業における品質の考え製造品質できばえの品質ばらつき・不良がない（公差±x%以内）設計品質ねらいの品質スペックが高い（高馬力、低燃費）感性品質使用者が感じる品質（UX）かっこいい、気持ちいい、高級、安心昔は製造品質でも差別化要素となったが、今は感性品質の時代

Slide 28

Slide 28 text

意思決定支援の品質とめざすべきところ製造品質再現性再現性汎化性バグなし設計品質評価可能性解決可能性意思決定の意義訓練データの精度問題設定のよさ感性品質説明可能性（わかりやすいか）負担感（楽か）納得感（代案が検討されたか）信頼感（議論が尽くされたか）意思決定者に対して、感性品質を高めるアウトプットを作るデータタスクの品質意思決定の品質ユーザーに対する品質 AutoML の台頭重要性が増す

Slide 29

Slide 29 text

モデルの説明性ではない、データサイエンティストのものがたり（UX）『人は物語る動物である』「当たり前の結果」・「肌感と違う」という言葉の根底に、ものがたり（ナラティブ）への欲求があるディープラーニングは数式で表現されるホワイトボックス関数（相関）から物語（因果）を語る

Slide 30

Slide 30 text

意思決定にはエネルギーがいる。それを助ける（UI）単純作業的な意思決定の自動化は受け入れられやすい。辛いから少しでもわかりやすい可視化アクションに紐づく指標化・ラベル化不良品確率 [0.6] ランクB 取り除いて検品してください

Slide 31

Slide 31 text

データ分析を通じたUX・UI・IAデザイン意思決定支援の品質をUXまで含めてトータルで設計する欠損・ノイズモデル誤差論理的誤謬認知バイアス数理論理認知データドメイン知識・非データデータサイエンティスト意思決定者

Slide 32

Slide 32 text

データで紡ぎ、ココロ動かす、楽しいデータ分析のためのまとめ • 意思決定プロセス全体をつなげ、サイクルをまわす • 非データタスクも意思決定者と並走する • 情報の統合/現実的方策の列挙/影響の把握/意思決定基準の設定 • 行動の結果を次の観察フェーズや、前提・目的にフィードバックする • 設計・製造品質だけでなく、感性品質を高める • わかりやすいものがたり • 楽になる仕掛けづくり（可視化・指標化・ラベル化）

Slide 33

Slide 33 text

数理モデリング意思決定デザインチームで解決するか、今後のキャリアとするか意思決定プロセスをつなげる感性品質を高めるデータサイエンスデザインデシジョンサイエンス

Slide 34

Slide 34 text

おわり