機械学習を「社会実装」するということ 2023年版 / Social Implementation of Machine Learning 2023

Slide 1

Slide 1 text

೥൛ ʕ ࢲͨͪʹԿ͕Ͱ͖Δ͔ ʕ ※この資料は、東京⼤学メタバース⼯学部リスキリング⼯学教育プログラム GCI 2022 Winter の講義で使⽤したものです。

Slide 33

Slide 33 text

32 第３章︓社会実装を阻む「罠」と、その解決策【設計・開発・テスト】その開発、誰がやる︖ Copyright © Moe Uchiike All Rights Reserved. 業務理解課題抽出 1 データ収集 2 基礎集計基礎分析 3 問題設定 4 PoC 5 予算確保 6 要件定義 7 設計・開発・テスト 8 UAT 9 パイロット稼働 10 本番稼働 11 効果測定 12 保守・運⽤ 13 理想データサイエンスとエンジニアリングの両⽅に⻑けた⼈材が、プロジェクトを⼀貫して主導する罠解決策 • PoCが終わり、いよいよ開発フェーズとなったものの、いざ本番環境で開発するとなるとどのように開発していけばいいかわからない • データサイエンスに⻑けたメンバーと本番環境での開発に⻑けたメンバーがそれぞれいるが、コミュニケーションに難があり両⾞輪が動かない • PoCで書いたコードを本番環境に移植したいが、中途半端に抽象化されており取扱いに困る ü データサイエンスの担当者の他に、機械学習まわりのエンジニアリングの担当者 (機械学習エンジニア等) をアサインする (可能であれば初期段階からアサインしておき、スムーズに本番環境の開発に⼊れるように準備しておく) ü チーム内で最低⼀⼈が「翻訳者」となり、メンバー間のコミュニケーション促進の役割を担う ü PoCの段階からシステムリリースを⾒越してクラス設計等を丁寧にしておくか、あるいは敢えてJupyter Notebookで書き下す以上のことをしない分業を前提として翻訳者を配置するなど、現実的な解を出すのが王道ですが昨今は複数領域を担える⼈材が徐々に増えてきている印象です。 (個⼈の感想です)

Slide 34

Slide 34 text

33 第３章︓社会実装を阻む「罠」と、その解決策【UAT】信頼を得るのは難しい Copyright © Moe Uchiike All Rights Reserved. 業務理解課題抽出 1 データ収集 2 基礎集計基礎分析 3 問題設定 4 PoC 5 予算確保 6 要件定義 7 設計・開発・テスト 8 UAT 9 パイロット稼働 10 本番稼働 11 効果測定 12 保守・運⽤ 13 理想モデルの性能が良く、現場からの評判も上々。スムーズに次のフェーズに移⾏できる罠解決策 • 性能の良いモデルを提供しても現場担当者には旨味がなく、既存のオペレーションを変えたくない層からネガティブな意⾒が出る • 予測が外れたごく⼀部について現場担当者に固執されてしまい、モデルを信頼してもらえない • やらされている感や、利⽤者のプライドを傷つけることに繋がってしまう • 確かにモデルの性能は良いが、実際に現場のオペレーションに組み込んでみたところ、使いにくい部分があることがわかった ü 予測が当たった場合のメリットについて、経営⽬線だけでなく、現場⽬線で整理する ü 予測が外れた原因を可能な範囲で分析し、説明して納得してもらう ü 「選択の⾃由」を残し、最終的な意思決定を利⽤者に委ねるサービス仕様を検討する ü UI/UXの設計・開発⼯数を確保し、システム利⽤時のハードルを下げる ü ユーザーからの意⾒を漏れなく吸い上げ、改善すべき点については改善を試みる利⽤者に「使う側のメリット」を提⽰し、Win-Winの関係でプロジェクトを進めていくのが正解です。いかに⾼度なモデルも、結局のところ使ってもらえなければ宝の持ち腐れです。

Slide 48

Slide 48 text

47 考えてみよう︓モデルの品質、どこまで保証できる︖ (2/2) いかがでしたでしょうか。この問題に明確な答えがあるわけではありません。ですが、ありとあらゆることを考えなければならず、思考停⽌させてもらえないことがわかります。皆さんはどこまで想像できたでしょうか︖ 思いつくこと (例) • 精度90%の根拠はあるのか︖達成すると何が嬉しいのか︖ • 精度とは何を指しているのか︖* • データさえ増やしていけば改善され続けると誤解されていないか︖ • 機械学習モデルの精度を保証するのは現実的なのか︖ • 検証時の前提条件は本番環境で満たせるのか︖ • 有償の市況データを調達し続けられる保証はあるか︖ • モデルの検証結果に嘘はないか︖ (想定外のリーク) 我々が⽴ち向かわなければならないのは、まさにこのような問題の数々︕ Copyright © Moe Uchiike All Rights Reserved. • この先市況が⼤きく悪化した場合、モデルの予測性能に再現性はあるのか︖ • 予測性能そのもの以外にも、可⽤性や処理速度、モデルの解釈性や公平性などが保証対象となり得るのではないか︖ • 動作保証ならできる可能性があるが、そのためには前提条件や免責事項を明⽰する必要があるのではないか︖ • 性別を特徴量とする与信審査システムは公平性を⽋いており、社会的要請を満たしていないのではないか︖ *: ⼆値分類の正解率、適合率、属性別の貸し倒れ率の誤差、これらに貸し倒れ時の損害規模で重みづけする必要の有無、あるいは属性別の貸し倒れリスクをある程度の幅で予測できればいいのか等が考えられる。

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Slide 32

Slide 32 text

Slide 33

Slide 33 text

Slide 34

Slide 34 text

Slide 35

Slide 35 text

Slide 36

Slide 36 text

Slide 37

Slide 37 text

Slide 38

Slide 38 text

Slide 39

Slide 39 text

Slide 40

Slide 40 text