Slide 1

Slide 1 text

意思決定支援AIのための 心理学・認知科学 香川璃奈 2024/11/20 オンラインJC

Slide 2

Slide 2 text

認知科学会で話した内容です。。。 https://speakerdeck.com/rinabouk/jcss2024 18〜37枚目

Slide 3

Slide 3 text

ナッジを使って意思決定が改善する過程 Callaway, F., Hardy, M., & Griffiths, T. L. (2023). Optimal nudging for cognitively bounded agents: A framework for modeling, predicting, and controlling the effects of choice architectures. Psychological Review.

Slide 4

Slide 4 text

/ 86 背景 uナッジを利用して意思決定が改善する現象…理論的な枠組みがない u心理学的アプローチ:個別のナッジについて直感的な説明を提供 u経済学的アプローチ:数理モデルによる抽象的な説明を提供 u両者とも、ナッジの具体的な効果を予測できない 目的 uナッジを理解・予測・設計するための統一的な数理的枠組みの提案 提案する新しいアプローチ uResource-Rational Analysis(資源合理的分析)の枠組みを活用 u人間の認知的制約を考慮した上で、最適な意思決定プロセスをモデル化 背景&目的

Slide 5

Slide 5 text

/ 86 uデフォルト選択肢 背景&目的 u代替案の提案 u情報ハイライト https://note.com/policygarage/n/n331dbed68a31 レストランで「食べ残しを持ち帰りできる」という選択肢を与える ▷ 食品ロスの削減 食品の栄養価 注目してほしい栄養価を目立たせる ▷ 健康的な選択が増える

Slide 6

Slide 6 text

/ 86 uresource rationality (資源合理性) u人間の認知能力には限界がある u人間が限られた認知資源をどうやってうまく配分するかを考える u人間の計算コストと、得られる効用のトレードオフを明示的に考える 心理学・認知科学の知見

Slide 7

Slide 7 text

/ 86 u背景 u数理モデルの提案 u行動実験と数値モデルの一致を示す u実験1 デフォルト選択肢 u実験2 代替案を示す u実験3 情報ハイライト u最適なナッジの構築方法 u実験4 信念更新に最適なナッジの提案 u実験5 探索コストを削減するナッジの提案 u考察・まとめ 論文の概要

Slide 8

Slide 8 text

/ 86 人間の内部計算コストと、外部効用を明示的にトレードオフする ◁ 資源合理性 提案モデル メタレベルマルコフ決定過程

Slide 9

Slide 9 text

/ 86 提案モデル オプション"の特徴量#を考える計算操作 現在の信念┛ 報酬関数$!"#$が、計算コストと行動した際の報酬の、両方を記述する (式5, 6) $!"#$ %, '$,& , ( = −,$,& for ' ≠⊥ (式5) $!"#$ %, ⊥, ( = $'()"*# (, " ∗ % = ∑ & 1& 2$∗ ( ,& (式6) ┗オプション"の特徴量#を考えるコスト 選択肢の特徴とエージェントの選好を指定する状態 現在の信念%での期待値が最大になるオプション(行動)" 特徴量#の重み 信念%で選んだオプション"の特徴量#の値

Slide 10

Slide 10 text

/ 86 マウスラボ 意思決定に関する有名な実験 実験画面 https://stoplight-highlighting.netlify.app/ 情報ハイライトナッジ 行動実験

Slide 11

Slide 11 text

/ 86 情報ハイライトナッジ 行動実験 5つのバスケットから、得られるポイントが最も高い1つを選ぶ 各バスケットには 賞品A, B, Cが いくつかずつ 入っている。 Aが1個、Bが2個、Cが3個入っているバスケット 20×1+ 9×2+ 1×3 = 41ポイント マウスラボ 意思決定に関する有名な実験 実験画面 https://stoplight-highlighting.netlify.app/

Slide 12

Slide 12 text

/ 86 情報ハイライトナッジ 行動実験 1 コスト -3 マウスラボ 意思決定に関する有名な実験 実験画面 https://stoplight-highlighting.netlify.app/

Slide 13

Slide 13 text

/ 86 情報ハイライトナッジ 行動実験 1 6 コスト -6 マウスラボ 意思決定に関する有名な実験 実験画面 https://stoplight-highlighting.netlify.app/

Slide 14

Slide 14 text

/ 86 情報ハイライトナッジ 行動実験 1 6 3 コスト -9 マウスラボ 意思決定に関する有名な実験 実験画面 https://stoplight-highlighting.netlify.app/

Slide 15

Slide 15 text

/ 86 情報ハイライトナッジ 行動実験 商品Bの個数を見る ためのコスト小 マウスラボ 意思決定に関する有名な実験 実験画面 https://stoplight-highlighting.netlify.app/

Slide 16

Slide 16 text

/ 86 情報ハイライトナッジ 行動実験 u提案したモデルは行動実験の結果を再現している

Slide 17

Slide 17 text

/ 86 応用:意思決定支援AI Li, Z., Lu, Z., & Yin, M. (2024, March). Decoding AI’s Nudge: A Unified Framework to Predict Human Behavior in AI-assisted Decision Making. In Proceedings of the AAAI Conference on Artificial Intelligence (Vol. 38, No. 9, pp. 10083-10091).

Slide 18

Slide 18 text

/ 86 応用:LLMの行動アライメント Cherep, M., Singh, N., & Maes, P. Superficial Alignment, Subtle Divergence, and Nudge Sensitivity in LLM Decision-Making. In NeurIPS 2024 Workshop on Behavioral Machine Learning. 人にみせるデフォルトナッジ LLMに与えるデフォルトナッジ デフォルト選択肢を選択する確率 ChatGPT-4o + few shot prompt ▷ ナッジへの反応が最も人間に近い 行動の説明を要求 ▷ ナッジへの反応は人間に近づかず (Appendix A2, A3)

Slide 19

Slide 19 text

過度な解釈可能性は理解を妨げる Kaur, H., Conrad, M. R., Rule, D., Lampe, C., & Gilbert, E. (2024). Interpretability Gone Bad: The Role of Bounded Rationality in How Practitioners Understand Machine Learning. Proceedings of the ACM on Human-Computer Interaction, 8(CSCW1), 1-34.

Slide 20

Slide 20 text

/ 86 背景 u機械学習(ML)の実務家やユーザーがMLモデルを正しく理解することが必要 u解釈可能性ツールが開発されてきた uこれらはどこまで有効か? uツール ▷ 情報過多や過度の信頼 ▷ 正確な判断を妨げる 目的 u解釈可能性ツールがML実務家の判断の正確性や認知的負荷に与える影響の検証 u人間が解釈可能性ツールを十分に使いこなせない理由として、限定合理性を仮定 背景&目的

Slide 21

Slide 21 text

/ 86 ubounded rationality (限定合理性) u人間の認知能力には限界がある usatisficing (満足化) = satisfy + suffice u人間は、目的関数が最大化されなくても、ある閾値を達成すれば満足する。 心理学・認知科学の知見 Herbert A Simon. 1955. A behavioral model of rational choice. The quarterly journal of economics 69, 1 (1955), 99–118.

Slide 22

Slide 22 text

/ 86 uML実務家が u異なる解釈可能性ツールを用いた際の uMLモデルの理解の正確性や、ツール利用の際の認知的負荷などを比較した。 u行動実験1つだけ u心理学分野の知識を参考にして、丁寧な仮説構築と詳細な調査を実施 一言で

Slide 23

Slide 23 text

/ 86 uコントロール条件 比較した3条件 u視覚的説明 uインタラクティブな説明 Microsoft’s Explanation Dashboard Google’s What-if Tool XGBoost SHAP GAM

Slide 24

Slide 24 text

/ 86 評価項目 限定合理性を反映 ML/解釈可能性 の文脈から設定 従属変数 5種類 具体的な取得方法 ▷ 表2 & 補足資料 表2 その他の質問項目 ①正確 or ②もっともらしく正確 or ③視覚的にもっともらしいが不正確 or ④ヒューリスティックに基づきもっともらしいが不正確 or ⑤不正確

Slide 25

Slide 25 text

/ 86 評価項目 u正確性および回答タイプを問う問題 設問ごとに5択 (補足資料)、設問は5種類(表2)

Slide 26

Slide 26 text

/ 86 uML実務家 119人 uSNS, Discord, Slack, メーリングリストなどで募集 u報酬 25ドルのAmazonギフト券 u被験者間実験 u実験参加者 Google Colab で動かす uhttps://drive.google.com/drive/folders/1jJv_KH8GxVGJKGTAXBXp70xWlueZmr2_ uAdult Income データセット uデータの欠損を追加 u冗長な特徴量をそのまま残した u同じ意味を持つ特徴量(カテゴリ値の「Education」、数値の「Education-num」) その他実験条件

Slide 27

Slide 27 text

/ 86 u視覚的説明・インタラクティブな説明ともに、理解の正確性は低下 結果 視覚的説明 インタラクティブな説明

Slide 28

Slide 28 text

/ 86 u認知的負荷は インタラクティブな説明>説明なし>視覚的説明 結果 視覚的説明 インタラクティブな説明

Slide 29

Slide 29 text

/ 86 uモデルへの挙動への理解(メンタルモデル)やユーザビリティ ▷ インタラクティブな説明が最も低い 結果 視覚的説明 インタラクティブな説明 その特定のUI [対話型ツール]は操作が⾮常に煩雑です。⾊や⽂字、切り替えボタンが⼤量 に表⽰され、ツールから実際に洞察を得るには負担が⼤きすぎるように感じられました。 視覚的説明 インタラクティブな説明

Slide 30

Slide 30 text

/ 86 u発表者の所感 u限定合理性、ヒューリスティックなど、意思決定に関する心理学の知識を活用 u仮説・調査項目の徹底がすごい(語彙力) uもっともらしい判断の基準やヒントなど、課題作成方法の細部が詳細にはわからない 結論・まとめ u結論 uインタラクティブな説明 ユーザーの認知的負荷↑、ユーザーの理解度↓

Slide 31

Slide 31 text

人間の理解に適した説明 Sumers, T. R., Ho, M. K., Hawkins, R. D., & Griffiths, T. L. (2023). Show or Tell? Exploring when (and why) teaching with language outperforms demonstration. Cognition, 232, 105326.

Slide 32

Slide 32 text

/ 86 意思決定支援AIにおける課題 uどのようなXAIが人間にとって”良い”のか、結論が出ていない。 u因子型?事例型?反実型? u識別・分類タスクを例に 発表者による前提の補足 *Wang, X., & Yin, M. (2021, April). Are explanations helpful? a comparative study of the effects of explanations in ai-assisted decision-making. In 26th international conference on intelligent user interfaces (pp. 318-328). *van der Waa, J., Nieuwburg, E., Cremers, A., & Neerincx, M. (2021). Evaluating XAI: A comparison of rule-based and example-based explanations. Artificial Intelligence, 291, 103404. *Chen, V., Liao, Q. V., Wortman Vaughan, J., & Bansal, G. (2023). Understanding the role of human intuition on reliance in human-AI decision-making with explanations. Proceedings of the ACM on Human-Computer Interaction, 7(CSCW2), 1-32.

Slide 33

Slide 33 text

/ 86 背景 u人間にモノを教えるときに、どのように教えるべきか? uデモンストレーション(例)を見せる vs 言語で説明 u教示のモダリティの違いを直接比較した研究がなかった 目的 uどちらがどのようなときに優れているか明らかにする uデモンストレーション(例)を見せる vs 言語で説明 目次 u実験1 デモンストレーション説明 vs 言語で説明 u実験2 教師が、学習すべき特徴量の一部を知らない場合 背景&目的

Slide 34

Slide 34 text

/ 86 手法 実験参加者 416人、Prolific コーナーを選ぶ ▷ 取得する図形を選ぶ

Slide 35

Slide 35 text

/ 86 30秒:学習者…計画を立てる 8秒:学習者…実行する 教師…図形と点数が見える (i.e., 教師は学習すべき概念を定義する抽象的な特徴を知っている) 手法 練習 2回 10回 学習者テスト 8種類の図形 の点数 +1 or -1 or わからない

Slide 36

Slide 36 text

/ 86 手法 発表者の解釈 このタスクだと、言語での説明は 要するに、図形の特徴量と点数の関係を 繰り返し説明することになる

Slide 37

Slide 37 text

/ 86 手法 u先生には、こういうかたちで点数と学習者が見ている画面が見えている(たぶん) https://github.com/tsumers/show-or-tell

Slide 38

Slide 38 text

/ 86 手法 ブール複雑度1 形 ブール複雑度4 色・塗りつぶし ブール複雑度6 形・色・塗りつぶし https://www.researchgate.net/ publication/304706819_Chunk_ formation_in_immediate_mem ory_and_how_it_relates_to_dat a_compression/figures

Slide 39

Slide 39 text

/ 86 結果 u複雑な概念を教示するときは、言語>デモンストレーション 学習した判断基準の複雑さ テストの正答率(8問) u限界:教師の伝え方(i.e., モダリティ以外)が影響した可能性も

Slide 40

Slide 40 text

/ 86 結果 u複雑な概念を教示するときは、言語>デモンストレーション 学習した判断基準の複雑さ テストの正答率(8問) u限界:教師の伝え方(i.e., モダリティ以外)が影響した可能性も

Slide 41

Slide 41 text

/ 86 心理学・認知科学 ▷ 意思決定支援AI u抽象的な概念を伝えられる因子型のXAIが良いのではないか uデモンストレーション:事例型のXAI、言語:因子型のXAI uXAIで議論される事例は、本研究より複雑・抽象的 意思決定支援AI ▷ 心理学・認知科学 u本研究と反する結果が出たAI・XAIの実例を検討 u信頼など、AI・XAI周りでよく出る概念を絡めた検討 u反実仮想的説明など、AI・XAI周りの対象を検討 「良い説明とは?」心理学分野(かなり基礎的な側面)でも答えが出ていない問い ▷ XAIで議論する意義……? 発表者の所感

Slide 42

Slide 42 text

/ 86 似た時期の同じ雑誌の似た論文 Moskvichev, A., Tikhonov, R., & Steyvers, M. (2023). Teaching categories via examples and explanations. Cognition, 238, 105511. 心理学・認知科学の背景 uカテゴリー学習(category learning または categorical learning) u人間が、どのように識別・分類タスクを学習するか uどのような説明がカテゴリー学習に有効か、結論がでていない。 比較したこと 視覚的例示 vs 言語で説明 結果 知覚的に曖昧な対象 ▷ 言語的説明の有効性が著明に低下

Slide 43

Slide 43 text

おまけ

Slide 44

Slide 44 text

/ 86 uAI・情報科学研究者 ▷ 査読者も、心理学・認知科学を知らない。 u心理学・認知科学研究者 ▷ AIを研究題材にする義理はない。 u心理学・認知科学 ⇄ AI・情報科学 循環できるのは世界に数チーム u脳神経科学系・強化学習系を含めても お気持ち 「ふぅん」と思っていただければありがたいです。 https://store.line.me/stickershop/product/13716526/ja?from=sticker