Upgrade to Pro — share decks privately, control downloads, hide ads and more …

人と機械(計算機)の知的協働に切り込むシリアスゲーミングアプローチ

 人と機械(計算機)の知的協働に切り込むシリアスゲーミングアプローチ

「システム制御情報学会 SCI’21」の「チュートリアル講演」で使用したスライドです.

hajimizu

May 27, 2021
Tweet

More Decks by hajimizu

Other Decks in Research

Transcript

  1. 運⽤の意思決定の実際 • 実時間でシステム全体の状況を把握して作業指⽰を出すことは困難 であることが多い. • ⼀⽅で,資源単位の局所的な意思決定だけで,システムの効率的な 運⽤を実現することも難しい. • ⽣産計画・スケジューリングなどの全体的な意思決定と,ディス パッチングなどの局所的な意思決定の組合せで運⽤されている.

    • そうした意思決定には,機械によって処理されているものと,⼈に 委ねられているものがある(⼈と機械の知的協働). • 意思決定の単位は,システム全体と資源単位という両極端だけでは なく,⼀般にはそれらの間の様々な粒度で設定されている. • システムの物理的な挙動と運⽤の意思決定は,いずれも⼈と機械の 協働であるという点は共通しているが,協働主体の単位は異なる. 5 Hajime Mizuyama
  2. ⼈と機械(計算機)の意思決定の対⽐ ⼈の意思決定 • 暗黙的なルールやヒューリス ティックに頼ることが多い • 曖昧な問題や主観的な問題も そのまま扱えることがある • どのような情報でもその場で

    拾い上げて利⽤できる • 境界条件を交渉可能なソフト な制約条件として扱える 機械の意思決定 • 数理的な最適化アルゴリズム を利⽤することができる • 明確に定式化された問題以外 は扱いづらい • 必要な情報を事前に明⽰し, 収集しておく必要がある • 外部との境界条件はハードな 制約条件として扱われる 6 双⽅に⻑所と短所があり,優劣を⽐較することよりも,状況に応じて 適材適所で組み合わせて活⽤することを考えるべきである.
  3. Industry 4.0 で何が変わるか? • IOT:実時間でセンシング可能(したがって,計算機アルゴリズム に取り込むことが容易)な情報が増える. • CPS:IOTでセンシングしたデータを統合することでシステム全体の 状況をより詳細な粒度で把握できるようになる. •

    Big Data:⼤量に蓄積されていく上記のデータの履歴に基づいて 様々な予測モデルが得られるようになる. • 機械で処理可能な運⽤の意思決定は増え,より幅広い単位で扱える ようになる. • ⼈と機械の意思決定を組み合わせた,知的協働の全体的なフレーム ワークはどう変わるのか,変わらないのか? 7 Hajime Mizuyama
  4. システム 状態 システム 状態 システム 状態 システム 状態 システム 状態

    システム 状態 システム 状態 システム 状態 システム 状態 システム状態の時間発展 #1 12 状態 観測 作業 指⽰ システム 状態 システム 状態
  5. システム 状態 システム 状態 システム 状態 システム状態の時間発展 #2 13 状態

    観測 作業 指⽰ システム 状態 システム 状態 システム 状態 システム 状態 システム 状態 状態 観測 作業 指⽰
  6. 運⽤の意思決定と物理的挙動の2層化 14 Hajime Mizuyama ⽣産システムへの 作業指⽰(ex. 差⽴て) システム状態の 観測(ex. 進捗情報)

    ⽣産システム運⽤の意思決定を捉える層 ⽣産システムの物理的な挙動を捉える層 与えられた作業指⽰に従って 作業を開始 遅れ,不良,故障などの 不確定事象が確率的に発⽣ 観測したシステム状態や市場 からの要求に従い計画やスケ ジュールをたて,それらを参 照しながら作業指⽰を出す.
  7. 運⽤の意思決定と物理的挙動の2層化 15 Hajime Mizuyama ⽣産システムへの 作業指⽰(ex. 差⽴て) システム状態の 観測(ex. 進捗情報)

    ⽣産システム運⽤の意思決定を捉える層 ⽣産システムの物理的な挙動を捉える層 与えられた作業指⽰に従って 作業を開始 遅れ,不良,故障などの 不確定事象が確率的に発⽣ 観測したシステム状態や市場 からの要求に従い計画やスケ ジュールをたて,それらを参 照しながら作業指⽰を出す. 複数の⼈と機械の知的協働
  8. Human-Based Computation Perspective 16 Hajime Mizuyama ⽣産システムへの 作業指⽰(ex. 差⽴て) システム状態の

    観測(ex. 進捗情報) ⽣産システム運⽤の意思決定を捉える層 ⽣産システムの物理的な挙動を捉える層 与えられた作業指⽰に従って 作業を開始 遅れ,不良,故障などの 不確定事象が確率的に発⽣ 観測したシステム状態や市場 からの要求に従い計画やスケ ジュールをたて,それらを参 照しながら作業指⽰を出す. 複数の⼈と機械の知的協働 ⼤規模なマルコフ決定過程の ⽅策を担うHuman-in-the-loop の分割統治アルゴリズム?
  9. 問題の設定と解決としての理解 運⽤の意思決定とは, – 解くべき問題のクラスを設定し, – 状況に応じてその問題のインスタンスを構成し, – ある解法を適⽤してその問題を解決することである,と考える. ⼈の貢献の源泉は, –

    ある種の難しい問題に対してある程度有効に機能する暗黙的な ヒューリスティック解法 – センサが設置されていない情報の五感による取得 – ブラックボックス関数によるインスタンスの補完 – 解くべき問題のクラス⾃体が未定義あるいはブラックボックス であるような状況への対処 22 Hajime Mizuyama
  10. ⼈の貢献の3重構造 23 Hajime Mizuyama 与えられた 問題インスタンスの (近似的な)解決 問題のクラスや フレームワークの設定 意思決定サイクルや

    ホライズンの調整, 対象モデルの粒度や スコープの調整, ⽬的関数や 制約条件の調整, 解空間の創造的拡張, など 問題のインスタンスの構成 現場状況の実時間 五感センシング, コミュニケーション による情報獲得, 暗黙的な知識や 主観的な情報の反映, インフォーマルな予測 の利⽤,など
  11. 認知フレームを基礎づける要因 世界をどのように認識して • 状況認識のスコープや粒度, 状況変化の予測モデルなど • 可能な介⼊の⼿続き的知識や その効果の予測モデルなど 各担当者の意思決定に有⽤な知 識・スキルの本質は何か?

    知識・スキルの習得や実適⽤を効 果的に⽀援する⽅法は? 誰とどう変えようとするのか • 状況についての選好,効⽤関 数,達成したい⽬標など • 他者モデル,他者の反応を考 慮した戦略など 担当者間に⽣じ得るゲーム的状況 とはどのようなものか? 有効な協⼒・協調を引き出すため にはどうすればよいか? 27
  12. Research Questions の4象限 28 知識・スキルの 習得や実適⽤の⽀援 協⼒・強調を引き出す メカニズムデザイン 知識・スキルや その習得過程の解明

    ゲーム的状況の 理解と帰結の予測 ⽣産システム の運⽤ 科学的視点 Scientific analysis ⼯学的視点 Engineering design 各エージェントの 知識・スキル Micro -> Macro システム全体の 環境・制度 Macro -> Micro
  13. マルコフ決定過程と認知フレームの例 #1 29 Hajime Mizuyama 学習 ⾏動𝑎 対象シス テムの 時間発展

    を表す MDP 状態𝑠を ⾏動𝑎に マッピン グする ⽅策 報酬𝑟と状態s
  14. マルコフ決定過程と認知フレームの例 #2 30 Hajime Mizuyama 対象シス テムの 時間発展 を表す MDP

    認知フレーム • 観測・⾏動の タイミング • ⾏動の選択肢 • 状態の⾒せ⽅ • 報酬の与え⽅ など 変換され た状態𝑧を 変換され た⾏動𝑥に マッピン グする ⽅策 間引かれた タイミングで 変換された 報酬𝑦と状態𝑧 𝑟とs 𝑎 ← 𝑥 変換された ⾏動𝑥 学習 Interaction Interface Incentive
  15. ⾏動科学と計算科学の相互補完 ⾏動科学的アプローチ • 担当者が意思決定を⾏う現実 の状況の本質をシリアスゲー ムの中で再現する. • そのシリアスゲームを⼈にプ レイしてもらい,そこでの⾏ 動データを収集する.

    • 得られた⾏動データを分析す ることによって,担当者の意 思決定を基礎づける規範につ いての仮説を得る. 計算科学的アプローチ • 担当者の意思決定を基礎づけ るある種の規範をアルゴリズ ムで表現する. • それをシリアスゲーム上で駆 動させ,どのような振る舞い が⽴ち現れるかを観測する. • 得られた振る舞いを現実と対 ⽐することなどで,当該意思 決定を基礎づける規範につい ての考察を深める. 34 Hajime Mizuyama
  16. シリアスゲーミングアプローチの全体像 35 (a) 対象システムの運⽤を模擬したシリアスゲームモデルを作成 (d) 上のゲームのプレイ ログを収集し分析 (e) シミュレーション実 験とその結果の分析

    (f) 上の(d)と(e)の結果を⽐較・検討することによる知⾒の導出 (b) 上のモデルに基づく ゲームシステムの開発 (c) 上のモデルに基づく シミュレータの開発 知⾒(f)に基づきモデル(a) を改善し,分析を繰返す 知⾒(f)の実際への活⽤
  17. 加熱炉前スラブヤードの単純化モデル 43 機械 装⼊バッファ 中間バッファ 中間バッファ ⼊⼝ バッファ ⾊がジョブのタイプを表す(4⾊). 数値が納期までの残り時間を表す.

    ジョブが ランダム に到着 平均到着 間隔: 10, 11, 12, 13 加⼯時間は⼀定(6), 段取時間はジョブのタイプ 順に依存(6 or 60) クレーン 待ち⾏列 待ち⾏列 から⼊⼝ バッファ には⾃動 的に移動
  18. 45 本社 顧客 下⼯程 ⼯場 上⼯程 ⼯場 素材 発注 素材

    納⼊ 製品 発注 製品 納⼊ 商品 発注 商品 納⼊ 拠点間のコミュニケーション(情報共有)を変化させて,地震な どの⾮定常的な変動に直⾯した際のパフォーマンスを⽐較する. 製鉄企業の社内サプライチェーンの事例
  19. ⽜乳サプライチェーンの事例:MilkyChain Game 47 Hajime Mizuyama 消費者 酪農家 (指定団体) スーパー メーカー

    1/3ルールなどの商習慣が⾷品廃棄に与える影響の分析など ⇒ ⾷品サプライチェーンにおける⾷品廃棄削減のための制度設計
  20. まとめ • (広義の)⽣産システムの運⽤は,⼈と機械(計算機)の知的協働 によってなされていると考えることができる. • 今後さらに進んでいくデジタル化・スマート化の流れを受けて,こ の知的協働のフレームワークは劇的に変化する可能性を秘めている. • Industry 4.0

    時代の新しい知的協働のあるべき姿を追求していくため に,まずこの協働のメカニズムとその中で⼈が担うべき貢献の本質 についての理解を深めていきたい. • 今回は,そのための⼿段の⼀つとして,シリアスゲーミングアプ ローチの概要を提⽰した上で,具体的な研究事例を少し紹介した. 51 Hajime Mizuyama