Adapting User Interfaces with
Model-based Reinforcement Learning
Kashyap Todi, Gilles Bailly, Luis A. Leiva, Antti Oulasvirta
社内論文読み会, 20211109
Kazuhiro Ota
1
Possible menu design adaptations
● moving a menu item to a certain position
● swapping two items
● adding or removing a separator
● moving an entire group
● swapping two groups
● not making any changes
● etc.
9
Slide 10
Slide 10 text
Monte-Carlo Tree Search
ランダムサンプリングに基づくシミュレーションによって状態遷移を表現した木を構築
するアルゴリズム
Adaptive UIのためにユーザの状態を考慮したデザインの変更フローを計画できる
10
Slide 11
Slide 11 text
Monte-Carlo Tree Search
ランダムサンプリングに基づくシミュレーションによって状態遷移を表現した木を構築
するアルゴリズム
Adaptive UIのためにユーザの状態を考慮したデザインの変更フローを計画できる
11
UIの使い勝手をHCIモデルで報酬化
ユーザのメニュー探索体験をHCIモデルでシミュレーションしその改善度を報酬とする
例えば、デザイン変更前後で目当ての項目を探し当てるまでの平均探索時間の減少度を
ユーザの熟練度・興味などの推定値で重み付けしたもの
Before After
diff in average
selection time
17