Slide 33
Slide 33 text
Appendix RNNとSSMとRSSMの違い
● □→□は決定論的な遷移 〇→〇確率的な遷移
ℎ𝑡
= 𝑓 ℎ𝑡−1
, 𝑎𝑡−1
𝑜𝑡
~𝑝(𝑜𝑡
|, 𝑠𝑡
)
𝑟𝑡
~𝑝 𝑟𝑡
𝑠𝑡
複数の未来をとらえるのが難
しい
𝑠𝑡
~𝑝 𝑠𝑡
|𝑠𝑡−1
, 𝑎𝑡−1
𝑜𝑡
~𝑝(𝑜𝑡
|, 𝑠𝑡
)
𝑟𝑡
~𝑝 𝑟𝑡
𝑠𝑡
複数の時間ステップに渡って情
報を記憶することが難しくなる
ℎ𝑡
= 𝑓(ℎ𝑡−1
, 𝑎𝑡−1
, 𝑠𝑡−1
)
𝑠𝑡
~𝑝 𝑠𝑡
|ℎ𝑡
𝑜𝑡
′~𝑝(𝑜𝑡
|ℎ𝑡
, 𝑠𝑡
)
𝑟𝑡
′~𝑝 𝑟𝑡
ℎ𝑡
, 𝑠𝑡