Slide 11
Slide 11 text
MO-Hybrid = ML+(M)O+MPC+RL
(M)O
予測
問題例⽣成
Solution
訓練データ
Period
Instance
𝑡 − 1 𝑡 𝑡 + 1 𝑡 + 2 ⋯ 𝑇 𝑇 + 1 ⋯
(𝐼!
"!#, $
𝐼!$%
"!#, $
𝐼!$&
"!#, … , $
𝐼'
"!#)
(𝑋!
"!#, 𝑋!$%
"!#, 𝑋!$&
"!#, … , 𝑋'
"!#)
($
𝐼!$%
, $
𝐼!$&
, … , $
𝐼'
, ⋯ )
ML
ML (MIPlearn)
ML (MIPlearn)
State
𝐼(
(𝑖 = ⋯ , 𝑡 − 1, 𝑡)
(𝑋(
"(#, 𝑋($%
"(#, 𝑋($&
"(#, ⋯ ) (𝑖 = ⋯ , 𝑡 − 1)
(𝐼(
"(#, $
𝐼($%
"(#, $
𝐼($&
"(#, ⋯ )
固定制約
部分解
近似解
𝑆!)% 𝑆(
ML (RL)
V 𝑆(
𝑆'$%
𝑚𝑎𝑥 𝑣 𝑥 + 𝑉 𝑆'$%
𝑋!
"!#, 𝑋!$%
"!#, 𝑋!$&
"!#, … , 𝑋'(%
"!#
≈ 𝑋!
"!(%#, 𝑋!$%
"!(%#, 𝑋!$&
"!(%#, … , 𝑋'(%
"!(%#
MPC
状態
価値関数