Slide 15
Slide 15 text
実験1:比較手法
● 教師ありの pointer network (1,000,000データで学習済)
● RL-事前学習 (10,000で学習済)
○ 都市の選択は greedy。事前学習済モデルを 1, 16 個使用した場合の 2
種類
○ RL-事前学習-Sampling
○ RL-事前学習-Active Search
● Active Search (各データに対して100,000・200,000 step 学習)
● ベースライン
○ Christofides
○ OR-Tools の車両経路ソルバー
○ Optimal (Concorde と LK-Hの局所探索)
(15/24)