Upgrade to Pro — share decks privately, control downloads, hide ads and more …

交通の最適化で強化学習を使い始めた話

 交通の最適化で強化学習を使い始めた話

More Decks by NearMeの技術発表資料です

Other Decks in Technology

Transcript

  1. 1

  2. 18 性能は出るのか? Solve routing problems with a residual edge-graph attention

    neural network. K Lei, et al., Neurocomputing 2022 報酬 ベンチマークしたモデル パフォーマンス
  3. 24 少しだけリアルなシナリオへの対応 Start 報酬を、到達した点の数 - α*距離、 つまり、売上 - コスト、に変更 End

    Start End Start End 全ての点を必ずしも通らなくていいように マスクを変更 (Start / Endの点も設定) 割に合わない運行が無視される ※最短経路の学習が進まないと、 売上 - コストが正しく算出されないので、 報酬を学習ステップに応じて変えた こっちに来た方が より多く点を辿れる
  4. 25 AWS SageMaker使ってみた n=20 1epoch M2 Mac CPU:52.6 秒 ml.g4dn.2xlarge

    GPU:15.4 秒 n=50 1epoch M2 Mac CPU : 336.2 秒 ml.g4dn.2xlarge GPU:60.0 秒 hidden_node_dim=[128], hidden_edge_dim=[16], conv_laysers=[4], data_size=[12800] 学習パラメタ M2 Macより4~5倍速い
  5. 26 まとめ • 逐次的な組み合わせ最適化をコアに相乗りサービスを構築した • 相乗り後の運行をどの車両にアサインすればいいかという問題が浮上 • 将棋やテトリスのような複雑さがあり強化学習のアプローチを探った • 深層強化学習

    x 配送計画問題(VRP)において、 従来のヒューリスティックな手法に匹敵 / 超える結果が得られることが分かった • モデルの一部を変えることで、より複雑なシナリオに対応できた • 学習は非常に時間がかかるので、GPU必須。AWS SageMakerで手軽に利用できた