$30 off During Our Annual Pro Sale. View Details »

[AI Engineering Summit Tokyo 2025] LLMは計画業務のゲーム...

Avatar for terry-u16 terry-u16
December 16, 2025

[AI Engineering Summit Tokyo 2025] LLMは計画業務のゲームチェンジャーか? 最適化業務における活⽤の可能性と限界

2025/12/16 (火) にAI Engineering Summit Tokyo 2025で講演させていただいたスライドです。
https://ai-engineering-summit-tokyo.findy-tools.io/2025/ttable?m=2025/timetable/DXtAWZl2

Avatar for terry-u16

terry-u16

December 16, 2025
Tweet

More Decks by terry-u16

Other Decks in Programming

Transcript

  1. 講演者プロフィール 松尾 充 | マツオ アタル @terry_u16 株式会社ALGO ARTIS プリンシパルアルゴリズムエンジニア

    2016-2021 2021-2023 2023-2025 機械エンジニア (ジェットエンジン) アルゴリズムエンジニア アルゴリズムグループリード 2025- アルゴリズムチームリード
  2. ヒューリスティック最適化 組合せ最適化問題を解く⽅法としてヒューリスティック最適化を採⽤ 担当者の負担軽減やコスト‧リスク低減を実現 
 
 
 
 担当者負荷⼤ 時間の浪費 属⼈化

    ⾮効率な計画 運⽤コスト⾼ 計画のコスト効率向上 人手不足解消 
 
 最適化 焼きなまし ビームサーチ ⾼付加価値作業への転換 属⼈化解消
  3. AtCoderとは プログラミングの腕を競う競技プログラミングのコンテストサイト いわばアルゴリズム界のKaggle レーティング 上位 0.52 % 処理課題が 書かれた問題⽂ 問題を解くための

    プログラム作成 速さ‧正確さ‧ 性能を競う 世界有数の 競技プログラミング コンテストサイト AtCoderとは 競技内容 レーティングシステム 成績に応じて レーティングが付与される
  4. Sakana AIがALE-Agentを発表 2025/6にSakana AIが組合せ最適化問題を解くALE-Agentを発表 試⾏錯誤を⼤量に並⾏で⾏うことが可能に 初期プログラム 改善版① 改善版② 改善版③ 性能の良かったコードをベースに

    最良優先探索的な⼿法を⽤いて エージェントが繰り返し改善を⾏う 初出の論⽂における性能評価では ⼈間の上位11.8%程度の性能 ただし問題の得意‧不得意の差はある
  5. AtCoder World Tour Finals (AWTF)とは 競技プログラミングの世界⼀を決める⼤会 各部⾨ごとに前年の成績上位12名が⽇本に招待される 2024年 1 2

    3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 2025年 ヒューリスティック部⾨では 概ね⽉に1回程度、計12回のコンテストが⾏われ 順位によってポイントが加算される ポイントの上位12名がAWTFに進出 2025/7/16 9時〜19時 (10時間)
  6. 最⼩の移動回数で全ロボットを⽬的地に移動 World Finalで出題された問題 AI vs 人間まとめ【 AtCoder World Tour Finals

    2025 Heuristic エキシビジョン】 https://chokudai.hatenablog.com/entry/2025/07/21/190935 仕様 • 複数のロボットがある • ⾃由にロボットをグループにまとめられる • 同じグループのロボットは同時に移動可能 • 指定ロボット1台だけでも移動できる • 壁を追加で⾃由に配置できる ⽬的 グループ分け、壁の配置の⾃由度が⾼い難問 ファイナリストでも苦戦する問題
  7. 対戦してみての所感 コーディング‧チューニングのスピードでは圧倒的に⼈間を上回る ⼀⽅、発想次第で⼈間側にもまだ勝てる余地はある(が容易ではない) LLMの得意なところ LLMの苦⼿なところ アルゴリズムのチューニングを⼤量試⾏ ⼤⽅針が同じでも細部で差が付いた チューニング⼒ 当然ながら⼈間より圧倒的に速い 計算資源次第で多数の⽅針を

    並列で進⾏することもできる コーディングスピード ⾮公開だがそれなりに⾼いはず? 松尾にコード書かせた⽅が安いのでは コスト(?) 1位解法は全く違う解法で差が付いた ⼈間側は終了後にさらにスコア改善 時間次第で結果が変わった可能性も 解法の質‧多様性
  8. LLMは計画策定業務に使えるのか? 問題設定 データ 計画 LLM 問題設定 データ 最適化プログラム LLM 計画

    LLMに計画策定させる⽅法として、直接⼊⼒データを読ませる⽅法と 最適化プログラムを書かせる⽅法の2つが考えられる LLMに直接⼊⼒データを読ませる LLMに最適化プログラムを書かせる
  9. LLMは計画策定業務に使えるのか? ソースコードを⽣成させるアプローチは可能性がある 問題設定の分量の少なさ 正しい制約の検証 問題設定 データ 最適化プログラム LLM 計画 コンテキスト⻑に収まる可能性がある

    (バグがなければ) ⼀貫性を持って正しく検証できる ソースコードを出⼒すれば制約の検証は正しくできる OpenAIも上記のアプローチでコンテストに参加
  10. 最⼩の移動回数で全ロボットを⽬的地に移動 World Finalで出題された問題 AI vs 人間まとめ【 AtCoder World Tour Finals

    2025 Heuristic エキシビジョン】 https://chokudai.hatenablog.com/entry/2025/07/21/190935 仕様 • 複数のロボットがある • ⾃由にロボットをグループにまとめられる • 同じグループのロボットは同時に移動可能 • 指定ロボット1台だけでも移動できる • 壁を追加で⾃由に配置できる ⽬的 グループ分け、壁の配置の⾃由度が⾼い難問 こんな難問が全⾃動で解けるなら 計画策定も全⾃動で解けるのでは...?
  11. コンテストと実務の違い「制約の複雑さ」 実務は複雑 量の多さだけでなく、隠れた制約が厄介 ⼤量の仕様 暗黙知 • 稼働できる装置の台数 • 作業員の⼈数に限りがある • 倉庫のキャパシティ

    • 納期 • などなど... 運⽤に必要な制約 • 休憩時間は連続して欲しい • 装置の負荷は分散させたい • 作業員の負荷は公平に • あまりに早すぎる⽣産はNG 計画策定者のノウハウ 上記はほんの⼀例で、案件によっては100以上の仕様が存在する 暗黙知はプロジェクトを進める中で徐々に明らかになってくる
  12. コンテストと実務の違い「制約の複雑さ」 アルゴリズムの難しさ 制約の複雑さ LLMに全てを任せるには、実務領域は複雑すぎる 実務領域 LLMが得意な領域 LLMは以下の2点が難しい • ⼤量の仕様を全⾃動で正確に実装 •

    暗黙知を⾃動で引き出す Coding Agentを活⽤し、⼈間が並⾛して実装するのが現状の落とし所 暗黙知はヒアリングを通じて⼈間が引き出す必要がある
  13. コンテストと実務の違い「要件の曖昧さ」 実務では様々な項⽬の評価が必要 担当者から何度もフィードバックを受け、評価指標を調整する 複雑な評価 変化し続ける評価指標 • 制約を満たしているか? • 納期に間に合っているか? •

    作業員の負荷は平等か? • 計画にマージンはあるか? 様々な⽬線の品質の評価 納得いくまで調整 正しく評価しないと良い計画は得られない お客様のレビューを通じてプロジェクト最後まで調整を続けていく お客様
  14. コンテストと実務の違い「要件の曖昧さ」 実務をLLMで⾃動化するハードルは⾼い LLMの得意なところ LLMの苦⼿なところ アルゴリズムのチューニングを⼤量試⾏ 評価関数が固定であれば⾃動化可能 チューニング⼒ 評価⽅法が変更されると チューニングのやり直しが発⽣ 評価⽅法の変更

    お客様にLLMと議論させるのは 現実的には難しい ヒアリング ヒアリングを通じて互いに計画への理解を深めることが重要 このプロセスで信頼関係を築き、⾼品質の計画を提供することで⾼く評価された 安易なLLM代替はできない
  15. AAのLLM活⽤スタンス • Coding Agent 導⼊ • デザインシステムを作成、MCP連携を⾏うことで統⼀感のあるデザイン • システム移⾏のデータ変換にLLM活⽤ •

    チャットボットを導⼊し、お客様のサポートの⼀部を⾃動化 LLMの進化のスピードは脅威的で、無視していると時代に取り残される LLMエージェントに最適化問題を解かせ、実務で適⽤する範囲を模索中 コンテストの過去問で上位のスコアを獲得できることを確認 LLMの得意な領域を⾒極めて積極的に活⽤ LLMの進化についていく