大規模言語モデル(LLM)に強化学習を組み合わせた「Agentic RL」は,自律的な意思決定や動的な環境適応能力により,人工知能の新たなフロンティアを切り開いています。本資料では,この急速に進化するAgentic RLの全体像を,最新の包括的サーベイ論文「Agentic Reinforcement Learning: A Survey(2025)」に基づき詳細に解説します。
- 📝:https://arxiv.org/abs/2509.02547
- 🐙:https://github.com/xhyumiracle/Awesome-AgenticLLM-RL-Papers