Slide 45
Slide 45 text
コードと推論が互いを高め合うという視点で、LLMの新しい可能性を体系的に整理したサーベイ
Code to Think, Think to Code: A Survey on Code-Enhanced Reasoning and Reasoning-Driven Code Intelligence in LLMs
コードが推論を強化
• コードは実行可能性や厳密な文法をもち、推論時の計算ミスやロジック崩壊を防ぎやすい
• 例: 数学問題をコードとして生成し、実行結果で正確な答えを得る手法 (Program of Thoughts, PaL など)
推論がコーディング能力を発展
• 複雑なソフトウェア開発やリポジトリ全体の変更など、大規模かつ多段階のタスクをより的確に遂行できる
• 例: 手順分割やエラー修正を自動で行うエージェント型ツール (CodeAgent, SWE-agent など)
対話的・反復的アプローチ
• 実行結果をモデル自身が検証し、コードを段階的に修正する“自己デバッグ”や“自己改善”が精度向上に効果的
• 例: OpenCodeInterpreter, Self-Edit, Self-Debugging
課題
• 依然として解釈性・大規模リポジトリ対応・安全性・評価手法など未解決のテーマが多い
• 長大な文脈や複数ファイルをまたいだコード理解・生成は難易度が高い
推論 3月10日 更新分