Slide 50
Slide 50 text
実験セットアップ
エージェント
SWE-Agentベースのエージェントを使用
シンプルなReActスタイルの思考と行動のループに従う (Yao et al., 2023)
ACIドキュメント・タスクとデータセットの説明・短い一般的な指示を提示さ
れ、ML研究者として行動
ステップ毎に単一のコマンドを使用し、対話的なセッションコマンド (例:
Python REPL, vim) は使用不可
5つの最先端言語モデルを temperature=0.0 と top-p=0.95 で使用
OpenAI O1-preview, Gemini 1.5 Pro, Claude-3.5-Sonnet, Llama-3-405b-
instruct, GPT-4o
第109回汎用人工知能輪読会 担当: 太田 晋 2025-02-28 50/71