コード生成を伴うLLMエージェント - 2024.07.18 Tokyo AI

Slide 1

Slide 1 text

コード生成を伴う LLM エージェント 2024/07/18 TokyoAI

Slide 31

Slide 31 text

コード生成を伴う LLM エージェント SWE agent [Yang+’24] https://arxiv.org/abs/2405.15793 i LM Agent 特化の Computer Interface を介して ReAct による , を遂行すv i コマンド群はシェルスクリプトで記述される思考・行動 (コマンド) 観測 (環境フィードバック) ファイル・コードブロックの検索コードの閲覧コードの修正コンテキストの保持 i 編集コマンドはファイルビューアと連携して動作、エージェントが開いているファイルの特定の行範囲を置き換える。編集コマンドの引数は、開始行、終了行、置換テキストr i 編集後は FileViewer が自動的に呼び出されるr i 編集機能に Linter を統合し、ファイル編集時に統語エラーを、エラーが導入される前後のファイル内容のスニペットと共に表示する。無効な編集は破棄され、エージェントは再度ファイルの編集を試みる。 Thought & Action Observation á Context Management 情報豊富なプロンプト、エラーメッセージ、履歴プロセッサを使用して、エージェントのコンテキストを簡潔かつ有益に保ちます。エージェントは、bashおよびACIコマンドの正しい使用法について、指示、ドキュメント、およびデモンストレーションを受け取ります。各ステップで、システムはエージェントに思考と行動の両方を生成するよう指示します (Yao+’23)。形式が不正な生成はエラーレスポンスを引き起こし、図31に示すようにエージェントに再試行を求め、正しい生成が受け取られるまで繰り返されます。正しい生成が受け取られると、最初のエラーメッセージを除いてすべての過去のエラーメッセージは省略されます。エージェントの環境応答は、図30に示すテンプレートを使用してコンピュータの出力を表示します。出力が生成されない場合は、「コマンドは正常に実行され、出力は生成されませんでした」という特定のメッセージを出力する。コンテキストの関連性をさらに向上させるために、最後の5つの観察に先行する観察はそれぞれ1行にまとめられます。これにより、計画と行動履歴に関する重要な情報を維持しつつ、不要なコンテキストを削減し、より多くの対話サイクルを可能にし、古いファイル情報の表示を避けます。§Aにはさらなる実装の詳細が提供されています。 i クエリに関連するファイル・コードを検Ç i 最大 50 件の結果を返す i ファイルウィンドウと scroll _d own などの移動コマンドが用意される

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Slide 32

Slide 32 text

Slide 33

Slide 33 text

Slide 34

Slide 34 text

Slide 35

Slide 35 text

Slide 36

Slide 36 text

Slide 37

Slide 37 text

Slide 38

Slide 38 text