Slide 13
Slide 13 text
GeoLLM-QA framework: 問題設定
13
実際のUI体験を想定し問題を設定: {q, T, r, S}
● User question (q): ユーザーの質問/プロンプト
○ q: 2023年5月にメキシコシティ空港にあるすべての航空機を、YOLOを使用してXView1の全画像から検出
してください。
● Agent tool-calls (T): LLMによるツールの呼び出し
○ T={t_1, t_2, …}, t_i = {tool_i, args_i}
● Agent response to user (r) and platform state (S): LLMからの回答内容及びシステムの状態
○ r: 5機あります
○ S: map positioning (ズームレベル、位置など), loaded database (読み込んだデータセット) , ...
Simranjit Singh et al. (2024), “EVALUATING TOOL-AUGMENTED AGENTS IN REMOTE SENSING PLATFORMS”, ICLR ML4RS Workshop. より引用
LLM
Tool 1
Tool n
…
Tool 2
Tool 1
Tool n
Tool 2
Response to user
User
question
Platform state
Agent tool calls