Slide 12
Slide 12 text
©Mitsubishi Electric Corporation
13
ケース1:完全一致
mcp_use_metrics = ToolCorrectnessMetric(
threshold=0.8,
available_tools=available_tools, # 利用可能ツール
should_consider_ordering=False, # 順序を考慮するか
should_exact_match=True, # 完全一致かどうか
…
)
実行軌跡 div:割り算ツール
input: {5, 5}
add:足し算ツール
input: {3, 4}
sub:引き算ツール
input: {7, 1}
div:割り算ツール
input: {5, 5}
add:足し算ツール
input: {3, 4}
sub:引き算ツール
input: {7, 1}
期待する軌跡
ケース1-1
- Tool Correctness (score: 1.0, threshold: 0.8, strict: False, evaluation model: None,
ツール呼び出し理由: 完全一致:予想 ['div', 'add', 'sub']、呼び出し ['div', 'add', 'sub']。詳細は上記を参照してください。
ツール選択理由:必要なすべてのツールを正しく選択しました。「div」ツールは除算 (5/5) に適切に使用され、
「add」ツールは加算 (3+4) に、「sub」ツールは減算に使用され、演算の順序を正しく守っています。
すべてのツール選択は意図された目的に適切に一致し、より適切なツールは省略されていません。