Slide 15
Slide 15 text
今までの流れをAI Agentへ
今回は、物体検出までを自分でやって、残りの解釈をAI Agentに丸投げしてやってもらってみる
テキストファイルは、概要をテキストで与えるだけであとはAgentにコードを書いて解釈してもらう
2025/10/14 AI Agent 勉強会 vol.8 15
必要に応じて、以下の情報を用いてください。これらの情報を活用して、問題の最終的な答えを出してく
ださい。
1. コンテナ内に、画像を物体検出した結果があります。(画像と、labels/には検出結果のテキストファ
イルがあります。)
検出結果のテキストファイルは、「検出オブジェクトのラベルID,馬雲ディグボックスの左上のx座標,y座
標,バウンディングボックスの横幅,高さ」の形になっています。
2. オブジェクトのラベルIDは、以下のリストのインデックス(0始まり)になっています。
[
'BJT-NPN', 'BJT-PNP', 'Capacitor', 'Diode', 'GND', 'I-AC', 'I-DC', 'Inductor',
'MOSFET-N', 'MOSFET-P', 'Op-Amp', 'Resistor', 'V-AC', 'V-DC', 'V-DC (one port)',
'Wire Crossover', 'Zener Diode'
]
問題を説明したプロンプトに、以下を追加してからAgent実行
1. 検出結果のディレクトリを圧縮して、Containers APIを用いて作成されたコンテナに格納
2. Response APIを呼び出す(一応Code Interpreterにしておいた)
※結果は前述の取り組みの結果と大差なく、
モデルによって性能が大きく揺れる印象