APIのAIReady対策 - 推論コスト・トークン制限対策
LLMの推論コスト・トークン制限対策として、有効と思われる案
● タスク特化型APIの用意
○ リソース指向ではなくなるものの、LLMが目的特化型で要求できるAPIの用意
● 検索APIの用意
○ ピンポイントな結果が取得できるAPIの用意
● 出力フィルター・オプションの追加
○ fieldsクエリパラメータで出力フィールド制御
○ LLM向けに要約 or 少量データを返すオプションを用意
GET /users/{id}?fields=id,name
{
"id": "12345",
"name": "My Example"
}
GET /users/{id}
{
"id": "12345",
"name": "My Example",
"email": "
[email protected]",
"address": {
"street": "123 Some St",
"city": "Example City"
},
…
"created_at": "20250718T120000Z"
}