顧客体験を加速させるチャットボットで始めるAIエージェント入門 / Introduction to AI Agents: Starting with Chatbots to Accelerate Customer Experience

by shuntaka

Slide 1

Slide 1 text

2025/11/27 髙橋俊⼀ (a.k.a shuntaka) 顧客体験を加速させるチャットボットで始めるAIエージェント⼊⾨

Slide 2

Slide 2 text

⾃⼰紹介 2 ● 2016年⾦融情報ベンダー⼊社バックエンド ○ 株価配信Web API開発 ● 2019年クラスメソッド⼊社 ○ CX/IoT事業部にてIoT案件を複数 ● 2024年製造ビジネステクノロジー部担当 ○ R&D業務/サーバーサイド/RAG/AI Agent開発 ● 部署 ○ 製造ビジネステクノロジー部 ● 名前（shuntaka） ○ 髙橋俊⼀ ● 出⾝‧住まい ○ 東京詳細はhttps://shuntaka.dev/whoを⾒てね

Slide 3

Slide 3 text

⽬次 3 ‧AIエージェントとは ‧AIエージェントとチャットボット ‧事例①: 業務⽀援のPoC (4⽉頃 ~ 現在) ‧事例②: SaaS組み込みのプロダクト開発(7⽉頃 ~ 現在) ‧まとめ

Slide 4

Slide 4 text

注意事項 4 事例の温度感としては以下です。まだ初歩的な内容です 🔰 ‧約1⼈でアプリ、インフラ含めて構築するくらい規模感 ‧構築期間 ‧事例①: 1週間で構築、PoCの段階で現在も利⽤中 ‧事例②: 4ヶ⽉の製品開発で来年リリース予定(精度評価は本格的にまだ) ‧記憶(メモリ)、コード実⾏などは未利⽤

Slide 5

Slide 5 text

AIエージェントとは

Slide 6

Slide 6 text

AIエージェントとは 6 自律的を分解すると Reasoning(推論) + Action(行動) という要素がより強い [GoogleCloud|AI エージェントとは](https://cloud.google.com/discover/what-are-ai-agents) 簡単に言えば自律的に目標を達成するために行動できるAIシステム [OpenAI AGI 5段階](https://www.bloomberg.com/news/articles/2024-07-11/openai-sets-levels-to-track-progress-toward-su perintelligent-ai) アシスタントとエージェントの境界は特に連続的でグラデーションがあると言える

Slide 7

Slide 7 text

AIエージェントとチャットボット

Slide 8

Slide 8 text

AIエージェントとチャットボット 8 AIエージェントは高度なタスクをこなせるので表現の幅も大きいです。プロダクトに組み込むならチャットアプリ+MCPより体験が良いものにしたい。クライアント、サーバともにここら辺の体験向上をサポートしてくれるSDKがあります。今回は簡単に2つ紹介します。　・AI SDK ・CopilotKit

Slide 9

Slide 9 text

AI-SDK 9 ‧TypeScript向けAIツールキット ‧Next.jsの開発元のVercelが提供 ‧AIプロダクト構築に必要な機能を揃えたOSS SDK ‧⼤体9ヶ⽉毎にv1→v3 v3→v4 v4→v5と約9ヶ⽉ごとにメジャーが進み、機能とAPI設計が継続的に最適化メジャーリリース時期 ※1 v1 2023-06-15 v2 2023年後半 ~ 2024年初頭 v3 2024-03-01 v4 2024-11-18 v5 2025-07-31 ※ 公開告知を参考としており、Alpha/Beta段階は含みません

Slide 10

Slide 10 text

AI-SDK 10 https://ai-sdk.dev/docs/ai-sdk-ui/generative-user-interfaces https://ai-sdk.dev/elements/components/reasoning ※ 動画のためPDFでは再⽣されません https://ai-sdk.dev/docs/ai-sdk-ui/streaming-data ※ 動画のためPDFでは再⽣されません

Slide 11

Slide 11 text

CopilotKit 11 https://docs.copilotkit.ai/langgraph これはより、エージェントシステムとUIの統合が可能なFWです。 https://www.copilotkit.ai/ag-ui モックがあるので試すとイメージがつきやすいです👇 CopilotKit: ユーザー向けアプリにAIエージェントを統合するためのフレームワーク (AG-UI,MCP,A2A) AG-UI: AIエージェントとフロントエンドUI間の通信を標準化したオープンプロトコル ※ 動画のためPDFでは再⽣されません

Slide 12

Slide 12 text

事例: 社内業務⽀援のPoC (4⽉頃 ~ 7⽉頃)

Slide 13

Slide 13 text

前提 13 ‧製造業のお客様、⼯場で利⽤するWebアプリを弊社で構築済み ‧Webアプリに関わる⼈の便利ツールとして構築(社内情報システム) ‧時期は25年4⽉頃〜現在

Slide 14

Slide 14 text

構成 14 ‧案件参画メンバーと新規の私で1~2週間ほどで構築 ‧既存REST API定義をFunction Callingで被せて実装 → 本システムでしか利⽤しないためMCP化はしなかったシステムのREST API(Function Calling)とGrafanaのMCPを使ったチャットボット DynamoDB

Slide 15

Slide 15 text

当時(25年5⽉)の技術選定の観点 FW 言語領域主な特徴見送った理由/採用理由 Chainlit Python FE,BE ・LangChainがBEに使える UI側は考えなくて良い・ストレージ統合・UIカスタマイズ・TSエンジニアが組織に多い Open WebUI TS FE リッチなChatUI WebSocketが必要でApp Runnerが非対応のため Mastra TS (FE),BE ・BEで書いたAgentsをFEで使える・o11y機能・AI SDKの上位レイヤー担うコンセプト・ストレージ統合当時Bedrock呼び出しをAgentsに委ねており、Prompt cachingなど問い合わせ時のカスタマイズが出来なそう ...だったため AI SDK (採用) TS FE,BE FE: useChatを使ったUIカスタマイズ性を残しつつ汎用的な API BE: AIモデル問い合わせの汎用的なAPIを提供・useChatを使った簡単なチャット UI構築が可能・ツールの実行をBE->FEにStreaming 返す機能が良い・Bedrockへ柔軟な呼び出し可能

Slide 16

Slide 16 text

16 AWS App RunnerをAIチャットボットで使う上で注意点技術選定⾯ ‧120秒タイムアウト制約 ‧WebSocket未対応費⽤⾯ ‧ゼロスケールしない(プロビジョンド課⾦) ‧ARMビルドコンテナ使⽤不可

Slide 17

Slide 17 text

17 デモ版の実際の様⼦(7/9 ~ 7/12 ものづくりワールド) ※ 動画のためPDFでは再⽣されません ※ 動画のためPDFでは再⽣されません

Slide 18

Slide 18 text

18 最終回答までに過程をストリーミングし体験向上最終的な成果物が出来るまでの時間は変わらないが、UXが段違い⼀⽅でユーザーが⾒て⽌めるきっかけになるような本質的な情報を出⼒すべき ※ TTFT … ユーザーがクエリを⼊⼒した後、モデルの出⼒を表⽰し始める速度 󰢏 呼び出す関数の引数情報 → 期間などのミスに気付ける 󰢏 計画の情報、思考の過程 → ⽅針のミスに気付ける 󰢃 定型メッセージ(〇〇中です...) → ユーザーが意図しない回答になる可能性があり。単にチャットのTTFT を早くすれば良いわけではない。

Slide 19

Slide 19 text

Prompt caching 19 tools 前⽅⼀致でキャッシュ 7,000トークン 94トークン変動しやすいトークン静的なので環境要因がなければヒットする https://aws.amazon.com/jp/blogs/news/effectively-use-prompt-caching-on-amazon-bedrock/ system user

Slide 20

Slide 20 text

CRIPだとキャッシュが散らばる 20 tools → systemまででキャッシュポイントを⽣成し、キャッシュを確認クロスリージョンプロファイルだとキャッシュ書き込んだリージョンに刺さらないとキャッシュが読み込まれない挙動も確認した＞プロンプトキャッシュは、クロスリージョン推論（ CRIS）と併用できます。（中略 ) 需要が集中する時間帯には、これらの最適化によりキャッシュ書き込みが増加する可能性があります。

Slide 21

Slide 21 text

6⽉ Sonnet4 Bedrock利⽤料(開発や利⽤) 21 約3割程度は削減効果があった (削減額 = Cache Read × $2.70 − Cache Write × $0.75 = 13.6M × $2.70 − 1.4M × $0.75 = $36.7 − $1.1 ≒ $35.6)

Slide 22

Slide 22 text

事例: SaaS組み込みのプロダクト開発(7⽉頃 ~ 現在)

Slide 23

Slide 23 text

構成 23 製造現場の動画やマニュアルを検索するB to B向け SaaSアプリケーションに搭載されるチャットボットマニュアルの検索や動画内部の物体検出を⾏い、ユーザーの課題を解決するための機能を提供

Slide 24

Slide 24 text

plan-and-executeフローの実装 24 https://langchain-ai.github.io/langgraph/tutorials/plan-and-execute/plan-and-execute/ 流れは以下の通り 1. 計画⽴案 2. サブタスク回答 3. 最終回答作成タスクを明確なステップに分解ためにLLMに複数回問い合わせるケースがある特に内省を指定回ループで回答精度を上げる。

Slide 25

Slide 25 text

plan-and-executeの良い点 25 https://langchain-ai.github.io/langgraph/tutorials/plan-and-execute/plan-and-execute/ ハルシネーションが抑えられる → サブタスク→内省でNGなら結果を最終回答に含めないことも出来る複雑な回答が可能 → 質問が複数であったり、観点が複数ある質問

Slide 26

Slide 26 text

plan-and-executeの問題点 26 前述通りメリットも多いが、Sonnet 4.5で 40秒〜1分ほど回答⽣成に時間が必要に...😭

Slide 27

Slide 27 text

精度とユーザー体験 27 ・本当にハルシネーションがなく、精度が高いけど遅いのがユーザーへの価値なのか・プロダクトデータと密に連携し、荒いが素早い回答を求めているケースもある・ある特定のケースの精度をあげた結果導入された複雑な処理が全体に影響を与えてしまうこともある → 回避策はあるが(タスクを分類や各フェーズでのモデルの最適化)、評価や保守し続けることも考慮が必要

Slide 28

Slide 28 text

時間がかかることへの対策 28 28 WorkﬂowでLLMに複数回問い合わせをすると、インタラクションがなく体験が悪化 → 定型⽂章を表⽰ → 慣れてしまうと遅いだけで体験は悪い...😭 参考: https://ai-sdk.dev/docs/ai-sdk-ui/streaming-data writer.write({ type: 'data-notify-plan-started', id: 'plan-start', data: { message: '計画を作成中 ...', }, transient: true, }); const plan = await planNode({ question, pastMessages, }); writer.write({ type: 'data-notify-subtasks-started', id: 'subtasks-start', data: { totalTasks: plan.subTasks.length, message: '検索中...', }, transient: true, }); const subTaskResults = await execSubTaskListNode({ plan, question, pastMessages, }); writer.write({ type: 'data-notify-answer-started', id: 'answer-start', data: { message: '最終回答を作成中 ...', }, transient: true, }); const streamResult = await finalAnswerNode({ subTaskResults, question, pastMessages, }); writer.merge(streamResult.toUIMessageStream()); ※ 通知目的なら会話履歴に含めない設定が必要！

Slide 29

Slide 29 text

単純な機構で割り切る、精度は落ちたが速度は⼤分改善 29 変更前変更後 ‧フローを簡略化 ‧sonnet 4→haiku に変更

Slide 30

Slide 30 text

評価やデバッグをするならo11yツールは必須 30 +import * as ai from 'ai'; import { convertToModelMessages, - generateObject, type ModelMessage, - streamText, type UIMessage, type UIMessageStreamWriter, } from 'ai'; +import { wrapAISDK } from 'langsmith/experimental/vercel'; +const { streamText, generateObject } = wrapAISDK(ai); 後⼊れでもimport差し替えとAPIキーの環境変数登録で対応完了 👉 ただ、LLM呼び出しを⼀つのトレースにまとめたりは多少実装が必要だが、AIコーディングエージェントを使えばすぐ実装してくれる。デバッグはエラーメッセージを読むのとは異なる⼤量の⾃然⾔語を読むことになる。⾃然⾔語をJSONロガーで読むのはかなり負荷が⾼い。複雑であるほど必須。 langfuseはdocker composeでローカルにたてられるので、最低ローカルは⼊れた⽅が良い。

Slide 31

Slide 31 text

まとめ 31 ‧AIエージェント開発はUI、体感時間などの体験、精度、コストのそれぞれのパラメータを柔軟にトレードオフしながら作っていく必要がある。 ‧全てのケースに最適化するより、割り切って多くのケースを確実に体験よく作るという判断も⼤事。全てに対応すると開発、保守、評価でROIが悪化する可能性もある。