Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLMエージェント
Search
philosophynote
April 11, 2025
Technology
29
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LLMエージェント
個人で学習した内容を発表した際に資料したスライド
philosophynote
April 11, 2025
More Decks by philosophynote
See All by philosophynote
2025年における RubyでLLMを扱う選択肢
philosophynote
0
46
笑いながらバグを潰す方法
philosophynote
0
50
壁を乗り越えるためにGemを作成したら無知を知った話
philosophynote
0
150
技術力を捏造する
philosophynote
0
250
Other Decks in Technology
See All in Technology
自律型AIエージェントは何を破壊するのか
kojira
0
160
Oracle AI Database@Azure:サービス概要のご紹介
oracle4engineer
PRO
6
2k
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
3k
アンオフィシャルな、オフィシャルからのお願い
wyamazak_devrel
0
130
Android の公式 Skill / Android skills
yanzm
0
150
AWS Security Agent といっしょに脅威モデリングをやってみよう
amarelo_n24
0
120
現地で盛り上がった WWDC26 Keynote
zozotech
PRO
1
250
MCP Appsを作ってみよう
iwamot
PRO
4
680
2026TECHFRESH畢業分享會 - AI 時代的人生存檔點
line_developers_tw
PRO
0
1.2k
Kiroで書いた 設計書 が AI レビューの 採点基準 になる
ezaki
0
120
AIソロプレナー時代に2ヶ月で20人増員した事業創造会社の開発組織の話
miyatakoji
0
680
LayerXにおけるセキュリティ管理の現在地と次の一手
tosho
0
230
Featured
See All Featured
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
860
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
610
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
230
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.5k
How GitHub (no longer) Works
holman
316
150k
So, you think you're a good person
axbom
PRO
2
2.1k
HTML-Aware ERB: The Path to Reactive Rendering @ RubyCon 2026, Rimini, Italy
marcoroth
1
200
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
150
A better future with KSS
kneath
240
18k
Statistics for Hackers
jakevdp
799
230k
How to make the Groovebox
asonas
2
2.2k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
250
Transcript
LLMエージェント LLMエージェント LLMエージェント
LLMエージェント 目次 • 何故AIエージェント? • LLMエージェントとは何か? • ワークフロー VS エージェント
• LLMエージェント開発における構成要素
LLMエージェント 何故AIエージェント?
LLMエージェント 2025年はAIエージェント元年?
LLMエージェント AIエージェントの例 ・Cline:AIコーディングアシスタント ・DeepResearch:情報を統合して詳細なレポートを作成 ・Operator:ブラウザを操作してタスクを自動的に実行 ・Manus:完全自律型の汎用AIエージェント ・Genspark Super Agent:さまざまなツールを自動的に使用 する“オールインワンのスーパーエージェント”
LLMエージェント LLMエージェントとは何か?
LLMエージェント LLMエージェント ・LLMを活用したAIエージェント ・2025年4月時点では、 AIエージェントは主にLLMエージェントを指すため、本発 表ではAIエージェント=LLMエージェント
LLMエージェント LLMエージェントの定義? ・「エージェント」という単語が一人歩きしている印象があ る ・文脈ごとに何を指しているか不明瞭のため、ある程度 の共通認識がほしい
LLMエージェント LLMエージェントの定義? • OpenAI • 「RAG・AIエージェント[実践]入門」 • 「やさしく学ぶLLMエージェント」
LLMエージェント OpenAI 私たちは「エージェント」をユーザーの代わりに タスクを 自律的に実行するシステムであると捉えています。 エージェント開発のための新たなツール(https://openai.com/ja-JP/index/new-tools-for-building-agents/)
LLMエージェント 「RAG・AIエージェント[実践]入門」 AIエージェントとは、複雑な目標を自律的に遂行できる AIシステムを指します。(中略)与えられた 目標を達成するために必要な行動を自ら決定し、実行す ることができます。
LLMエージェント やさしく学ぶLLMエージェント LLMエージェントとは、言語を用いて環境とインタラクショ ンし、自律的に目的を達成するシステムである。
LLMエージェント 「自律的」がキーワード
LLMエージェント 「自律的」 「自律的(じりつてき)」とは、自分自身で判断し、行動す る能力があることを意味します。 by ChatGPT(gpt-4o)
LLMエージェント 「自律的」 「自律的」(じりつてき)は、外部からの指示や強制なし に、自分自身で考え、判断し、行動する能力や状態を意 味します。 by Claude(3.7 Sonnet)
LLMエージェント 「自律的」 「自律的(じりつてき)」とは、他からの指示や支配を受け ずに、自分自身の判断や意思に基づいて行動するとい う意味です。 by Gemini(2.0 Flash)
LLMエージェント 冒頭に挙げた代表例は自律的 • ユーザーの入力に対して具体的な計画を立てる • 出力に対して次の行動を自分で決定する
LLMエージェント ワークフロー VS エージェント
LLMエージェント Agentic Workflow(フローエンジニアリング) あるタスクを1つのLLMですべて解かせるのではなく、そ のタスクを細分化して、LLMやアプリケーションの実装を 組み合わせてどう解いていくかをデザインすることを指し ます。
LLMエージェント Agentic Workflow 自律的とは「自分がとるべき行動を自分で決める」という ことだから、ワークフローを人間が決めている時点で エージェントとは呼ばないのでは?
LLMエージェント Agentic Workflow • ユーザー目線から見て「自律的」であれば エージェントと呼んでしまおう • 「完全自律型」だと困ることもある ◦ 安定性がない
◦ 部分的に人間に置き換えることが難しい
LLMエージェント Building effective agents Anthropic社が2024年12月に発表
LLMエージェント Building effective agents 「エージェント」にはいくつかの定義がある。ある顧客は、エージェ ントを、複雑なタスクを達成するために様々なツールを使用し、長 期間にわたって独立して動作する完全に自律的なシステムと定義 している。 また、事前に定義されたワークフローに従う、より規定的な実装を 表すためにこの用語を使用する人もいます。
Anthropicでは、これら全てのバリエーションをエージェントシステ ムとして分類していますが、ワークフローとエージェントをアーキテ クチャ上区別しています。
LLMエージェント Building effective agents ワークフロー:LLMとツールが事前に定義されたコードパ スを通してオーケストレーションされるシステム エージェント:LLMが自分自身のプロセスやツールの使 い方を動的に指示し、タスクの達成方法をコントロール するシステム
LLMエージェント Building effective agents 1. Building block: The augmented LLM(拡張LLM)
2.Workflow: Prompt chaining(ワークフロー: プロンプトチェーン) … 7.Agents(エージェント)
LLMエージェント Building effective agents エージェントを実装する際、私たちは次の 3 つの基本原則に従うようにしていま す。 1.エージェントの設計ではシンプルさを維持します。 2.エージェントの計画手順を明示的に表示することで透明性を優先します。
3.徹底したツールのドキュメント化とテストを通じて、エージェント コンピュータ インターフェイス (ACI) を慎重に作成します。
LLMエージェント LLMエージェント開発における構成要素
LLMエージェント 主要構成要素 • Profile • Memory • Planning • Reflection
• Tool Use ◦ Retrieval(検索) ◦ MCP(Model Context Protocol) A Survey on Large Language Model based Autonomous Agents(2024) より引用
LLMエージェント Profile エージェントに一貫した役割や人格を与える設定 年齢・性格・知識領域などの情報を システムプロンプトに組み込み、 応答のスタイルや振る舞いを決定する
LLMエージェント Memory • エージェントが過去の対話や知識を保持・活用するため の機構 • 短期メモリ:現在の状況に関するコンテキストを保持する 一時的な記憶領域 • 長期メモリ:エージェントの過去の経験や知識を蓄積する
領域
LLMエージェント Planning • ユーザの質問や課題に答えるため解決策を立案するプロセス • 複雑な目標を達成するために必要な手順やサブタスクへ問題 を分解し、順序立てて実行計画を作る
LLMエージェント Reflection • エージェントが自己の思考や行動を振り返り、誤りの修正や方 針の改善を図る仕組み • 過去のアクションとその結果(観察)をもとにプランを見直し、 間違いを訂正して最終結果の質を高める
LLMエージェント Tool Use • 検索エンジンやデータベース、計算器など外部ツールをLLMが呼び出して利用す る能力 • これによりLLMは学習済みデータの範囲外のリアルタイム情報を取得したり、コー ド実行などのアクションを起こすことができる •
エージェントは必要に応じツールを使って情報収集や操作を行い、その結果(観察) に基づき内部状態や次の行動を調整しながらタスクを遂行する
LLMエージェント MCP(Model Context Protocol) • 2024年11月にAnthropic が発表したオープンプロトコル ◦ 生成AIモデルに文脈情報を渡しやすくするための技術規格 •
AI と外部システムの接続を標準化する • 「提供の仕方」と「呼び出し方」が共通化 • 「AI 用の USB-C ポート」(by Anthropic) • Claude以外でも利用が一気に進んでおり、エージェント問わず LLM関連で外部ソース・ツールアクセス時のデファクトになりそう
LLMエージェント
LLMエージェント MCP(Model Context Protocol)
LLMエージェント MCP(Model Context Protocol) • MCP ホスト: Claude Desktop、IDE、または MCP
を介してデータにアクセスする AI ツールなどのプログラム • MCP クライアント: サーバーとの 1:1 接続を維持するプロトコル クライアント • MCP サーバー: 標準化されたモデル コンテキスト プロトコルを通じて特定の機能 を公開する軽量プログラム • ローカル データ ソース: MCP サーバーが安全にアクセスできるコンピューターの ファイル、データベース、サービス • リモートサービス: MCP サーバーが接続できるインターネット経由 (API 経由など) で利用可能な外部システム
LLMエージェント LLMアプリケーション運用における重要要素 ・Human in the Loop ・Trace ・Evaluation ・LLM-as-a-Judge ・GuardRails
LLMエージェント Human in the Loop ・エージェントの意思決定プロセスに人間が関与し、必要に応じて承認・修正を行う仕組 み ・モデルに任せるにはリスクのあるツール実行要求に対して人間の承認を求めるゲート を設ける ・モデルの生成した回答を人間がレビューして訂正するなど、重要局面での人間チェック
により結果の安全性と正確性を保障する ・具体例:ClineやGithubCopilotAgentでコマンド実行可否を聞いてくれる
LLMエージェント Trace • エージェントがタスクを解決する過程でどのようなステップ・ツール・プロンプト・レス ポンスを経たのかを記録する仕組み • ユーザー入力や、エージェントが内部で生成したプロンプトの履歴どのツール(例: 計算、検索、データベース照会)がいつ・どの引数で呼ばれたか • 出力されたテキスト、構造化データ、それをエージェントがどう扱ったか
• デバッグ、チューニング、可視化で使用
LLMエージェント Evaluation • エージェントの回答品質や動作を測定・検証する • 実際に得られた結果にハルシネーションが起きていたり、事実と違う結果になって いないかを確認する • 人間アノテータ(人間の目で確認・評価する役割)によるレビューの組み合わせや LLMによる主観評価(LLM-as-a-Judge)
LLMエージェント LLM-as-a-Judge ・ LLMを評価者として活用し、別のモデルやエージェントの出力を採点・判定する手法
LLMエージェント LangSmith • LangChain公式が提供するLLM(大規模言語モデル)アプリ ケーションの開発、テスト、デプロイ、監視を支援する統合プ ラットフォーム
LLMエージェント GuardRails ・ 出力内容の安全性と方針遵守を強制するためにエージェントに設けるルールやフィル タリング機構 ・ユーザーとLLMの間にルールベースの制御層を挟み、入力の検証・不適切なリクエス トの遮断や、モデル出力の内容チェック(機密情報の漏洩防止・有害表現のフィルタ等) を行う
LLMエージェント エージェント構築のフレームワーク ・LangChain + LangGraph:LLMを活用したステートフルなマルチエージェントアプリケーションの構築を 支援するフレームワーク ・AWS Bedrock Agents:Amazon Bedrock
上で LLMエージェントを簡単に構築できるサービス ・Response API + Agent SDK:AIエージェントの開発とワークフローの管理を効率化するための APIと SDK(by OpenAI) ・AI SDK:TypeScript向けのツールキット ReactやNext.jsといったフレームワークと連携して AIアプリケー ションを構築 ・Mastra:TypeScriptベースのAIエージェントフレームワークで、ワークフローや RAGパイプラインの構築 を支援
LLMエージェント 参考資料 本 • 「RAG・AIエージェント[実践]入門」 • 「やさしく学ぶLLMエージェント」 ワークフローVSエージェント • Building
Effective AI Agents • エージェント開発のための新たなツール • 「完全自律型」AIエージェント至高論への違和感〜ワークフロー構築という現実解 • AIエージェントについてまとめてみた
LLMエージェント 参考資料 エージェント構成要素・デザインパターン • 2025年の年始に読み直したいAIエージェントの設計原則とか実装パターン集 • AIエージェント入門 • LLM Agentの技術的な外観を理解する
• Building Effective AI Agents • エージェント開発のための新たなツール • AIエージェント時代の可能性と実践 • A survey on large language model based autonomous agents
LLMエージェント 参考資料 MCP • Introduction - Model Context Protocol •
「MCP?聞いたことあるけど使ってない …😅」人向けに初歩から少し踏み込んだ内容まで解説 • やさしいMCP入門
LLMエージェント 参考資料 ニュース記事 • (記者解説)AIエージェント、進む開発 人間に代わり「思考」し「行動」、現実味 朝日新聞 (2025.01.13) • Nvidia CEO
Jensen Huang: What are AI agents that Nvidia CEO Jensen Huang says are a multitrillion-dollar opportunity? - The Economic Times(2025.01.13) • 2025 年 - エンタープライズ領域における AI エージェント元年に向けて(2025.01.07)