Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
社内LT RAG・AIエージェントについて
Search
tetutetu214
January 25, 2025
1.6k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
社内LT RAG・AIエージェントについて
tetutetu214
January 25, 2025
More Decks by tetutetu214
See All by tetutetu214
自分なりの「技術のおとしこみ方」を振り返る
tetutetu214
1
88
AWS re:Invent 2025参加 直前 Seattle-Tacoma Airport(SEA)におけるハードウェア紛失インシデントLT
tetutetu214
2
150
re:Invent 2025 ~何をする者であり、どこへいくのか~
tetutetu214
0
280
AWS Summitとは?
tetutetu214
2
2k
AWS Summit Japan2025 の歩き方
tetutetu214
5
3.3k
私流「技術力」についての考察
tetutetu214
0
110
社内LT re:Cap copmute!
tetutetu214
0
400
Featured
See All Featured
Heart Work Chapter 1 - Part 1
lfama
PRO
7
36k
Statistics for Hackers
jakevdp
799
230k
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
320
Mobile First: as difficult as doing things right
swwweet
225
10k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
400
Discover your Explorer Soul
emna__ayadi
2
1.1k
We Have a Design System, Now What?
morganepeng
55
8.2k
WCS-LA-2024
lcolladotor
0
650
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
180
Between Models and Reality
mayunak
4
340
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
Color Theory Basics | Prateek | Gurzu
gurzu
0
370
Transcript
RAG・AIエージェントについて 2025年の生成AI動向 稲村鉄平 2025/01/25
LTの目的 目的: ・RAGについての説明 ・AIエージェントの説明 ・AWS での エージェント機能についての説明 対象: ・LLMとAIエージェントの違いが分からない方 話さない事:
・コード実装やコスト等の詳細設定について
$whoami 名前:稲村鉄平(いなむら てっぺい) X :@t9z_a(てつてつ) 経歴:2021年3月入社 エンジニア歴3年10か月 経験:クラウドアーキテクチャ 要件定義-運用まで対応。 現在、生成AIの要件・構築。
興味:クラウド・DevOps 趣味:サウナ 夢 :平等に機会がある世界をつくる
目次 1.2024年ふりかえり ~RAG~ 2.2025年のトレンド ~AIエージェント~ 3.Amazon Bedrockについて 4.AIエージェントの課題 5.まとめ
1.2024年ふりかえり ~RAG~ ▪RAGとは? 外部情報を取り込み、回答生成するための仕組み ▪RAGの仕組み 1.ユーザの質問 2.情報検索(Retrieval) :ベクトルDBから関連文書を取得 3.文脈統合(Augmentation):取得した文書をLLMに与える 4.回答生成(Generation)
:文書をもとにLLMが回答を生成 1.1.RAG(Retrieval Augmented Generation)について 検索 生成 ベクトルDB LLM(言語モデル) 2.情報検索 アプリケーション 3.文脈統合 4.回答生成 1.ユーザの質問 5.回答
1.2024年ふりかえり ~RAG~ ▪注目された理由の推測 生成AIに外部データを取り込ませる方法として、最も効率的だと思われる 1.2.なぜRAGが注目されたのか? プロンプト エンジニアリング RAG (検索拡張生成) ファイン
チューニング 独自モデル 開発 生成AIの プロンプトに 直接知識を挿入 ナレッジベースの 検索結果を 知識として与える 特定のタスクに 特化した能力を 調整する 大量の学習データ による知識を習得 ▪生成AIに外部情報を取り込ませる主な4つの方法 EASIER COMPLEX AWS AI Day 「基調講演 AWSのテクノロジーで加速する生成AIのプロダクション活用」参考
2.2025年のトレンド ~AIエージェント~ ▪定義 目標(ゴール)を与えると、タスクを自律的に分解・実行する 外部リソースも活用しながら、目標達成を目指すフレームワーク ▪特徴 ・タスク分解:目標を複数ステップに分割して計画 ・自己判断 :各ステップで最適なアクションを選択 ・状態管理
:進捗を内部で保持、必要に応じて方針修正 2.1.AIエージェントについて ▪企業 株価状況取得エージェント RAG 銘柄コード AIエージェント Web検索 企業情報取得 次のアクションは。。。
従来のLLM(生成AI) エージェント(AI Agent) 性質 大規模言語モデルとして テキスト生成を主目的としたモデル 目標(ゴール)に基づき、自律的にアクション も含め制御する仕組み(フレームワーク) タスク タスクをどう連続して実施するかは、
人が考えて制御し、 ツールやAPIは人が呼び出す 内部メモリと外部ツール連携を活用し、 目標(ゴール)に向けて、連続的にタスクを実行・ 評価・修正をエージェントが制御する 例:API呼び出し/WEB検索/ファイル操作など 状態保持 過去にやりとりをした 会話履歴レベルでの保持 実行したアクションの結果を内部メモリに保存、 保存内容を参照して行動を判断 とある サーベイ論文 脳(=推論) 脳 (=推論) 知覚 (=外部情報の取り込み) アクション(=プログラムで情報の取得) 2.2025年のトレンド ~AIエージェント~ 2.2. これまでのLLMとの違い サーベイ論文:The Rise and Potential of Large Language Model Based Agents: A Survey https://arxiv.org/abs/2309.07864
3.Amazon Bedrockについて ▪サービス紹介 AWSが提供する大言語モデルのフルマネージドサービス 生成AIモデルをサーバレスで、APIで呼び出して利用することが可能 3.1.Bedrockとは? ▪Amazon Bedrock Agents ・Bedrock上でエージェントフレームワークが簡単に利用できる
・各種LLM・外部サービスと連携しながらタスクを自動実行が可能 RAG Amazon Auroa Bedrock Agents Web検索 AWS Lambda https://www~ ▪企業 株価状況取得エージェント
3.Amazon Bedrockについて ▪マルチエージェントコラボレーション機能 re:Invent 2024で、プレビュー版として発表された機能 複数のエージェントを連携させ、高度なタスクの計画から解決まで実行が可能 3.2.Bedrock Agentsの新機能について RAG Amazon
Auroa 協力者エージェント Web検索 AWS Lambda Bedrock Agents ▪株購入エージェント ▪全社情報共有 システム ▪企業 株価状況取得エージェント 監督者 エージェント API Gateway 株購入API
4.AIエージェントの課題 ▪自動化範囲の定義 ・どのタスクをAIエージェントに任せるのかの定義が必要 ・どの段階で人間が承認/レビューをするか(Human in the loopの確立) ▪意思決定の責任所在 ・エージェントが誤判断した場合の責任は誰にあるのか? ▪監視・ログ管理
・エージェントが行った決定・外部サービス呼び出しの追跡ログの整備 ・「なぜ、その決定をしたのか?」を振返れる仕組みづくり ▪ガバナンス ・不適切なAPI呼び出しの制御(アクセス権限の制御) ・個人情報、機密データの取り扱いについて 4.1.課題と責任範囲
5.まとめ ▪RAGについて 外部情報を効率的に取込むことができる機能 ▪AIエージェントについて 目標(ゴール)を与えると、タスクを自律的に分解・実行するフレームワーク ▪Amazon Bedrock Agentsについて 新機能のマルチコラボレーション機能により、複数のエージェントを マネージドサービスで、制御・管理する機能が追加された
▪導入ポイント 責任分界点(自動化 と 人間の判断)の議論をしていかなければいけない
Thank you!