Upgrade to Pro — share decks privately, control downloads, hide ads and more …

社内LT RAG・AIエージェントについて

tetutetu214
January 25, 2025
1.4k

社内LT RAG・AIエージェントについて

tetutetu214

January 25, 2025
Tweet

Transcript

  1. 1.2024年ふりかえり ~RAG~ ▪RAGとは? 外部情報を取り込み、回答生成するための仕組み ▪RAGの仕組み 1.ユーザの質問 2.情報検索(Retrieval) :ベクトルDBから関連文書を取得 3.文脈統合(Augmentation):取得した文書をLLMに与える 4.回答生成(Generation)

    :文書をもとにLLMが回答を生成 1.1.RAG(Retrieval Augmented Generation)について 検索 生成 ベクトルDB LLM(言語モデル) 2.情報検索 アプリケーション 3.文脈統合 4.回答生成 1.ユーザの質問 5.回答
  2. 1.2024年ふりかえり ~RAG~ ▪注目された理由の推測 生成AIに外部データを取り込ませる方法として、最も効率的だと思われる 1.2.なぜRAGが注目されたのか? プロンプト エンジニアリング RAG (検索拡張生成) ファイン

    チューニング 独自モデル 開発 生成AIの プロンプトに 直接知識を挿入 ナレッジベースの 検索結果を 知識として与える 特定のタスクに 特化した能力を 調整する 大量の学習データ による知識を習得 ▪生成AIに外部情報を取り込ませる主な4つの方法 EASIER COMPLEX AWS AI Day 「基調講演 AWSのテクノロジーで加速する生成AIのプロダクション活用」参考
  3. 従来のLLM(生成AI) エージェント(AI Agent) 性質 大規模言語モデルとして テキスト生成を主目的としたモデル 目標(ゴール)に基づき、自律的にアクション も含め制御する仕組み(フレームワーク) タスク タスクをどう連続して実施するかは、

    人が考えて制御し、 ツールやAPIは人が呼び出す 内部メモリと外部ツール連携を活用し、 目標(ゴール)に向けて、連続的にタスクを実行・ 評価・修正をエージェントが制御する 例:API呼び出し/WEB検索/ファイル操作など 状態保持 過去にやりとりをした 会話履歴レベルでの保持 実行したアクションの結果を内部メモリに保存、 保存内容を参照して行動を判断 とある サーベイ論文 脳(=推論) 脳 (=推論) 知覚 (=外部情報の取り込み) アクション(=プログラムで情報の取得) 2.2025年のトレンド ~AIエージェント~ 2.2. これまでのLLMとの違い サーベイ論文:The Rise and Potential of Large Language Model Based Agents: A Survey https://arxiv.org/abs/2309.07864
  4. 3.Amazon Bedrockについて ▪マルチエージェントコラボレーション機能 re:Invent 2024で、プレビュー版として発表された機能 複数のエージェントを連携させ、高度なタスクの計画から解決まで実行が可能 3.2.Bedrock Agentsの新機能について RAG Amazon

    Auroa 協力者エージェント Web検索 AWS Lambda Bedrock Agents ▪株購入エージェント ▪全社情報共有 システム ▪企業 株価状況取得エージェント 監督者 エージェント API Gateway 株購入API
  5. 4.AIエージェントの課題 ▪自動化範囲の定義 ・どのタスクをAIエージェントに任せるのかの定義が必要 ・どの段階で人間が承認/レビューをするか(Human in the loopの確立) ▪意思決定の責任所在 ・エージェントが誤判断した場合の責任は誰にあるのか? ▪監視・ログ管理

    ・エージェントが行った決定・外部サービス呼び出しの追跡ログの整備 ・「なぜ、その決定をしたのか?」を振返れる仕組みづくり ▪ガバナンス ・不適切なAPI呼び出しの制御(アクセス権限の制御) ・個人情報、機密データの取り扱いについて 4.1.課題と責任範囲