Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【生成AI解説】RAG再入門〜超基本から有りがちな失敗まで、ビジネス実装の勘所を学ぶ〜

Avatar for waikei waikei
October 28, 2025

 【生成AI解説】RAG再入門〜超基本から有りがちな失敗まで、ビジネス実装の勘所を学ぶ〜

RAGの概要や実践におけるTipsを解説したスライドです。

下記動画にて、実際にデモプロダクトを動作させながら解説しているので、良かったらこちらもどうぞ。

https://youtu.be/REatCZN5RV0

Avatar for waikei

waikei

October 28, 2025
Tweet

More Decks by waikei

Other Decks in Technology

Transcript

  1. SLIDE 2 本日のアジェンダ RAGがAIビジネス活用の主流になった背景 1 RAG(検索拡張生成)の仕組みと基本コンセプト 2 RAGシステムの具体的な構成要素 3 RAGのメリットと、導入前に知るべきデメリット

    4 LLM長文脈化はRAGを不要にするか? 5 RAG開発で陥りがちなワナと対策 6 RAGシステムの運用コスト分析 7 RAGの具体的な活用事例 8 まとめ 9
  2. SLIDE 6 2. 【基礎】RAGの処理フロー詳細 【事前準備:データインジェスチョン】 【実行時:質問応答】 データ読み込み (Load): 社内文書(PDF, Word等)やWebサイトを読み込む。

    1 分割 (Split/Chunking): 文書をLLMが処理しやすいサイズのかたまり(チャンク) に分割する。 2 ベクトル化 (Embedding): 各チャンクを、意味が近いものを計算できる数値ベクトル に変換する。 3 格納 (Store): ベクトルデータを高速検索可能な「ベクトルデータベー ス」に格納する。 4 ユーザーからの質問をベクトル化する。 1 ベクトルDBを検索し、質問と類似度の高いチャンクを見 つける。 2 元の質問と見つかったチャンクでプロンプトを作成する。 3 プロンプトをLLMに入力し、回答を生成させる。 4
  3. SLIDE 7 3. 【技術解説】RAGシステムの具体的な構成要素 RAGシステムは、様々なクラウドサービスやOSSのフレームワークを組み合わせて構築します。 (下記は一例) カテゴリ サービス / ライブラリ例

    Embeddingモデル OpenAI text-embeddingシリーズ, Azure OpenAI Embeddings, Cohere Embed ベクトルDB Pinecone, Chroma DB, Azure AI Search, Amazon Kendra 推論 (LLM) OpenAI, Azure OpenAI Service, Gemini アプリケーションFW LangChain, LlamaIndex この他、AWSのBedRockのようにノーコードやローコードでRAGシステムを 作成するフルマネージドサービスも登場しています。
  4. SLIDE 8 4. 【考察】RAGのメリットと、導入前に知るべきデメリット RAGは万能ではありません。長所・短所を理解しておくことが重要です。 ✅ メリット ⚠️ デメリット ハルシネーションの抑制

    根拠情報に基づいて回答するため信頼性が高い。 ✓ 知識の更新が容易 DB更新で最新情報に対応可能。 ✓ 高い費用対効果 ファインチューニングより低コストで知識を付与。 ✓ 透明性と説明可能性 回答根拠となった情報源を提示できる。 ✓ 検索精度への依存 「検索が失敗すれば、RAGも失敗する」 。 ⚠️ システム構成の複雑化 データETLやベクトルDBなど管理対象が増える。 ⚠️ 高度なチューニングの難しさ チャンクサイズ、モデル選定など経験が必要。 ⚠️
  5. SLIDE 9 5. 【最新動向】LLM長文脈化はRAGを不要にするか? 近年、数百万トークンもの長大なコンテキストを扱えるLLMが登場。これはRAGにどう影響するのでしょうか? 項目 RAG ファインチューニング 長文脈LLM(ナイーブRAG) アプローチ

    外部知識を検索して参照 モデルの内部知識を調整 全関連文書を入力 得意なこと 参照情報に基づく回答 応答スタイルの適応 横断的な要約・分析 コスト 比較的低い 高い やや高い 知識の更新 容易(DB更新) 困難(再学習) 容易(入力文書の変更) 課題 検索精度、構成の複雑さ 汎用性の低下、陳腐化 コスト、 「大海の一針」問題 結論: 従来のRAGも現時点では不要になっていない。
  6. SLIDE 10 6. 【実践】RAG開発で陥りがちなワナと対策 RAGの概念はシンプルですが、実践には多くの「ワナ」が潜んでいます。 陥りがちなワナ 対策 ① とりあえず分割 情報の文脈を考慮しない単純な文字数での分割は、検索精度を低下させる。

    → 意味のある単位で分割(チャンキング)する。 ② 「PoCは動いた」のワナ 少数の文書では動いても、本番の大量・多様なデータでは性能が劣化。 → 開発初期から本番に近いデータでテストする。定量的な評価セットを準備する。 ③ データ鮮度の陳腐化 一度DBを構築して終わりにしてしまうと、やがて情報が古くなる。 → データソースの更新を自動検知する仕組みなどが有効。 ④ 結局誰も使わなかった 作ったは良いものの誰も使わず、インフラコストだけ払い続ける。 → 作る前に「本質的な課題は何か?それはAIで解決できるか?」を常に考える。
  7. SLIDE 11 7. 【コスト】RAGシステムの運用コスト分析 RAG導入前にコストの全体像を把握することが重要です。 主なコストドライバー LLM API利用料 (変動費) RAGでは検索文書の分だけプロンプトが長くなるため、コスト管理が重要。

    (ただし、デフレ傾向) 1 ベクトルDB/検索サービス利用料 (固定費+変動費) データ規模や応答性能によって変動。サービス選定が重要。 2 Embedding API利用料 (初期コスト+継続コスト) データ登録時に発生する初期コスト。データの追加・更新のたびに継続的に発生。 3 コンピューティングリソース費 データ処理パイプラインやアプリを動かすサーバー費用(Azure App Service, AWS Lambdaなど) 。 4 人的コスト (最も大きな割合を占めることも) システムを構築・運用するエンジニアの人件費。 5
  8. SLIDE 15 9. まとめ 本日の内容を振り返ります。 RAG(検索拡張生成)とは LLMに外部DBの検索機能を組み合わせ、ビジネス課題を解決する実践的な技術。 ✓ RAGの価値 ハルシネーションを抑制し、最新・独自の専門情報に基づいた信頼性の高い回答を可能にする。

    ✓ システム構成 LangChain等のFWを活用し、ベクトルDBや各種クラウドサービスを組み合わせて構築可能。 ✓ 導入の勘所 メリットだけでなく、検索精度への依存や構成の複雑化といったデメリットも理解する必要がある。 ✓ 成功の鍵 チャンキング戦略、定量的評価、データ鮮度の維持、コスト管理といった実践的課題への対策が不可欠。 ✓