【生成AI解説】RAG再入門〜超基本から有りがちな失敗まで、ビジネス実装の勘所を学ぶ〜

【生成AI講座】「RAG」再入門～超基本から有りがちな失敗まで、ビジネス実装の勘所を学ぶ～担当: Yusuke Kimura X: @yk_llm_gpt 弊社（https://next-form.net）にて、AIコンサル＆開発受託受付中！無料相談お気軽にどうぞ！ ※スライド化の都合上、一部見切れている箇所があります。
全体を見たい方はhttps://youtu.be/REatCZN5RV0をご覧ください。

本日のアジェンダ RAGがAIビジネス活用の主流になった背景 1 RAG（検索拡張生成）の仕組みと基本コンセプト 2 RAGシステムの具体的な構成要素 3 RAGのメリットと、導入前に知るべきデメリット
4 LLM長文脈化はRAGを不要にするか？ 5 RAG開発で陥りがちなワナと対策 6 RAGシステムの運用コスト分析 7 RAGの具体的な活用事例 8 まとめ 9

1. RAGがAIビジネス活用の主流になった背景生成AIをビジネスで「信頼して使う」には、いくつかの「壁」が存在します。 ✅ 生成AIの得意なこと文章作成、要約、ブレストなど、ネット上の情報から学習した「一般的」な知識に基づくタスク。 🚧
ビジネス活用における「壁」一方で、そのままビジネスで使うには多くの課題がありました。

1. RAGがAIビジネス活用の主流になった背景ビジネス活用の具体的な「壁」これらの「壁」を乗り越える有力かつ手軽なアプローチが「RAG」です。ハルシネーション平気で誤った情報を生成してしまう。情報の鮮度学習データが古く、最新の動向を反映できない。
社内の独自情報に非対応企業の内部情報や専門知識、業務マニュアルは知らない。回答の根拠が不明確なぜその回答になったのか、プロセスがブラックボックスになりがち。

2. 【基礎】RAGの仕組みと基本コンセプト RAGとは、Retrieval-Augmented Generationの略です。外部のデータベースを検索した結果をLLMに与えて最終応答を生成する仕組みを指します。 RAGの基本フロー画像引用：https://www.skygroup.jp/media/article/4054/

2. 【基礎】RAGの処理フロー詳細【事前準備：データインジェスチョン】【実行時：質問応答】データ読み込み (Load): 社内文書（PDF, Word等）やWebサイトを読み込む。
1 分割 (Split/Chunking): 文書をLLMが処理しやすいサイズのかたまり（チャンク）に分割する。 2 ベクトル化 (Embedding): 各チャンクを、意味が近いものを計算できる数値ベクトルに変換する。 3 格納 (Store): ベクトルデータを高速検索可能な「ベクトルデータベース」に格納する。 4 ユーザーからの質問をベクトル化する。 1 ベクトルDBを検索し、質問と類似度の高いチャンクを見つける。 2 元の質問と見つかったチャンクでプロンプトを作成する。 3 プロンプトをLLMに入力し、回答を生成させる。 4

3. 【技術解説】RAGシステムの具体的な構成要素 RAGシステムは、様々なクラウドサービスやOSSのフレームワークを組み合わせて構築します。（下記は一例）カテゴリサービス / ライブラリ例
Embeddingモデル OpenAI text-embeddingシリーズ, Azure OpenAI Embeddings, Cohere Embed ベクトルDB Pinecone, Chroma DB, Azure AI Search, Amazon Kendra 推論 (LLM) OpenAI, Azure OpenAI Service, Gemini アプリケーションFW LangChain, LlamaIndex この他、AWSのBedRockのようにノーコードやローコードでRAGシステムを作成するフルマネージドサービスも登場しています。

4. 【考察】RAGのメリットと、導入前に知るべきデメリット RAGは万能ではありません。長所・短所を理解しておくことが重要です。 ✅ メリット ⚠️ デメリットハルシネーションの抑制
根拠情報に基づいて回答するため信頼性が高い。 ✓ 知識の更新が容易 DB更新で最新情報に対応可能。 ✓ 高い費用対効果ファインチューニングより低コストで知識を付与。 ✓ 透明性と説明可能性回答根拠となった情報源を提示できる。 ✓ 検索精度への依存「検索が失敗すれば、RAGも失敗する」。 ⚠️ システム構成の複雑化データETLやベクトルDBなど管理対象が増える。 ⚠️ 高度なチューニングの難しさチャンクサイズ、モデル選定など経験が必要。 ⚠️

5. 【最新動向】LLM長文脈化はRAGを不要にするか？近年、数百万トークンもの長大なコンテキストを扱えるLLMが登場。これはRAGにどう影響するのでしょうか？項目 RAG ファインチューニング長文脈LLM（ナイーブRAG）アプローチ
外部知識を検索して参照モデルの内部知識を調整全関連文書を入力得意なこと参照情報に基づく回答応答スタイルの適応横断的な要約・分析コスト比較的低い高いやや高い知識の更新容易（DB更新）困難（再学習）容易（入力文書の変更）課題検索精度、構成の複雑さ汎用性の低下、陳腐化コスト、「大海の一針」問題結論：従来のRAGも現時点では不要になっていない。

6. 【実践】RAG開発で陥りがちなワナと対策 RAGの概念はシンプルですが、実践には多くの「ワナ」が潜んでいます。陥りがちなワナ対策 ① とりあえず分割情報の文脈を考慮しない単純な文字数での分割は、検索精度を低下させる。
→ 意味のある単位で分割（チャンキング）する。 ② 「PoCは動いた」のワナ少数の文書では動いても、本番の大量・多様なデータでは性能が劣化。 → 開発初期から本番に近いデータでテストする。定量的な評価セットを準備する。 ③ データ鮮度の陳腐化一度DBを構築して終わりにしてしまうと、やがて情報が古くなる。 → データソースの更新を自動検知する仕組みなどが有効。 ④ 結局誰も使わなかった作ったは良いものの誰も使わず、インフラコストだけ払い続ける。 → 作る前に「本質的な課題は何か？それはAIで解決できるか？」を常に考える。

7. 【コスト】RAGシステムの運用コスト分析 RAG導入前にコストの全体像を把握することが重要です。主なコストドライバー LLM API利用料 (変動費) RAGでは検索文書の分だけプロンプトが長くなるため、コスト管理が重要。
（ただし、デフレ傾向） 1 ベクトルDB/検索サービス利用料 (固定費+変動費) データ規模や応答性能によって変動。サービス選定が重要。 2 Embedding API利用料 (初期コスト+継続コスト) データ登録時に発生する初期コスト。データの追加・更新のたびに継続的に発生。 3 コンピューティングリソース費データ処理パイプラインやアプリを動かすサーバー費用（Azure App Service, AWS Lambdaなど）。 4 人的コスト (最も大きな割合を占めることも) システムを構築・運用するエンジニアの人件費。 5

8. RAGの具体的な活用事例【社内業務の効率化】LINEヤフー：全社横断のナレッジ活用基盤参考: https://www.lycorp.co.jp/ja/news/release/008806/ 全社員を対象に、RAG技術を活用した業務効率化支援ツール「SeekAI」を導入。 ✓ 社内のナレッジデータやFAQ、業務マニュアルなどを横断的に検索し、質問に対して自然な言葉で回答を生成。
✓ 情報収集にかかる時間を削減し、社内業務の生産性向上を目指す。 ✓

8. RAGの具体的な活用事例【顧客対応の品質向上と効率化】東京メトロ：24時間対応のお客様向けAIチャットボット参考: https://www.tokyometro.jp/news/images_h/metroNews240618_g19.pdf 鉄道会社で初めて生成AI搭載のチャットボットを導入し、Webサイト上でお客様からの問い合わせに自動応答。 ✓ FAQや運行情報などを基に、忘れ物や乗車券の取り扱いといった日常的な質問に24時間365日対応。
✓ 顧客の利便性向上と業務効率化の両立を図る。 ✓

8. RAGの具体的な活用事例【専門業務の高度化支援】出光興産：専門領域での分析・調査業務をアシスト参考: https://prtimes.jp/main/html/rd/p/000000028.000116275.html 先進マテリアル部門において、競合製品の分析や技術サポートといった専門業務にRAGを活用した生成AIを導入。 ✓ インターネットや特許DBから競合製品の情報を収集・分析しレポート作成を支援。
✓ 顧客からの技術的な問い合わせに対し、過去の類似事例を迅速に検索・提示。専門業務の質とスピードを向上。 ✓

9. まとめ本日の内容を振り返ります。 RAG（検索拡張生成）とは LLMに外部DBの検索機能を組み合わせ、ビジネス課題を解決する実践的な技術。 ✓ RAGの価値ハルシネーションを抑制し、最新・独自の専門情報に基づいた信頼性の高い回答を可能にする。
✓ システム構成 LangChain等のFWを活用し、ベクトルDBや各種クラウドサービスを組み合わせて構築可能。 ✓ 導入の勘所メリットだけでなく、検索精度への依存や構成の複雑化といったデメリットも理解する必要がある。 ✓ 成功の鍵チャンキング戦略、定量的評価、データ鮮度の維持、コスト管理といった実践的課題への対策が不可欠。 ✓

お問い合わせ RAGを活用したAIソリューションのPoCから本番導入まで弊社では、「そもそもAIを何にどう活用すべきか？」から相談可能です。興味がある方は、概要欄からお気軽にご相談ください！

【生成AI解説】RAG再入門〜超基本から有りがちな失敗まで、ビジネス実装の勘所を学ぶ〜

【生成AI解説】RAG再入門〜超基本から有りがちな失敗まで、ビジネス実装の勘所を学ぶ〜

waikei

More Decks by waikei

Other Decks in Technology

Featured

Transcript

SLIDE 2 本日のアジェンダ RAGがAIビジネス活用の主流になった背景 1 RAG（検索拡張生成）の仕組みと基本コンセプト 2 RAGシステムの具体的な構成要素 3 RAGのメリットと、導入前に知るべきデメリット

SLIDE 6 2. 【基礎】RAGの処理フロー詳細【事前準備：データインジェスチョン】【実行時：質問応答】データ読み込み (Load): 社内文書（PDF, Word等）やWebサイトを読み込む。

SLIDE 7 3. 【技術解説】RAGシステムの具体的な構成要素 RAGシステムは、様々なクラウドサービスやOSSのフレームワークを組み合わせて構築します。（下記は一例）カテゴリサービス / ライブラリ例

SLIDE 8 4. 【考察】RAGのメリットと、導入前に知るべきデメリット RAGは万能ではありません。長所・短所を理解しておくことが重要です。 ✅ メリット ⚠️ デメリットハルシネーションの抑制

お問い合わせ RAGを活用したAIソリューションのPoCから本番導入まで弊社では、「そもそもAIを何にどう活用すべきか？」から相談可能です。興味がある方は、概要欄からお気軽にご相談ください！