ビッグデータにおける、RAGデザインパターン詳解

ビッグデータにおける、RAGデザインパターン詳解株式会社ulusage 大堀遼介

自己紹介 • 大堀遼介（36） • Webアプリエンジニア/データサイエンティスト • 理工学部情報理工学科卒 • 経歴概要
• 経歴紹介 • バックエンド中心の開発（ KADOKAWA ） • エンタープライズ向けシステム統合コンサルティング • データパイプライン基盤（TOYOTA, HONDA, ベルフェイス） • コンシューマ向けデータプロバイダー（MaaS関連企業） • 小売・メーカー向け、AIアプリケーション開発（某大手宅配） • データエンジニア、データサイエンティスト（ABEJA, GRID, DATAFLUCT ...etc） • 株式会社ulusage CEO http://PlagIn-AI.com

RAGの課題おさらい

今回の発表のスコープ • 話すこと ◦ あくまでRAG関連 ◦ スケーラビリティなベクトル検索エンジン構築手法 ◦ デモコード ◦
一部エージェント ▪ マルチエージェントなどは次回あれば • 話さないこと ◦ プロンプトエンジニアリング ◦ データパイプライン ◦ LLMOpsの詳細 ▪ 評価までは話します。

ビックデータへのRAGの課題【再掲】 RAGは学習していないデータに対してLLMに知識を付加するのに非常に有効ですが、特に、データボリュームが多くなるほど、劇的に性能低下、ハルシネーションが増加してきます。さらにLangChainやLlama-Indexであっても、導入に対するの技術的障壁、性能の壁が存在します。

一般的なRAGプロセス概要 ※ ベクターDBへ「埋め込み」と「検索」イメージチャンク LLM インデックス検索ベクトルDB xxxxxx xxxxxx
xxxxxx xxxxxx チャンク & ベクトル埋め込みドキュメント 0.1,0.3, -0.1.. 0.4,0.2, 0.6.. 検索埋め込み

RAGプロセス以下のプロセスは、一般的なRAGシステムのプロセスです。ケースによりますが、このプロセスにて、「データのロード」と「クエリ」を切り離すだけでも、性能は向上します。今回のデザインパターンは以下のプロセスに従います。加工ロードインデックス作成ストア
非同期クエリ評価

デザインパターン詳解

デザインパターン概要今回は多段インデックスという手法に、フォーカスします。チャンク子インデックス LLM 親インデックスベクトルDB 0.1,0.3, -0.1.. 0.4,0.2,
0.6.. 0.1,0.3, -0.1.. 0.4,0.2, 0.6.. ベクトルDB

どういうユースケースに強みがある？ • RAGパイプラインの一部、ベクトル検索のインデックスのスケーリングここ！

デザインパターン詳解 Step 1

データの、粒度を決める。 • 特徴の分類を実施する。 • 時系列単位 • コーパス単位 • トピック単位 •
画像の特徴単位 STEP1: データの粒度を決めよう。特徴の分類（親インデックス）特徴のサブ分類（子インデックス）チャンクの粒度（検索対象）データセット分類 ⅰ 分類 ⅱ 分類 ⅲ サブ分類 ⅰ サブ分類 ⅱ サブ分類 ⅱ 加工ロードインデックス作成ストア非同期クエリ評価

データの粒度を決めよう。粒度は、データへの特性への知識が必要です。私自身まずは、通常のAI開発やデータサイエンスの重要なプロセス、EDAから入ります。今回はLiveDoor コーパスデータを使います。次のようなカテゴリ分類がなされています。加工ロー
ドインデックス作成ストア非同期クエリ評価

データの粒度を決めよう。カテゴリまでを、綺麗に分類できたので、次は、サブ分類です。今回はLDAによって、タイトルをサブ分類としてそれらしく分かれていそうなので、こちらを使います。加工ロードイン
デックス作成ストア非同期クエリ評価データセット cate gory ⅰ cate gory ⅱ cate gory ⅲ title ⅰ title ⅱ title ⅱ

データを埋め込みエンコードしよう。分類によって、親子間のインデックスが決定できました。次は、埋め込みエンコード化しましょう。いわゆる「embedding」です。加工ロードイン
デックス作成ストア非同期クエリ評価

子インデックスを登録しよう。データの埋め込みが完了したので、いよいよインデックス化です。マッピングという、どのフィールドに対してベクトル検索を行うことを可能にするかを定義します。加工ロード
インデックス作成ストア非同期クエリ評価

子インデックスを登録しよう。マッピングが完了したので、カテゴリごとのインデックスを作成します。加工ロードインデックス
作成ストア非同期クエリ評価インデックスを作成したら、インデックスへデータのロードを実施します。

テストクエリ（標準検索）しよう。データのロードができたので、いよいよ検索を行ってみましょう！以下は一般的な、マッチクエリです。加工ロードインデッ
クス作成ストア非同期クエリ評価

テストクエリを評価しよう。検索結果を以下の指標を使い、評価しまししょう。検索評価指標は、多様にありますが、標準検索の場合には以下の指標を利用するといいでしょう。加工ロード
インデックス作成ストア非同期クエリ評価指標説明結果 MRR (平均逆順位) 一連のクエリに対する結果の逆順位の平均。値が1.0の場合、完全な順位を示します。 1.0 Recall@5 上位5件の結果に含まれる関連項目の割合。値が1の場合、関連する全ての項目が上位5件に含まれることを示します。 1

親インデックスを登録しよう。次は親インデックス化です。マッピングにて、子インデックスのエンドポイントはカテゴリ名でしたので、フィールドに含めます。あとは、子インデックスの概要などの特徴をなるべく詳しく記載し、埋め込みエンコードします。加
工ロードインデックス作成ストア非同期クエリ評価

親インデックスを登録しよう。子インデックスに対する、特徴は今回幾つかのサンプルデータの要約に決定します。加工ロードインデックス
作成ストア非同期クエリ評価

親インデックスを登録しよう。マッピングが完了したので、カテゴリごとのインデックスを作成します。加工ロードインデックス
作成ストア非同期クエリ評価

テストクエリ（セマンティック検索）しよう。いよいよ、多段セマンティック検索です！評価は、入力と出力のコサイン類似度にて評価。加工ロードインデッ

テストクエリ（セマンティック検索）しよう。評価結果としてはまずまずですね！今後こちらは、各子インデックスの説明をより、簡潔に記載するか、Rerankなどの技術により精度を高めていくといいです。加工ロードイン

検索拡張生成しよう。いよいよ、LLMに検索エンジンによって知識会得を実施し、会話をしてみましょう。検索エンジンへのコネクタはLangchainを使います。加工ロードイン

検索拡張生成しよう。 LangChainのAgentとToolsを定義しますAgentは、ユーザーの指示を達成するために「思考→行動→ 観察」を行うロボットのような機能です。入力テキストの内容に応じて、適切なToolを選択します。 Toolには、nameとdescriptionを指定します。これにより、Agentは
どのToolを使うべきかを判断します。指定は英語で行う方が誤作動が少なく、LLMの精度が上がれば改善されるかもしれません。加工ロードインデックス作成ストア非同期クエリ評価

検索拡張生成しよう。 LangChainのAgentとToolsをにより、検索エンジンから知識会得をし、回答を得ることができました！加工ロードインデッ

Appendix

今回のソースコード • https://github.com/engkimo/mlops_webiner_code/blob/main/MLOps_41Times_KNN_RAG_by_Uls ageInc.ipynb

ありがとうございました！

ビッグデータにおける、RAGデザインパターン詳解

ビッグデータにおける、RAGデザインパターン詳解

大堀遼介

More Decks by 大堀遼介

Other Decks in Programming

Featured

Transcript