ビッグデータにおける、RAGデザインパターン詳解

Slide 1

Slide 1 text

ビッグデータにおける、RAGデザインパターン詳解株式会社ulusage 大堀遼介

Slide 2

Slide 2 text

自己紹介 • 大堀遼介（36） • Webアプリエンジニア/データサイエンティスト • 理工学部情報理工学科卒 • 経歴概要 • 経歴紹介 • バックエンド中心の開発（ KADOKAWA ） • エンタープライズ向けシステム統合コンサルティング • データパイプライン基盤（TOYOTA, HONDA, ベルフェイス） • コンシューマ向けデータプロバイダー（MaaS関連企業） • 小売・メーカー向け、AIアプリケーション開発（某大手宅配） • データエンジニア、データサイエンティスト（ABEJA, GRID, DATAFLUCT ...etc） • 株式会社ulusage CEO http://PlagIn-AI.com

Slide 3

Slide 3 text

RAGの課題おさらい

Slide 4

Slide 4 text

今回の発表のスコープ ● 話すこと ○ あくまでRAG関連 ○ スケーラビリティなベクトル検索エンジン構築手法 ○ デモコード ○ 一部エージェント ■ マルチエージェントなどは次回あれば ● 話さないこと ○ プロンプトエンジニアリング ○ データパイプライン ○ LLMOpsの詳細 ■ 評価までは話します。

Slide 5

Slide 5 text

ビックデータへのRAGの課題【再掲】 RAGは学習していないデータに対してLLMに知識を付加するのに非常に有効ですが、特に、データボリュームが多くなるほど、劇的に性能低下、ハルシネーションが増加してきます。さらにLangChainやLlama-Indexであっても、導入に対するの技術的障壁、性能の壁が存在します。

Slide 6

Slide 6 text

一般的なRAGプロセス概要 ※ ベクターDBへ「埋め込み」と「検索」イメージチャンク LLM インデックス検索ベクトルDB xxxxxx xxxxxx xxxxxx xxxxxx チャンク & ベクトル埋め込みドキュメント 0.1,0.3, -0.1.. 0.4,0.2, 0.6.. 検索埋め込み

Slide 7

Slide 7 text

RAGプロセス以下のプロセスは、一般的なRAGシステムのプロセスです。ケースによりますが、このプロセスにて、「データのロード」と「クエリ」を切り離すだけでも、性能は向上します。今回のデザインパターンは以下のプロセスに従います。加工ロードインデックス作成ストア非同期クエリ評価

Slide 8

Slide 8 text

デザインパターン詳解

Slide 9

Slide 9 text

デザインパターン概要今回は多段インデックスという手法に、フォーカスします。チャンク子インデックス LLM 親インデックスベクトルDB 0.1,0.3, -0.1.. 0.4,0.2, 0.6.. 0.1,0.3, -0.1.. 0.4,0.2, 0.6.. ベクトルDB

Slide 10

Slide 10 text

どういうユースケースに強みがある？ ● RAGパイプラインの一部、ベクトル検索のインデックスのスケーリングここ！

Slide 11

Slide 11 text

デザインパターン詳解 Step 1

Slide 12

Slide 12 text

データの、粒度を決める。 • 特徴の分類を実施する。 • 時系列単位 • コーパス単位 • トピック単位 • 画像の特徴単位 STEP1: データの粒度を決めよう。特徴の分類（親インデックス）特徴のサブ分類（子インデックス）チャンクの粒度（検索対象）データセット分類 ⅰ 分類 ⅱ 分類 ⅲ サブ分類 ⅰ サブ分類 ⅱ サブ分類 ⅱ 加工ロードインデックス作成ストア非同期クエリ評価

Slide 13

Slide 13 text

データの粒度を決めよう。粒度は、データへの特性への知識が必要です。私自身まずは、通常のAI開発やデータサイエンスの重要なプロセス、EDAから入ります。今回はLiveDoor コーパスデータを使います。次のようなカテゴリ分類がなされています。加工ロードインデックス作成ストア非同期クエリ評価

Slide 14

Slide 14 text

データの粒度を決めよう。カテゴリまでを、綺麗に分類できたので、次は、サブ分類です。今回はLDAによって、タイトルをサブ分類としてそれらしく分かれていそうなので、こちらを使います。加工ロードインデックス作成ストア非同期クエリ評価データセット cate gory ⅰ cate gory ⅱ cate gory ⅲ title ⅰ title ⅱ title ⅱ

Slide 15

Slide 15 text

データを埋め込みエンコードしよう。分類によって、親子間のインデックスが決定できました。次は、埋め込みエンコード化しましょう。いわゆる「embedding」です。加工ロードインデックス作成ストア非同期クエリ評価

Slide 16

Slide 16 text

デザインパターン詳解 Step 2

Slide 17

Slide 17 text

子インデックスを登録しよう。データの埋め込みが完了したので、いよいよインデックス化です。マッピングという、どのフィールドに対してベクトル検索を行うことを可能にするかを定義します。加工ロードインデックス作成ストア非同期クエリ評価

Slide 18

Slide 18 text

子インデックスを登録しよう。マッピングが完了したので、カテゴリごとのインデックスを作成します。加工ロードインデックス作成ストア非同期クエリ評価インデックスを作成したら、インデックスへデータのロードを実施します。

Slide 19

Slide 19 text

テストクエリ（標準検索）しよう。データのロードができたので、いよいよ検索を行ってみましょう！以下は一般的な、マッチクエリです。加工ロードインデックス作成ストア非同期クエリ評価

Slide 20

Slide 20 text

テストクエリを評価しよう。検索結果を以下の指標を使い、評価しまししょう。検索評価指標は、多様にありますが、標準検索の場合には以下の指標を利用するといいでしょう。加工ロードインデックス作成ストア非同期クエリ評価指標説明結果 MRR (平均逆順位) 一連のクエリに対する結果の逆順位の平均。値が1.0の場合、完全な順位を示します。 1.0 Recall@5 上位5件の結果に含まれる関連項目の割合。値が1の場合、関連する全ての項目が上位5件に含まれることを示します。 1

Slide 21

Slide 21 text

デザインパターン詳解 Step 3

Slide 22

Slide 22 text

親インデックスを登録しよう。次は親インデックス化です。マッピングにて、子インデックスのエンドポイントはカテゴリ名でしたので、フィールドに含めます。あとは、子インデックスの概要などの特徴をなるべく詳しく記載し、埋め込みエンコードします。加工ロードインデックス作成ストア非同期クエリ評価

Slide 23

Slide 23 text

親インデックスを登録しよう。子インデックスに対する、特徴は今回幾つかのサンプルデータの要約に決定します。加工ロードインデックス作成ストア非同期クエリ評価

Slide 24

Slide 24 text

親インデックスを登録しよう。マッピングが完了したので、カテゴリごとのインデックスを作成します。加工ロードインデックス作成ストア非同期クエリ評価

Slide 25

Slide 25 text

テストクエリ（セマンティック検索）しよう。いよいよ、多段セマンティック検索です！評価は、入力と出力のコサイン類似度にて評価。加工ロードインデックス作成ストア非同期クエリ評価

Slide 26

Slide 26 text

テストクエリ（セマンティック検索）しよう。評価結果としてはまずまずですね！今後こちらは、各子インデックスの説明をより、簡潔に記載するか、Rerankなどの技術により精度を高めていくといいです。加工ロードインデックス作成ストア非同期クエリ評価

Slide 27

Slide 27 text

デザインパターン詳解 Step 4

Slide 28

Slide 28 text

検索拡張生成しよう。いよいよ、LLMに検索エンジンによって知識会得を実施し、会話をしてみましょう。検索エンジンへのコネクタはLangchainを使います。加工ロードインデックス作成ストア非同期クエリ評価

Slide 29

Slide 29 text

検索拡張生成しよう。 LangChainのAgentとToolsを定義しますAgentは、ユーザーの指示を達成するために「思考→行動→ 観察」を行うロボットのような機能です。入力テキストの内容に応じて、適切なToolを選択します。 Toolには、nameとdescriptionを指定します。これにより、AgentはどのToolを使うべきかを判断します。指定は英語で行う方が誤作動が少なく、LLMの精度が上がれば改善されるかもしれません。加工ロードインデックス作成ストア非同期クエリ評価

Slide 30

Slide 30 text

検索拡張生成しよう。 LangChainのAgentとToolsをにより、検索エンジンから知識会得をし、回答を得ることができました！加工ロードインデックス作成ストア非同期クエリ評価

Slide 31

Slide 31 text

Appendix

Slide 32

Slide 32 text

今回のソースコード ● https://github.com/engkimo/mlops_webiner_code/blob/main/MLOps_41Times_KNN_RAG_by_Uls ageInc.ipynb

Slide 33

Slide 33 text

ありがとうございました！