ビックデータにおける、RAG性能向上戦略

Slide 1

Slide 1 text

ビッグデータにおけるRAG性能向上戦略株式会社ulusage 大堀遼介

Slide 2

Slide 2 text

自己紹介 • 大堀遼介 • Webアプリエンジニア • データサイエンティスト • 経歴概要 • 理工学部情報理工学科卒 • 経歴紹介 • バックエンド中心の開発（ KADOKAWA ） • エンタープライズ向けシステム統合コンサルティング • データパイプライン基盤（TOYOTA, HONDA, ベルフェイス） • コンシューマ向けデータプロバイダー（MaaS関連企業） • 小売・メーカー向け、AIアプリケーション開発（某大手宅配） • データエンジニア、データサイエンティスト（ABEJA, GRID, DATAFLUCT ...etc） • 株式会社ulusage CEO • ミッション: MLDashBoardのSaaSの提供・DX支援・直近では生成AIプロダクトをローンチしました。http://PragIn-AI.com

Slide 3

Slide 3 text

RAGおさらい RAGとは？検索拡張生成 (RAG: Retrieval Augmented Generation) は、検索ベースの技術と生成ベースのAIモデルを統合することで機能。検索ベースのモデルは、新聞記事、データベース、ブログ、Wikipediaや社内データベースといったその他ナレッジリポジトリなど、既存のオンラインソースから情報を抽出し、LLMが学習していない知識を付加して、関連した情報を生成させる技術です。

Slide 4

Slide 4 text

RAGおさらい構成としてはよく見るデザインパターンは以下のようなものが一般的。 LLM User RDB NoSQL..etc 非構造化データ構造化データベクトルDB Web API 加工

Slide 5

Slide 5 text

GTPsやAssistantsなどで、OpenAIでもRAGが簡単に実装が可能です。 OpenAIの管理画面から、データをアップロードし、チャットを開始することが素早くできます。 OpenAIでの、RAG ◻◻◻◻◻◻のデータで〜教えて？このデータに基づいて〜です独自データ LLM 自社データ

Slide 6

Slide 6 text

RAGを実現するOSSライブラリ OpenAIではなく、その他のLLMモデルや独自にRAGシステムの構築をする場合、多くは次のような、langchainやlangchain-hub、llama-index、LangRoidなどのライブラリを利用することになります。近頃はAutoGPTやDifyなどのツールが増え、 RAG構築に対するハードルは落ちてきたと思います。これらのライブラリでもユースケースを満たせないケースも多々あります。

Slide 7

Slide 7 text

ビックデータへのRAGの課題 RAGは学習していないデータに対してLLMに知識を付加するのに非常に有効ですが、特に、データボリュームが多くなるほど、劇的に性能低下、ハルシネーションが増加してきます。さらにLangChainやLlama-Indexであっても、導入に対するの技術的障壁、性能の壁が存在します。

Slide 8

Slide 8 text

前述のとおり、データの種類や、データのボリュームで、性能（レスポンス速度）と、精度（出力の信憑性）のバランスを取るのが困難です。 RAGは、性能と精度のバランスを取ることが重要性能精度

Slide 9

Slide 9 text

ビッグデータへのRAGアプローチキーワードは、「インデックス」と「チャンク」！インデックスとチャンクと聞くと、RDBや分散システムを思い浮かべる人も多いと思います。なにやら当たり前の響きですが。。特に重要なのはインデックスです。キーワード概要インデックス目的のレコードを効率よく取得するための「索引」チャンクデータを分割して制御情報を付加したひとまとまりの断片

Slide 10

Slide 10 text

ビッグデータへのRAGアプローチ ※インデックスとチャンクのイメージチャンクインデックス LLM

Slide 11

Slide 11 text

ビッグデータへのRAGアプローチつまりは、インデックスを効率的に作成することが重要！効果的な、インデックスの例 ● BM25 ● ベクトルインデックス ● ハイブリッド ● …など

Slide 12

Slide 12 text

ビッグデータへのRAGアプローチ ● BM25 ○ テキスト検索において広く使用されるスコアリング。ドキュメントの関連性を計算し、検索結果をランキング ● ベクトルインデックス ○ 類似性検索（画像検索や埋め込みベクトルの検索）に使用される手法。FAISS（Facebook AI Similarity Search）やChromaなどが人気。 ● ハイブリッド ○ BM25のような伝統的なインデックスと、ベクトルインデックスを組み合わせる手法。キーワード検索と意味（セマンティクス）的な類似検索の両方を使用可。 ● …などこれらのインデックス手法を実現するには？

Slide 13

Slide 13 text

ビッグデータへのRAGアプローチベクトル検索エンジン！ ● Elastic Search ● Apache Solr ● FAISS ● Chroma ● Pinecone ● Qdrant ● …まだまだあります。 ○ https://note.com/ippei_suzuki_us/n/nf43f9622eee9 右図のように、検索とベクトルDBが、基本的に検索エンジン内に内包されます。検索ベクトルDB xxxxxx xxxxxx xxxxxx xxxxxx チャンク & ベクトル埋め込みドキュメント 0.1,0.3, -0.1.. 0.4,0.2, 0.6..

Slide 14

Slide 14 text

ビッグデータへのRAGアプローチそれってRAGのアーキティクチャにおいては当たり前では？このアーキティクチャがポイントです！いくつか、紹介していきたいと思います。

Slide 15

Slide 15 text

ビッグデータのRAGプロセスその前に、以下のプロセスを見てください。一般的なRAGシステムのプロセスです。加工ロードインデックス作成ストアクエリ評価

Slide 16

Slide 16 text

ビッグデータのRAGプロセスこのプロセスを、データのロードとクエリを切り離せたら、性能はそれだけでも向上します。加工ロードインデックス作成ストア非同期クエリ評価

Slide 17

Slide 17 text

ビッグデータのRAGデザインパターン① チャンクインデックス LLM インデックス検索エンジンベクトルDB 多段インデックス 0.1,0.3, -0.1.. 0.4,0.2, 0.6.. 0.1,0.3, -0.1.. 0.4,0.2, 0.6..

Slide 18

Slide 18 text

ビッグデータのRAGデザインパターン① 多段インデックスのメリット・デメリットメリット ● とにかく速い ● コストも安い ● 小さなチャンクに対してのLLM理解が深めデメリット ● 全体のデータを俯瞰できない。 ● 構築の工数がかかる

Slide 19

Slide 19 text

ビッグデータのRAGデザインパターン② クエリ拡張検索ベクトルDB 拡張検索プロンプト検索検索が多段に並列実行

Slide 20

Slide 20 text

ビッグデータのRAGデザインパターン② ● 拡張検索（クエリ） ○ LLM（大規模言語モデル）を使用して、最初のクエリに基づいて複数のクエリを生成します。生成されたクエリには、最初のクエリの複数の視点が含まれている必要があります。 ○ 埋め込み空間のカバレッジ: ■ これらのクエリは、埋め込まれると、埋め込み空間のさまざまな領域にヒットします。 ■ それらのクエリは依然として最初の質問に関連しているため、より広範な関連情報を取得できます。 ○ ゼロショットプロンプト: ■ クエリ拡張を行うために、詳細なゼロショットプロンプトを使用します。 ■ ゼロショットプロンプトを用いることで、特定のトレーニングを経ずに、初めてのクエリに対しても拡張が可能となります。

Slide 21

Slide 21 text

ビッグデータのRAGデザインパターン② クエリ拡張抽象的なPydanticモデルを定義する: プロンプトをカプセル化するために使用クエリ拡張プロンプトを定義する •プロンプトをLangChainの PromptTemplateクラスでラップする

Slide 22

Slide 22 text

ビッグデータのRAGデザインパターン② 拡張のメリット・デメリットメリット • 複数の視点を取り入れることで、埋め込み空間のより広い範囲をカバーし、関連情報の取得が向上できる。カバレッジ • 拡張されたクエリにより、取得されたコンテキストの関連性が高上デメリット ● レスポンスが遅め ● 実装難易度高め（並列処理など）

Slide 23

Slide 23 text

ビッグデータのRAGデザインパターン③ ● 無関係なチャンクの取得: ○ ビックデータだと、取得されたコンテキストに無関係なチャンクが含まれることがあり、ノイズが追加される可能性があります。 ○ プロンプトが大きくなるとコストが増し、LLMは通常コンテキストの最初と最後の部分のみを見る傾向があるため、本質的な情報を見逃す可能性があります。 ○ 埋め込みモデルが特定の質問に合わせて調整されていないため、質問に100%関連しない高い類似性スコアが生成される可能性があります。

Slide 24

Slide 24 text

ビッグデータのRAGデザインパターン③ 取得後の最適化 - Rerank 2 4 3 6 5 1 ベクトルDB １２ 3 ４ 5 ６クエリ拡張プロンプト Rerank 結果結果出力

Slide 25

Slide 25 text

ビッグデータのRAGデザインパターン③ Rerank •Rerankプロンプトテンプレート Rerankする質問とチャンクを渡す •プロンプトテンプレートとGPT-4 を使用してチェインを構築する PromptTemplateを作成する •チェインを呼び出し、レスポンスを返す

Slide 26

Slide 26 text

ビッグデータのRAGデザインパターン③ Rerankにて、リトリーバに出力させる •取得されたチャンク（「ヒット」）のリストを引数に取得 •ヒットを単一の文字列に連結する •Rerankチェインを呼び出す

Slide 27

Slide 27 text

ビッグデータのRAGデザインパターン② Rerankのメリット・デメリットメリット ● ノイズの除去 ● 精度の向上 ● 情報の提供の多様化デメリット ● レスポンスが遅め ○ 計算コストの増加 ● 実装難易度高め

Slide 28

Slide 28 text

まとめ ● OpenAIのツールを利用すれば、RAGの実装が簡単。 ● データ量増加に伴う性能低下とハルシネーションの増加。 ● 性能と精度のバランスが困難。 ○ ビッグデータに対するRAGのアプローチは、性能と精度のバランスを取ることが重要。 ● 効果的なインデックス作成とデザインパターンの選択がカギ。 ● ベクトル検索エンジンの選定も慎重に HyDEという手法もあり、こちらは試したことないですが、時間あったら実践してみたいです。

Slide 29

Slide 29 text

参考文献 RAG ● https://qiita.com/yk__/items/d466698be59a16d75a49 ● https://qiita.com/xxyc/items/9f05241e5add3b005b91 ● https://qiita.com/ps010/items/cdb75f3cad5c97f85de8#%E4%BB%8A%E5%9B %9E%E3%81%A7%E3%81%8D%E3%81%AA%E3%81%8B%E3%81%A3%E3%81% 9F%E3%81%93%E3%81%A8 ● https://qiita.com/isanakamishiro2/items/ee08de16906fd90a6589

Slide 30

Slide 30 text

ありがとうございました！