Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
BedrockのナレッジベースとLlamaIndexでGraphRAGを作って精度比較してみた!
Search
Har1101
January 06, 2025
640
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
BedrockのナレッジベースとLlamaIndexでGraphRAGを作って精度比較してみた!
Har1101
January 06, 2025
More Decks by Har1101
See All by Har1101
エージェンティックRAGにAWSで入門しよう!
har1101
8
1.2k
TypeScriptだけでAIエージェントを作る フロント・エージェント・インフラのフルスタック実践
har1101
6
1.3k
AgentCore Registry入門~マルチアカウントでどう使うの~
har1101
1
80
AgentCore×VPCでの設計パターンn選と勘所
har1101
4
510
AgentCore RuntimeからS3 Filesをマウントしてみる
har1101
4
680
AgentCore Session Storageで激安RAG作るためのあれやこれや
har1101
4
380
(技術的には)社内システムもOKなブラウザエージェントを作ってみた!
har1101
2
580
今日から始めるAmazon Bedrock AgentCore
har1101
4
560
My First Year as a Community Builder
har1101
3
370
Featured
See All Featured
We Are The Robots
honzajavorek
0
240
WENDY [Excerpt]
tessaabrams
11
38k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
6k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
140
30 Presentation Tips
portentint
PRO
1
320
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
160
Mind Mapping
helmedeiros
PRO
1
240
Measuring & Analyzing Core Web Vitals
bluesmoon
9
860
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.2k
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
420
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
400
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
190
Transcript
Bedrockナレッジベースと LlamaIndexでGraphRAGを 作って精度比較してみた! 2025/01/07 JAWS-UG 朝会 #65 福地開
Who am I ? 福地 開 (ふくち はるき) @har1101mony Japan
AWS Jr.Champions目指してます! NECソリューションイノベータ株式会社 2年目 インフラエンジニア(AWS) 趣味:ブログ書くこと、バスケ、競馬 推し馬(ドウデュース)が引退してしまったので 次の推し馬探し中…
本日お話すること・しないこと ◆ 話すこと! ✓ GraphRAGとは?(簡単に) ✓Bedrockのナレッジベースで作ったGraphRAG ✓LlamaIndexで作ったGraphRAG ◆話さないこと! ✓RAGの詳細な説明 ✓LlamaIndexの詳細な説明
✓GraphRAGの具体的な構築方法 →構築方法については別途ブログに纏めてあるので、こちらをご参照ください!
re:Invent 2024は RAGがアツかった!
RAGのアップデートは8件! ◆Amazon Bedrock Knowledge BasesがGraphRAGに対応 ◆Amazon Bedrock Knowledge Basesが構造化データの取り込みをサポート ◆Amazon
Bedrock Knowledge Basesがマルチモーダルデータに対応 ◆Amazon Bedrock Knowledge Basesが応答のストリーミングをサポート ◆Amazon Bedrock Knowledge Basesの自動クエリフィルタ機能を発表 ◆Amazon Bedrock Knowledge BasesがAPIによるデータ操作に対応 ◆Amazon Bedrock Knowledge BasesでRAGの評価機能をプレビュー開始 ◆Amazon KendraのGenAI Indexを発表
RAGのアップデートは8件! ◆Amazon Bedrock Knowledge BasesがGraphRAGに対応 ◆Amazon Bedrock Knowledge Basesが構造化データの取り込みをサポート ◆Amazon
Bedrock Knowledge Basesがマルチモーダルデータに対応 ◆Amazon Bedrock Knowledge Basesが応答のストリーミングをサポート ◆Amazon Bedrock Knowledge Basesの自動クエリフィルタ機能を発表 ◆Amazon Bedrock Knowledge BasesがAPIによるデータ操作に対応 ◆Amazon Bedrock Knowledge BasesでRAGの評価機能をプレビュー開始 ◆Amazon KendraのGenAI Indexを発表 この中からGraphRAGを触ってみる!
GraphRAGとは?従来のRAGとどう違うの?(ざっくり) ◆従来のRAG:ベクトルを用いて検索する →単語・文章を数値の配列に変換して、類似度を検索 猫 馬 お茶 カレー チャーハン ペガサス (2次元に変換したイメージです。)
GraphRAGとは?従来のRAGとどう違うの?(ざっくり) ◆GraphRAG:ナレッジグラフを用いて検索する ノード(丸):実体。人やモノなどを表現する。 エッジ(線):関係性。 (イメージです。)
GraphRAGのいいところ! ◆ドキュメントなどの複雑なデータにおいても その中で記載されているモノや事象同士の様々な関係性を 明示的に保持できること! ↓ ◆従来のベクトル検索に加えて ナレッジグラフによる検索も使うことで RAGの精度を向上させられる!
Bedrockのナレッジベースで GraphRAGを構築してみる!
使用したドキュメント ◆私の愛馬「ドウデュース」に関するドキュメントを用意 写真:https://world.jra-van.jp/db/horse/H1014044/ 生い立ちやレース結果などを ドキュメントにしてS3に格納
ナレッジベースでGraphRAGを構築 ◆ベクトルデータベースにNeptune Analyticsを指定
ナレッジベースでGraphRAGを構築 ◆まだプレビュー版ということもあってか、精度はイマイチ ←0/3レースの結果が出力された ←2/5レースの結果が出力された (結果自体は4つ出力されていますが、 2つ間違えています。)
LlamaIndexで GraphRAGを構築してみる! ※LlamaIndex…生成AIアプリケーション開発におけるフレームワークの1つ
LlamaIndexでGraphRAGを構築 ◆LlamaIndexを用いてナレッジグラフを作成
LlamaIndexでGraphRAGを構築 ◆クエリを投げてみると、完璧な答えが!
LlamaIndexでGraphRAGを構築 ◆もう1つの質問でも、4/5レースが正しく回答された!
結論: 現状だとLlamaIndexを用いて GraphRAGを構築する方が精度良さそう! ナレッジベースのGraphRAGはGAに期待!
結論: 現状だとLlamaIndexを用いて GraphRAGを構築する方が精度良さそう! ナレッジベースのGraphRAGはGAに期待! というのが、ブログ作成時の結論。 ナレッジベースのGraphRAGでも 精度向上させる方法、あります!
Parsing Strategyとチャンキング戦略を設定! ◆Parsing Strategy(変換戦略)を 「Foundation models as a parser」に設定 ◆チャンキング戦略を「Hierarchical
chunking」に設定
ナレッジベースのGraphRAGでも精度が向上! ◆LlamaIndex同様、完璧な回答が出力された!
ナレッジベースのGraphRAGでも精度が向上! ◆もう1つの質問でも、4/5レースが正しく回答された!
新・結論: ナレッジベースのGraphRAGも 設定をチューニングすることで、 かなり良い精度にすることができた! Neptune Analyticsもう少しだけお安くなってほしい