Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GraphRAGの仕組みまるわかり
Search
とすり
June 23, 2025
Programming
1.6k
10
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
GraphRAGの仕組みまるわかり
とすり
June 23, 2025
More Decks by とすり
See All by とすり
AWS IoT GreengrassとRaspberry Piを使って、怠惰な生活検知システムを作る
tosuri13
0
31
Amazon Bedrockを活用したRAGの品質管理パイプライン構築
tosuri13
5
1.1k
Honoを使ったリモートMCPサーバでAIツールとの連携を加速させる!
tosuri13
1
270
S3 VectorsとStrands Agentsを利用したAgentic RAGシステムの構築
tosuri13
6
700
NL2SQLを活用したExcelの生成AI利用アプローチ
tosuri13
0
130
RAGの精度が全然上がらない!! AOSSを使った社内RAG開発の反省
tosuri13
3
240
AWS Chaliceで始める爆速サーバレスチャットボット開発!!
tosuri13
1
310
Amazon BedrockでサーバレスなAIお料理ボットを作成する!!
tosuri13
3
700
React + TextAliveでカッコいいLyric Applicatioinを作ろう!!
tosuri13
1
900
Other Decks in Programming
See All in Programming
生成AI時代にこそ効くGo | Why Go Works in the Age of Generative AI
mom0tomo
8
3.1k
「エンジニアインターン、どうやって取った?」準備のリアルを語るLT会 Progate BAR
akiomatic
0
120
技術記事、AIに書かせるか、自分で書くか? 〜それでも私が自分の手で書く理由〜 / #QiitaConference
jnchito
2
1.3k
OSもどきOS
arkw
0
450
Spring Security 実践 ─ GraphQL APIで実務に役立つ 認証・認可 を学ぶ
wagyu
0
150
JJUG CCC 2026 Spring: JSpecify で実現する Kotlin フレンドリーな Java API 設計
ternbusty
1
140
Webフレームワークの ベンチマークについて
yusukebe
0
130
Old Dog, New Tricks: The Java 25 Reinvention - JNation
bazlur_rahman
0
140
キャリア迷子上等 ─ "ない道"は自分で作ればいい
16bitidol
3
970
Language Server 使ってる? 〜VSCode と Zed の場合〜 / Are you using a Language Server? ~For VS Code and Zed~
handlename
0
750
セキュリティの専門家じゃなくてもできる。「セキュリティ意識」をアップデートして サプライチェーン攻撃への耐性を高めよう。
tk3fftk
5
630
Why Laravel apps break—Mastering the fundamentals to keep them maintainable
kentaroutakeda
1
340
Featured
See All Featured
Embracing the Ebb and Flow
colly
88
5.1k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
170
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
170
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
300
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
Site-Speed That Sticks
csswizardry
13
1.2k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.9k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.4k
The Cult of Friendly URLs
andyhume
79
6.9k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.2k
Building the Perfect Custom Keyboard
takai
2
780
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.3k
Transcript
GraphRAGの仕組みまるわかり JAWS-UG AI/ML #27:Generative AI / ML LT大会
とすり@tosuri13 自称雑用系エンジニア AWS基盤の運用とかをやってます
GraphRAGの仕組みを理解しよう!
GraphRAGとは? GraphRAGとは、ある知識をグラフで表現したナレッジグラフを活用して、コ ンテキストの探索 + テキスト生成までを行うRAG手法の一つです。 ユーザ LLM ナレッジグラフ JAWS-UGについて教えて! ナレッジグラフを探索してきますネ
ナレッジグラフってなんなんだ...? これがナレッジグラフだ!
ナレッジグラフを構成する要素 ナレッジグラフは、実体を表すエンティティと関係性を表すリレーションの集 合で構成されています。補足情報としてプロパティを追加することもできます。 サメ 海 生息する 丸がエンティティ(Node)、矢印がリレーション(Edge) このような「主語 → 述語
→ 目的語」となる組をトリプルという プロパティの例 Entity ID ・a94d-be14... Description ・サメは危険な生物で... Vector ・[0.15, 0.43, ...] Entity ID ・a94d-be14... Description ・サメは危険な生物で... Vector ・[0.15, 0.43, ...] サメ
ナレッジグラフの利用 ナレッジグラフは、Neo4j、Amazon NeptuneなどのGraphDBに格納して利用 します。また、CypherなどのグラフDB向けクエリ言語を用いることで、ナ レッジグラフ内の要素を探索することが可能です。 Cypher Query MATCH (n:Entity {
value: "サメ" })-[r]->(m) RETURN n, r, m Cypher Query MATCH (n:Entity { value: "サメ" })-[r]->(m) RETURN n, r, m サメ 海 生息する サメ 海 生息する GraphDB サメのEntityから始まるトリプルを探索
GraphRAGは何を解決するの? GraphRAGではナレッジグラフの探索により、従来のRAG(Native RAG)で発生す る断片的な情報しか取得できないという課題を緩和することができます。 JAWS-UG AWS サメ 勉強会 関連する 運営する
開催する アイコンを持つ Amazon 日本のAWSコミュニティで〜 サメをモチーフにしたロゴ サメをモチーフにしたロゴ 勉強会の開催を行なっている 日本のAWSコミュニティ 日本のAWSコミュニティ サメ好きの集団らしいでス 意味的類似性のみしか考慮しないため、 関連するコンテキストを取得できないことがある ナレッジグラフを探索することによって、 関連するコンテキストを取得できる!!
GraphRAGの具体的な処理を見てみよう!!
GraphRAGの難解ポイント ① どうやってドキュメントからナレッジグラフを構築するの? ② どうやってナレッジグラフから関連するコンテキストを取得するの? ① ② ドキュメント ナレッジグラフ LLMアプリケーション
この2つの処理はAIフレームワークで特に隠蔽されてしまいがちな部分... (LangChainのLLMGraphTransformerなどはお世話になった人も多いはず)
ナレッジグラフの構築について
ナレッジグラフの構築について ドキュメントが構造化されているかどうかで、ナレッジグラフの構築に使用す るトリプルの抽出方法が大きく変わります。 ・構造化ドキュメント - CSV(Excel)、JSON、Parquetなど - コードベースや章立てされたファイルなどにも対応できる ・非構造化ドキュメント -
PDF、Markdown、Word、プレーンテキストなど
ナレッジグラフの構築 (構造化) 構造化されたドキュメントの場合、ドキュメントに含まれる行と列の関係や階 層構造に着目してトリプルを手動で抽出します。 君の名は 新海誠 DIRECTED_BY 君の名は 新海誠 DIRECTED_BY
最終的に実現したい内容によって グラフの構造を決定する必要がある
ナレッジグラフの構築 (構造化の派生) グラフとして表現できるナレッジであれば何でもよく、木構造で表現できる コードベースなどをトリプルとして抽出することもできます。 root src xxx.py README yyy.py src
xxx.py yyy.py CONTAINS CONTAINS src xxx.py yyy.py CONTAINS CONTAINS プロパティにコードや要約などを入れておくとよい
ナレッジグラフの構築 (非構造化) 非構造化ドキュメントの場合、トリプルをアルゴリズムで抽出するのは困難で あるため、LLMを活用してチャンクからトリプルを抽出します。 LLMを利用して抽出 Claudeを使った抽出例
コンテキストの取得方法について
コンテキストの取得方法はたくさんある! ナレッジグラフからコンテキストを取得する方法は、AIフレームワーク・サー ビスごとに大きく異なります。今回は代表的なものを二つ紹介します。 ・クエリ生成パターン - LangChain(GraphCypherQAChain)が採用しているパターン ・グラフ探索パターン - Mastra、Knowledge Basesが採用しているパターン
コンテキストの取得 (クエリ生成パターン) LLMにCypherクエリを生成させてナレッジグラフを探索する方法です(T2C)。 対象となるナレッジグラフが比較的単純で小規模な場合に有効です。 Searchable Triplets (Company) - [OPERATES] ->
(Service) (Community) - [RELATED_TO] -> (Service) (Community) - [ORGANIZES] -> (Event) (Community) - [HAS_ICON] -> (Motif) Searchable Triplets (Company) - [OPERATES] -> (Service) (Community) - [RELATED_TO] -> (Service) (Community) - [ORGANIZES] -> (Event) (Community) - [HAS_ICON] -> (Motif) Cypher Query MATCH (:Community)-[:HAS_ICON] -> (m) RETURN m.value Cypher Query MATCH (:Community)-[:HAS_ICON] -> (m) RETURN m.value LLM 検索可能なトリプルのリスト (クエリで取得 or 事前に定義する) LLMが生成したCypherクエリを実行する このクエリを実行してくださイ
コンテキストの取得 (グラフ探索パターン) ベクトル・キーワード検索で取得したノードの近隣を探索する方法です。テキ スト生成モデルを使用しないため、レイテンシ・コストの面で優れています。 JAWS-UG AWS サメ 勉強会 関連する 運営する
開催する Amazon Cypher Query MATCH (start)--(neighbor) WHERE start.nodeId = $nodeId RETURN neighbor LIMIT 5 Cypher Query MATCH (start)--(neighbor) WHERE start.nodeId = $nodeId RETURN neighbor LIMIT 5 アイコンを持つ 一番近いノードはこれでス Mastraなど検索前にベクトルDBから グラフを構築するパターンもあります ベクトル検索で得られたノードの 近隣ノードを探索するクエリ
その他、GraphRAGに関する情報
GraphRAGの課題 ・有効なナレッジグラフを構築するのが難しい! → ドキュメントの性質に大きく依存するため、汎用的な処理では上手く取り 扱えないことが多い → 対象となるドキュメントと地道に向き合う必要がある ・Native RAGと比較してコストが高い! →
特にナレッジグラフの構築には、LLMを使用した処理が大量に挟まるため 大きなコストがかかる → 個人でGraphRAGを検証する場合は要注意
AWSが提供している高度なGraphRAG AWS公式からGraphRAG Toolkitというフレームワークが公開されています。 より高度なグラフ構築・検索を利用したい方はチェックしてみてください。
まとめ
今回は、ナレッジグラフの構築から探索まで、GraphRAGの細かい仕組みにつ いて紹介しました。 一見難しく見えるその仕組みも、実際にリポジトリを観察する、触ってみる、 自分で実装してみるなどすると一気に理解が深まるので、ぜひご自身で試して みてください! まとめ
Thank you for listening!! 定期的にAI・クラウド系の技術発信をしてるので、よかったらTwitterフォローしてください。 @tosuri13