Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ローカルLLM × MCP連携で実現する、原文エビデンス付きドキュメントQAシステム

ローカルLLM × MCP連携で実現する、原文エビデンス付きドキュメントQAシステム

TL;DR

ローカルなドキュメント(Markdown)群 を対象として、

必ずエビデンスを付けて ハルシネーション限りなく0 にした、

ローカルLLM を使用した高速かつ軽量な RAG を、

外部送信なしの セキュアな 環境で、

開発の知識がない方でも 簡単に 実現する方法

が分かるようになります。

Avatar for oga_aiichiro

oga_aiichiro

August 31, 2025
Tweet

More Decks by oga_aiichiro

Other Decks in Programming

Transcript

  1. 2 実現できること ローカルドキュメントを対象にした、 高速・高精度・セキュアなQA • ローカルのMarkdown群 を対象としたQA • ハルシネーションを限りなく0にした エビデンス付き回答

    • 高速・軽量な ローカルLLM (RAG) を使用 • 外部への情報送信がない セキュアな環境 • 専門知識がなくても 簡単に 導入可能
  2. 4 なぜエンベディングモデルにRuri v3を選定したか ノートPC で動く日本語ドキュメント検索用モデルで 現時点で最高の選択肢 検索精度が高い 日本語特化モデル。JMTEBベンチマークで同クラス最高の Retrieval 82.48を記録

    軽量で高速 ノートPCのCPUでも動作可能な 30m(3000万パラメータ)モデル 信頼性もライセンスも大丈夫 開発元が名古屋大学 で信頼性が高く、商用利用可能なApache 2.0ライセンス
  3. 5 よくある質問 (FAQ) Q. これは新しいサーバーの開発・設置が必要ですか? A. いいえ。既存のツールを組み合わせ、完全にローカルで完結 します。 Q. 情報が社外に漏えいしませんか?

    A. しません。通信はローカルPC内で完結し、外部へのデータ送信はありません。 Q. PC内の全ファイルを読まれますか? A. いいえ。あらかじめ 許可した特定のフォルダのみ を読み取り対象とします。
  4. 7 登場人物の役割紹介 3人の専門家が連携して、賢い検索と回答を実現している。 意味の翻訳 (Ruri) 文章を 「意味ベクトル」と 呼ばれる数値の座標に変換。 意味が近い文章ほど、 近い座標に配置される。

    高速な意味の索引 (Chroma) 翻訳された 意味ベクトルを保管して、 似た意味のベクトルを 高速で探し出す データベース。 cosineなどの距離関数を使う。 優秀な編集者 (Claude) 索引で見つかった 原文だけを材料に、 要約や説明文を 生成する専門家。 書いていないことは話さない ように徹底している。
  5. 12 Step 2: 検索(意味が近い原文の発見) ユーザーから質問が来るたびに実行される 1 質問文に「検索クエリ:」を付けて Ruri v3 でベクトル化

    2 Chroma で、質問ベクトルに意味が近い上位K件の文書ベクトルを検索 3 検索結果から、元の文書の 該当箇所(原文)を取り出す
  6. 13 Step 3: 生成(原文に基づく回答作成) ハルシネーションを防ぐための最終工程 1 取り出した 原文のみを情報源 としてClaudeに渡す 2

    Claudeが原文を元に、質問への回答(要約や説明)を生成 3 回答に 引用と出典 を必ず付けてユーザーに提示する
  7. 17 必要ツールのインストール Node.js LTS npx コマンドの実行に必要 ripgrep 高速な ローカル全文検索エンジン uv

    高速なPythonパッケージ インストーラー Python 3.11 スクリプト実行の本体 PyTorch 機械学習ライブラリ。エンベ ディングモデルの実行基盤 Ruri v3-30m Model 日本語特化の高性能エンベディ ングモデル本体 Python Packages chromadb, sentencepiece等の 関連ライブラリ Claude Desktop QAを実行するためのフロントエ ンドアプリ